Kazalo:
- Opredelitev - Kaj pomeni Open-Source Big Data Analytics?
- Techopedia razlaga odprtokodno analitiko velikih podatkov
Opredelitev - Kaj pomeni Open-Source Big Data Analytics?
Open-source big data analytics se nanaša na uporabo odprtokodne programske opreme in orodij za analizo ogromnih količin podatkov, da se zberejo ustrezne in uporabne informacije, ki jih lahko organizacija uporabi za nadaljnje poslovne cilje. Največji igralec odprtokodne analitike velikih podatkov je Apachejev Hadoop - to je najpogosteje uporabljena knjižnica programske opreme za obdelavo ogromnih nizov podatkov v kopici računalnikov z uporabo porazdeljenega postopka za paralelizem.
Techopedia razlaga odprtokodno analitiko velikih podatkov
Open-source big data analytics uporablja odprtokodno programsko opremo in orodja za izvajanje analitike velikih podatkov s pomočjo celotne programske platforme ali različnih odprtokodnih orodij za različne naloge v procesu analize podatkov. Apache Hadoop je najbolj znan sistem za analitiko velikih podatkov, vendar so potrebne druge komponente, preden lahko sestavimo pravi analitični sistem.
Hadoop je odprtokodno izvajanje algoritma MapReduce, ki sta ga uvedla Google in Yahoo, zato je osnova večine analitičnih sistemov danes. Številna orodja za analitiko velikih podatkov uporabljajo odprtokodne sisteme, vključno z robustnimi sistemi baz podatkov, kot je odprtokodna MongoDB, prefinjeno in razširljivo bazo podatkov NoSQL, ki je zelo primerna za velike podatkovne aplikacije in druge.
Odprtokodne storitve analitike velikih podatkov vključujejo:
- Sistem zbiranja podatkov
- Nadzorni center za upravljanje in spremljanje grozdov
- Knjižnica strojnega učenja in rudarjenja podatkov
- Storitev usklajevanja aplikacij
- Izračunajte motor
- Izvedbeni okvir