Kazalo:
Apache Hadoop je že dolgo temelj za velike aplikacije za prenos podatkov in velja za osnovno podatkovno platformo za vse ponudbe, povezane z velikimi podatki. Vendar pa baza podatkov in računalništvo v pomnilniku pridobiva vse večjo priljubljenost zaradi hitrejšega delovanja in hitrih rezultatov. Apache Spark je nov okvir, ki uporablja zmogljivosti v pomnilniku za hitro obdelavo (skoraj 100-krat hitreje kot Hadoop). Torej se izdelek Spark vse pogosteje uporablja v svetu velikih podatkov in predvsem za hitrejšo obdelavo.
Webinar: Moč sugestije: Kako katalog podatkov omogoča analitikom Registrirajte se tukaj |
Kaj je Apache iskrica?
Apache Spark je odprtokodni okvir za obdelavo ogromnih količin podatkov (velikih podatkov) s hitrostjo in preprostostjo. Primeren je za analitične aplikacije, ki temeljijo na velikih podatkih. Iskrico lahko uporabljate v okolju Hadoop, samostojno ali v oblaku. Razvili so ga na kalifornijski univerzi in nato pozneje ponudili programski fundaciji Apache. Tako spada v odprtokodno skupnost in je lahko zelo stroškovno učinkovit, kar še naprej omogoča ljubiteljskim razvijalcem delo z lahkoto. (Če želite izvedeti več o odprtem viru Hadoopa, glejte Kaj je vpliv odprtega vira na ekosistem Apache Hadoop?)
Glavni namen Spark je, da razvijalcem ponuja aplikacijski okvir, ki deluje okrog osredotočene strukture podatkov. Spark je tudi izjemno močan in ima prirojeno sposobnost, da v kratkem času hitro obdeluje ogromne količine podatkov, s čimer nudi izjemno dobro delovanje. Zaradi tega je veliko hitrejši od tega, kar naj bi bil njegov najbližji konkurent Hadoop.