Kazalo:
Opredelitev - Kaj pomeni Apache Avro?
Apache Avro je okvir za serijsko obdelavo podatkov in klic oddaljenih postopkov, ki je bil razvit v okviru projekta Apache Hadoop, kjer omogoča tako oblikovanje serializacije za pridobivanje obstojnih podatkov in žični format za komunikacijo med vozlišči Hadoop, kot tudi povezavo odjemalskih programov s Hadoopom storitve.
Avro uporablja format JSON za določanje protokolov in podatkovnih vrst, pa tudi podatke o serializira v kompaktno binarno obliko.
Tehopedija razlaga Apača Avro
Apache Avro je velik sistem za serijsko obdelavo podatkov, ki proizvaja podatke v kompaktni binarni obliki, ki ne zahteva generiranja kode ali proxy objektov.
Uporablja se kot komponenta za serijsko obdelavo podatkov za Apache Hadoop. Avro deluje na konceptu shem. Ko beremo podatke Avro, je shema, ki je bila uporabljena med pisanjem teh specifičnih podatkov, vedno prisotna.
To omogoča vsak nabor podatkov brez režijskih stroškov, zaradi česar je serializacija hitra in sorazmerno majhna. Ker so podatki in njihova shema popolnoma samoopisani, to omogoča enostavno uporabo z dinamičnimi skriptnimi jeziki.
Ko so podatki Avro shranjeni v določeni datoteki, je shema shranjena tudi z njimi, da bi jih pozneje obdelal drug program. Če torej program, ki bere podatke, pričakuje drugo shemo, potem je to enostavno mogoče odpraviti, ker sta obe shemi prisotni.
Avro zagotavlja:
Kompakten in hiter format binarnih podatkov
Bogate podatkovne strukture
Datoteka zabojnika za shranjevanje obstojnih podatkov
Klic na daljavo (RPC)
Integracija z dinamičnimi jeziki
Ustvarjanje kode ni zahteva za branje ali pisanje podatkovnih datotek ali uporabo ali izvajanje protokolov RPC.




