Kazalo:
Veliki podatki, privlačno ime za ogromne količine strukturiranih, nestrukturiranih ali polstrukturiranih podatkov, je zelo težko zajeti, shranjevati, upravljati, deliti, analizirati in vizualizirati, vsaj z uporabo tradicionalnih aplikacij za baze podatkov in programske opreme. Zato velike podatkovne tehnologije lahko učinkovito in učinkovito upravljajo in obdelujejo ogromne količine podatkov. In Apache Hadoop zagotavlja okvir in z njimi povezane tehnologije za distribucijo velikih nizov podatkov v grozdih računalnikov. Če želite res razumeti velike podatke, morate nekaj razumeti o Hadoopu. Tu si bomo pogledali zgornje besede, ki jih boste slišali glede Hadoopa - in kaj pomenijo.
Webinar: Big Iron, Spoznajte velike podatke: Osvobajanje podatkov o mainframeu s Hadoop & Spark Registrirajte se tukaj |
Najprej pa poglejte, kako deluje Hadoop
Preden se podate v ekosistem Hadoop, morate jasno razumeti dve temeljni stvari. Prvo je, kako se datoteka shrani v Hadoop; drugo je, kako se obdelujejo shranjeni podatki. Vse tehnologije, povezane s Hadoopom, večinoma delujejo na teh dveh področjih in omogočajo uporabniku prijaznejšo tehnologijo. (Pridobite osnove, kako deluje Hadoop v Kako Hadoop pomaga rešiti velik problem podatkov.)
Zdaj pa o pogojih.