Kazalo:
Opredelitev - Kaj pomeni shema za branje?
Shema za branje se nanaša na inovativno strategijo analize podatkov v novih orodjih za obdelavo podatkov, kot je Hadoop in druge bolj vključene tehnologije baz podatkov. V shemi ob branju se podatki nanašajo na načrt ali shemo, ko se izvlečejo iz shranjenega mesta, ne pa kot gre.
Tehopedija razlaga Shemo na branju
Starejše tehnologije baz podatkov so imele strategijo izvrševanja sheme pri pisanju - z drugimi besedami, podatke je bilo treba uporabiti za načrt ali shemo, ko so vstopali v bazo podatkov. To je bilo storjeno delno, da se zagotovi skladnost podatkov, kar je ena glavnih prednosti sheme pri pisanju. S shemo o branju bodo morda osebe, ki obdelujejo podatke, morale narediti več dela, da prepoznajo vsak podatkovni kos, vendar je veliko večjo vsestranskost.
Načrt zasnovan načrt prebere shemo in dopolni glavne uporabe Hadoopa in z njim povezanih orodij. Podjetja želijo učinkovito združiti veliko podatkov in jih shraniti za posebne namene. Glede na to lahko zbiranje nečistih ali neskladnih podatkov bolj cenijo, kot pa strogi režim uveljavljanja podatkov. Z drugimi besedami, Hadoop lahko sprejme širok obseg različnih majhnih bitov podatkov, ki morda niso popolnoma organizirani. Potem, ko se te informacije uporabijo, se organizirajo. Uporaba starega sistema za vpisovanje v shemo v bazo bi pomenila, da bodo manj organizirani podatki verjetno vrženi.
Drugi način je, da je shema pri pisanju boljša za zelo čiste in dosledne nabore podatkov, vendar so ti nabori podatkov morda bolj omejeni. Shema za branje vsebuje širšo mrežo in omogoča bolj vsestransko organizacijo podatkov. Strokovnjaki tudi poudarjajo, da je lažje ustvariti dva različna pogleda istih podatkov s shemo ob branju.
Ta strategija, ki jo je mogoče prebrati, je bistven del, zakaj je Hadoop in z njim povezane tehnologije tako priljubljena v današnji podjetniški tehnologiji. Podjetja uporabljajo velike količine surovih podatkov za napajanje vseh vrst poslovnih procesov z uporabo meglene logike in drugih sistemov za razvrščanje in filtriranje, ki vključujejo korporativna skladišča podatkov in druga velika podatkovna sredstva.