Kazalo:
Opredelitev - Kaj pomeni nestrukturirani podatki?
Nestrukturirani podatki predstavljajo vse podatke, ki nimajo prepoznavne strukture. Je neorganizirano in surovo in je lahko netekstno ali besedilno. Na primer, e-pošta je dobra ilustracija nestrukturiranih besedilnih podatkov. Vključuje čas, datum, podatke o prejemniku in pošiljatelju ter zadevo itd., Vendar e-poštni naslov ostane nestrukturiran. Nestrukturirani podatki se lahko tudi opredelijo kot ohlapno strukturirani podatki, pri čemer viri podatkov vključujejo strukturo, vendar vsi podatki v naboru podatkov ne sledijo isti strukturi.
V podjetjih, osredotočenih na stranke, se lahko podatki, ki jih najdemo v nestrukturirani obliki, pregledajo, da izboljšajo trženje odnosov in upravljanje odnosov s strankami (CRM). Ker gre za programe družbenih medijev, kot sta Facebook in Twitter, nestrukturiran razvoj podatkov verjetno prehiti napredek strukturiranih podatkov.
Tehopedia razlaga nestrukturirane podatke
Nestrukturirani podatki se nanašajo na podatke, ki sledijo obliki, ki je manj urejena od elementov, kot so strani preglednic, tabele baz podatkov ali drugi linearni ali urejeni nabori podatkov. Pravzaprav je izraz "nabor podatkov" koristen, ker je povezan s podatki, ki so v urejenih, dostopnih nizih, brez dodatnih vsebin in ki so povezani ali označeni v določeni strukturi.
Drugi primeri nestrukturiranih besedilnih podatkov vključujejo Wordove dokumente, predstavitve PowerPoint, takojšnja sporočila, programsko opremo za sodelovanje, dokumente, knjige, objave v družabnih medijih in medicinske kartoteke. Netekstualni nestrukturirani podatki običajno nastajajo v medijih, kot so MP3 zvočne datoteke, slike JPEG in datoteke Flash video itd.
Nestrukturirani podatki običajno ne vključujejo vnaprej določenega modela podatkov in se morda ne ujemajo z relacijskimi tabelami. Nestrukturirani podatki so ponavadi veliko besedila. Vendar lahko vključuje številke in datume ter dejstva. To vodi v nejasnosti, ki jih je težko prepoznati z uporabo običajnih programskih programov.
Shranjevanje ogromne količine nestrukturiranih podatkov, ustvarjenih v podjetju, če slabo upravlja, lahko povzroči večje stroške. Podatke v dokumentih na papirju ali v elektronski obliki je treba skenirati, da lahko iskalna aplikacija razčleni ideje, odvisno od besed, ki se uporabljajo v določenih kontekstih. To je znano kot podjetniško ali pomensko iskanje.
