Domov Poslovno Kaj je nestrukturirano pridobivanje podatkov? - definicija iz tehopedije

Kaj je nestrukturirano pridobivanje podatkov? - definicija iz tehopedije

Kazalo:

Anonim

Opredelitev - Kaj pomeni nestrukturirani podatkovni rudarjenje?

Nestrukturirano pridobivanje podatkov je praksa, da pogledamo razmeroma nestrukturirane podatke in poskušamo iz njih pridobiti bolj rafinirane nabore podatkov. Pogosto je sestavljen iz pridobivanja podatkov iz virov, ki se tradicionalno ne uporabljajo za dejavnosti rudarjenja podatkov.


Tehopedia razlaga nestrukturirano podatkovno rudarjenje

Na splošno je rudarjenje podatkov praksa združevanja podatkovnih nizov in poskušanja v najprimernejšo obliko pridobiti samo najdragocenejše koščke informacij. To je običajno težje pri relativno nestrukturiranih podatkih. Strokovnjaki za IT opredeljujejo nestrukturirane podatke kot podatke, ki niso v določeni obliki, podatke, ki so "težki", ali podatke, ki so "skriti" v nepreciznih dokumentih, ki uradno niso narejeni za zagotavljanje tehničnih informacij.


Primer nestrukturiranega dokumenta je pismo ali korespondenca med dvema ali več strankami. Pri nestrukturiranem pridobivanju podatkov bi tehnologije razčlenile to pismo in iskale posebne identifikatorje in bite informacij, kot so imena povezanih strank, datumi, ko so bila pisma poslana, imena vpletenih podjetij, zneski valute ali drugačna količinska opredelitev bitov podatkov ali kod, dodeljenih določenim izdelkom, storitvam ali poslom. Te vrste podatkov se pridobivajo in nato dajo v obliko, ki jo lahko podjetja ali druge stranke uporabijo za hitro referenco ali za razvite aplikacije poslovne inteligence.

Kaj je nestrukturirano pridobivanje podatkov? - definicija iz tehopedije