Kazalo:
Opredelitev - Kaj pomeni ekstrakcija?
Ekstrakcija je postopek pridobivanja ustreznih informacij iz virov podatkov v določenem vzorcu za uporabo v okolju za shranjevanje podatkov. Ekstrakcija dodaja pomen podatkom in je prvi korak procesa preoblikovanja podatkov. Ekstrakcija iz ogromne zbirke podatkov, ki prihajajo iz različnih virov, pridobi le določene podatke, ki ustrezajo stanju ali kategoriji.
Tehopedija razlaga ekstrakcijo
V okolju za shranjevanje podatkov je treba obdelovati, preoblikovati in hraniti ogromno zbirko podatkov iz različnih struktur in nestrukturiranih virov, da se pridobijo smiselni zaključki in napovedi. Podatke, ki prihajajo iz primarnih virov, je treba uvoziti v sistem za shranjevanje podatkov sistematično, kar olajša izvajanje različnih operacij s podatki. Ta postopek se imenuje ekstrakcija. Ekstrakcija doda strukturo sicer nestrukturiranim podatkom z upoštevanjem določenih pravil. Sledi nekaj tehnik, ki se uporabljajo pri pridobivanju podatkov:
- Ujemanje vzorcev
- Tabelski pristop
- Analiza besedila
