Domov Zvok Kaj je iskanje podatkov z besedilom? - definicija iz tehopedije

Kaj je iskanje podatkov z besedilom? - definicija iz tehopedije

Kazalo:

Anonim

Opredelitev - Kaj pomeni rudarjenje besedilnih podatkov?

Pridobivanje besedilnih podatkov vključuje kombiniranje skozi besedilni dokument ali vir, da bi dobili dragocene strukturirane informacije. Za to so potrebna izpopolnjena analitična orodja, ki obdelujejo besedilo, da pridobijo določene ključne besede ali ključne podatkovne točke iz tako imenovanih sorazmerno surovih ali nestrukturiranih formatov.

Pridobivanje besedilnih podatkov je znano tudi kot rudarjenje besedil ali analitika besedila.

Techopedia razlaga rudarjenje besedilnih podatkov

Pri pridobivanju besedilnih podatkov inženirski sistemi uporabljajo stvari, kot so taksonomije in leksikalna analiza, da določijo, kateri deli besedilnega dokumenta so dragoceni kot izkopani podatki. Statistični modeli so običajno uporabni, sistemi pa lahko uporabijo tudi hevristiko ali algoritmično ugibanje, da bi ugotovili, kateri deli besedila so pomembni. Drugi nadzorni sistemi vključujejo označevanje in analizo ključnih besed, kjer orodja iščejo določene pravilne samostalnike ali druge oznake in ključne besede, da bi ugotovili, o čem se piše.

Druga edinstvena komponenta rudarjenja besedil se pogosto imenuje analiza občutkov. V analizi sentimenta, ki je na splošno veliko težja od statistične analize, analitična orodja poskušajo na zelo subjektivni in intuitivni ravni ugotoviti razpoloženje ali občutek za pisnim besedilom in drugimi vidiki tega, kar obravnava. Z nastankom orodij za umetno inteligenco je bil narejen velik napredek pri analizi občutkov, tako da je sodobno pridobivanje besedilnih podatkov več kot le zbiranje količinskih referenc in vključevanje koncepcijskih modelov na visoki ravni za rudarjenje besedil, da bi ugotovili nove in edinstvene načine za zbiranje dragocenih podatkov.

Kaj je iskanje podatkov z besedilom? - definicija iz tehopedije