Domov Baze podatkov Kaj je odkrivanje znanja v bazah podatkov (kdd)? - definicija iz tehopedije

Kaj je odkrivanje znanja v bazah podatkov (kdd)? - definicija iz tehopedije

Kazalo:

Anonim

Opredelitev - Kaj pomeni odkritje znanja v bazah podatkov (KDD)?

Odkrivanje znanja v bazah podatkov (KDD) je postopek odkrivanja uporabnega znanja iz zbirke podatkov. Ta široko uporabljena tehnika rudarjenja podatkov je postopek, ki vključuje pripravo in izbiro podatkov, čiščenje podatkov, vključuje predhodno znanje o naborih podatkov in interpretira natančne rešitve iz opazovanih rezultatov.

Glavna področja uporabe KDD vključujejo trženje, odkrivanje goljufij, telekomunikacije in proizvodnjo.

Techopedia razlaga odkritje znanja v bazah podatkov (KDD)

Tradicionalno je bilo pridobivanje podatkov in odkrivanje znanja izvedeno ročno. S časom je količina podatkov v mnogih sistemih naraščala na velikost več kot terabajt in je ni bilo več mogoče vzdrževati ročno. Poleg tega je za uspešen obstoj katerega koli podjetja bistvenega pomena odkrivanje osnovnih vzorcev podatkov. Kot rezultat tega je bilo razvitih več programskih orodij za odkrivanje skritih podatkov in predpostavke, ki so del umetne inteligence.

Proces KDD je v zadnjih 10 letih dosegel vrhunec. Zdaj je na voljo veliko različnih pristopov k odkrivanju, ki vključujejo induktivno učenje, bajesovo statistiko, semantično poizvedbo, pridobivanje znanja za strokovne sisteme in teorijo informacij. Končni cilj je pridobiti znanje na visoki ravni iz podatkov na nizki ravni.

KDD vključuje multidisciplinarne dejavnosti. To vključuje shranjevanje in dostop do podatkov, algoritme za določanje velikosti v množične naloge podatkov in interpretiranje rezultatov. Čiščenje in dostop do podatkov, ki sta vključena v shranjevanje podatkov, olajšata postopek KDD. Umetna inteligenca podpira tudi KDD z odkrivanjem empiričnih zakonov eksperimentiranja in opazovanja. Vzorci, prepoznani v podatkih, morajo veljati za nove podatke in imeti določeno stopnjo gotovosti. Ti vzorci veljajo za novo znanje. Korak v celotnem postopku KDD je:

  1. Opredelite cilj procesa KDD z vidika stranke.
  2. Razumevanje vpletenih področij aplikacij in potrebno znanje
  3. Izberite ciljni nabor podatkov ali podmnožico podatkovnih vzorcev, na katerih se izvede odkritje.
  4. Očistite in predobdelajte podatke z odločitvijo o strategijah za ravnanje z manjkajočimi polji in spremenite podatke v skladu z zahtevami.
  5. Poenostavite nabore podatkov tako, da odstranite neželene spremenljivke. Nato analizirajte uporabne funkcije, ki jih lahko uporabite za predstavljanje podatkov, odvisno od cilja ali naloge.
  6. Usmerite cilje KDD z metodami rudarjenja podatkov, da bi predlagali skrite vzorce.
  7. Izberite algoritme za iskanje podatkov, če želite odkriti skrite vzorce. Ta postopek vključuje odločitev, kateri modeli in parametri so lahko primerni za celoten postopek KDD.
  8. Poiščite zanimive vzorce v določeni obliki reprezentacije, ki vključujejo klasifikacijska pravila ali drevesa, regresijo in grozdenje.
  9. Razlaga bistvenih znanj iz miniranih vzorcev.
  10. Uporabite znanje in ga vključite v drug sistem za nadaljnje ukrepanje.
  11. Dokumentirajte in pripravite poročila za zainteresirane strani.
Kaj je odkrivanje znanja v bazah podatkov (kdd)? - definicija iz tehopedije