Kazalo:
Opredelitev - Kaj pomeni podatkovno rudarjenje?
Izvajanje podatkov je postopek analize skritih vzorcev podatkov glede na različne perspektive za kategorizacijo v koristne informacije, ki se zbirajo in sestavljajo na skupnih območjih, kot so skladišča podatkov, za učinkovito analizo, algoritmi rudarjenja podatkov, olajšanje sprejemanja poslovnih odločitev in druge informacije zahteve za končno zmanjšanje stroškov in povečanje prihodkov.
Rudarjenje podatkov je znano tudi kot odkrivanje podatkov in odkrivanje znanja.
Tehopedia razlaga Data Mining
Glavni koraki v postopku pridobivanja podatkov so:
- Izvleči, preoblikovati in naložiti podatke v podatkovno skladišče
- Shranjevanje in upravljanje podatkov v večdimenzionalnih bazah podatkov
- Poslovnim analitikom omogočite dostop do podatkov s pomočjo aplikacijske programske opreme
- Analizirane podatke predstavite v lahko razumljivih oblikah, kot so grafi
Prvi korak pri pridobivanju podatkov je zbiranje ustreznih podatkov, ki so kritični za poslovanje. Podatki o podjetju so transakcijski, neoperativni ali metapodatki. Transakcijski podatki obravnavajo vsakodnevne operacije, kot so prodaja, zaloge in stroški itd. Neoperativni podatki se običajno napovedujejo, metapodatki pa zadevajo načrtovanje logične baze podatkov. Vzorci in razmerja med podatkovnimi elementi dajejo ustrezne informacije, kar lahko poveča organizacijski prihodek. Organizacije z močnim fokusom na potrošnike se ukvarjajo s tehnikami rudarjenja podatkov, ki zagotavljajo jasne slike prodanih izdelkov, cene, konkurenco in demografijo kupcev.
Na primer, maloprodajni velikan Wal-Mart posreduje vse svoje ustrezne podatke v podatkovno skladišče s terabajti podatkov. Do teh podatkov lahko dobavitelji zlahka dostopajo do teh podatkov, kar jim omogoča prepoznavanje vzorcev nakupa kupcev. Ustvarijo lahko vzorce nakupovalnih navad, večino kupljenih dni, najbolj iskane izdelke in druge podatke z uporabo tehnik rudarjenja podatkov.
Drugi korak pri pridobivanju podatkov je izbira ustreznega algoritma - mehanizma, ki ustvarja model rudarjenja podatkov. Splošno delovanje algoritma vključuje prepoznavanje trendov v naboru podatkov in uporabo izhoda za definiranje parametrov. Najbolj priljubljeni algoritmi, ki se uporabljajo za rudarjenje podatkov, so klasifikacijski algoritmi in regresijski algoritmi, ki se uporabljajo za ugotavljanje razmerij med podatkovnimi elementi. Večji ponudniki baz podatkov, kot sta Oracle in SQL, vključujejo algoritme za rudarjenje podatkov, kot sta združevanje in regresijski tress, da zadovoljijo povpraševanje po pridobivanju podatkov.