V:
Kakšna je razlika med strojnim učenjem in rudarjenjem podatkov?
A:Izvajanje podatkov in strojno učenje sta dva zelo različna pojma, vendar se pogosto uporabljata v istem kontekstu, kar je sposobnost strank, da izboljšajo in razvrstijo podatke, da pridejo do vpogledov in zaključkov. Podobnosti in razlike v kombinaciji lahko govorita o teh dveh zelo različnih procesih zmede za manj tehnično gledano občinstvo.
Rudarjenje podatkov je postopek združevanja podatkov in nato pridobivanje uporabnih podatkov iz tega večjega nabora podatkov. To je vrsta odkritja znanja, ki poteka že odkar smo postali sposobni zbirati velike količine podatkov. Izvajanje podatkov lahko izvajate s precej primitivnim sistemom: program bo programiran tako, da bo iskal točno določene vzorce in trende podatkov, tehnične informacije pa bodo "izkopane" iz te surove mase podatkov v kakršni koli obliki.
Strojno učenje je nekaj novejšega in bolj izpopolnjenega. Strojno učenje uporablja nabore podatkov, vendar za razliko od rudarjenja podatkov strojno učenje uporablja izpopolnjene algoritme in nastavitve, kot so nevronske mreže, da dejansko omogočajo, da se stroj uči iz vhodnih podatkov. Strojno učenje je zato nekoliko bolj poglobljeno kot operacija pridobivanja podatkov. Na primer, v nevronski mreži umetni nevroni delujejo v plasteh, da vnašajo vhodne podatke in sprostijo izhodne podatke z veliko natančno vmesno aktivnostjo "črne škatle" (izraz "črna skrinjica" se uporablja za bolj zapletene sisteme, kadar imajo ljudje težko razumeti, kako nevronske mreže ali algoritmi dejansko opravljajo svoje delo).
Rudarjenje podatkov in strojno učenje se prav tako precej razlikujeta v svojih aplikacijah za podjetja. Ponovno lahko pridobivanje podatkov poteka v kateri koli aplikaciji ERP in v različnih procesih.
Nasprotno pa projekt strojnega učenja zahteva precejšnja sredstva. Vodje projektov morajo zbrati podatke o usposabljanju in preizkusu, iskati težave, kot je prekomerno opremljanje, se odločiti za izbiro funkcij in odvzem funkcij in še veliko več. Strojno učenje lahko zahteva zapletene oblike vstopa različnih zainteresiranih strani, medtem ko dejavnosti rudarjenja podatkov običajno zahtevajo hiter odjava.
Kljub tem razlikam tako rudarjenje podatkov kot strojno učenje veljata za področje znanosti o podatkih. Spoznavanje podatkov o znanosti podatkov pomaga deležnikom, da se naučijo več o tem, kako delujejo ti procesi in kako jih je mogoče uporabiti v kateri koli panogi.