V:
Kakšna je razlika med nadzorovanim, nenadzorovanim in napol nadzorovanim učenjem?
A:Ključna razlika med nadzorovanim in nenadzorovanim učenjem pri strojnem učenju je uporaba podatkov o usposabljanju.
Nadzorovano učenje uporablja primere podatkov, da pokaže, kako izgledajo »pravilni« podatki. Podatki so strukturirani tako, da prikazujejo izhode danih vhodov.
V algoritmu strojnega učenja, ki razvršča sadje, so lahko slike sadja, kot so jabolka, banane, grozdje in pomaranče, kot vložki, imena teh sadežev pa kot proizvodnja.
Primer v resničnem svetu so Bayesovi filtri za neželeno pošto v e-poštnih programih. Ti filtri so usposobljeni s primeri e-poštnih sporočil, ki veljajo za neželeno pošto. Filter neželene pošte lahko nato poišče določene besedne zveze, ki se pojavijo v e-poštnih sporočilih, in se jih premakne v mapo z neželeno pošto.
Kot bi človeku pokazali, kako naj naredi novo nalogo. Osebi, ki opravlja vnos podatkov, se lahko prikažejo primeri podatkov v obliki, ki jo želi podjetje, nato pa se pričakuje, da jim bo sledil.
Programi strojnega učenja z nadzorovanim učenjem ponavljajo večkrat s podatki o usposabljanju. Rezultati so lahko impresivni, ko se res začne. Googlov filter za neželeno pošto v Gmailu je zelo natančen, saj ga toliko uporabnikov trenira.
Nenadzorovano učenje nima podatkov o predhodnem usposabljanju. V našem primeru razvrščanja sadja lahko algoritem preprosto prikaže slike sadja in jih naloži, da jih razvrsti.
Nenadzorovano učenje ima aplikacije v tržnih raziskavah z učenjem kupčevih navad ali varnosti s spremljanjem taksnih vzorcev.
Učenje s polovičnim nadzorom poskuša zavzeti sredino z označitvijo nekaterih podatkov. Na primer, jabolko in pomaranča sta lahko v programu razvrščanja sadja označeni, vendar banana in grozdje nista.
Kdaj uporabiti katerega koli od teh algoritmov bo odvisno od vrste uporabljenih podatkov. Nekatere naloge imajo stabilne vzorce, na primer goljufije s kreditno kartico ali neželena sporočila. Nadzorno učenje je primerno za tovrstne naloge. Omrežni napadi so nepredvidljivi, zato so morda bolj primerne nenadzorovane ali napol nadzorovane metode učenja.