Domov Trendi Kakšen je preprost način za opisovanje pristranskosti in razlike v strojnem učenju?

Kakšen je preprost način za opisovanje pristranskosti in razlike v strojnem učenju?

Anonim

V:

Kakšen je preprost način za opisovanje pristranskosti in razlike v strojnem učenju?

A:

Obstajajo številni zapleteni načini za opisovanje pristranskosti in odstopanj v strojnem učenju. Mnogi od njih uporabljajo bistveno zapletene matematične enačbe in s pomočjo grafičnega prikazovanja prikazujejo, kako konkretni primeri predstavljajo različne količine pristranskosti in variance.

Tu je preprost način za opis pristranskosti, variacije in kompromisa / odstopanja v strojnem učenju.

V bistvu je pristranskost prevelika poenostavitev. V definicijo pristranskosti je lahko pomembno dodati neko predpostavko ali domnevno napako.

Če zelo pristranski rezultat ne bi bil v zmoti - če bi šlo za denar - bi bil zelo natančen. Težava je v tem, da poenostavljeni model vsebuje nekaj napak, zato ga ni na vidiku - pomembna napaka se ponavlja, ali se celo izboljšuje, ko deluje program strojnega učenja.

Preprosta opredelitev variance je, da so rezultati preveč razpršeni. To pogosto vodi do preveč zapletenosti programa in težav med testnimi in vadbenimi programi.

Velika odstopanje pomeni, da majhne spremembe povzročijo velike spremembe v rezultatih ali rezultatih.

Drug način preprostega opisovanja variance je, da je v modelu preveč hrupa in da je strojni program učenja težje izolirati in prepoznati pravi signal.

Zato je eden najpreprostejših načinov za primerjavo pristranskosti in odstopanj predlagamo, da morajo inženirji strojnega učenja prehoditi natančno črto med preveliko pristranskostjo ali preveč poenostavitvijo ter preveliko variance ali prekompleksnostjo.

Drug način za predstavitev tega vodnjaka je s štirioglatnico, ki prikazuje vse kombinacije visoke in nizke variance. V kvadrantu nizke pristranskosti / nizke variance so vsi rezultati zbrani v natančni skupini. Pri rezultatu z visoko pristranskostjo / nizko odstopanjem so vsi rezultati zbrani v netočni skupini. Pri rezultatu z majhno pristranskostjo / veliko variance so rezultati razpršeni okoli osrednje točke, ki bi predstavljala natančen grozd, medtem ko so pri rezultatu z visoko pristranskostjo / visoko variance podatkovne točke razpršene in skupaj netočne.

Kakšen je preprost način za opisovanje pristranskosti in razlike v strojnem učenju?