Domov Zvok Zakaj vreča pri strojnem učenju zmanjšuje odstopanje?

Zakaj vreča pri strojnem učenju zmanjšuje odstopanje?

Anonim

V:

Zakaj vreča pri strojnem učenju zmanjšuje odstopanje?

A:

Združevanje zagonske črpalke ali "vrečanje" v strojnem učenju zmanjšuje odstopanje z gradnjo naprednejših modelov kompleksnih podatkovnih nizov. Natančneje, pristop k pakiranju ustvarja podskupine, ki se pogosto prekrivajo za modeliranje podatkov na bolj vpleten način.

Eden zanimivih in preprostih pojmov, kako uporabiti pakiranje vrečk, je vzeti nabor naključnih vzorcev in izvleči preprosto srednjo vrednost. Nato z istim naborom vzorcev ustvarite na desetine podnabora, zgrajenih kot drevesa odločitev, da manipulirate s morebitnimi rezultati. Druga sredina naj prikazuje resnično sliko o tem, kako se ti posamezni vzorci med seboj nanašajo na vrednost. Ista ideja se lahko uporabi za katero koli lastnost katerega koli niza podatkovnih točk.

Prosti prenos: Strojno učenje in zakaj je pomembno

Ker ta pristop utrdi odkritje v bolj definirane meje, zmanjšuje odstopanje in pomaga pri prekomernem opremljanju. Pomislite na raztresenost z nekoliko porazdeljenimi podatkovnimi točkami; S pomočjo metode vrečanja inženirji "skrčijo" zapletenost in usmerijo linije odkrivanja na bolj gladke parametre.

Nekateri govorijo o vrednosti vrečanja kot "deli in osvoji" ali vrsti "podprte hevristike". Ideja je ta, da lahko z modeliranjem ansamblov, na primer z uporabo naključnih gozdov, tisti, ki uporabljajo vreče kot tehniko, pridobijo podatke, ki so nižji. Kar zadeva zmanjšanje zahtevnosti, pakiranje vrečk lahko pomaga tudi pri prekomernem opremljanju. Pomislite na model s preveč podatkovnimi točkami: recimo, povežite točke s 100 neskladnimi pikami. Nastala vrstica vizualnih podatkov bo nazobčana, dinamična in nestanovitna. Nato varianto »izločimo« tako, da sestavimo niz ocen. Pri skupinskem učenju se to pogosto misli kot združevanje več "šibkih učencev", da bi zagotovili skupni rezultat "močnega učenja". Rezultat je gladkejša, bolj kontrirana podatkovna linija in manj divja varianta v modelu.

Zlahka je videti, kako je mogoče zamisliti o embaliranju uporabiti za podjetniške IT sisteme. Poslovni voditelji si pogosto želijo "ptičje perspektive" dogajanja z izdelki, strankami itd. Prenapolnjen model lahko vrne manj prebavljive podatke in bolj "raztresene" rezultate, pri katerih pakiranje lahko "stabilizira" model in ga naredi bolj uporabnega končnim uporabnikom.

Zakaj vreča pri strojnem učenju zmanjšuje odstopanje?