V:
Kako max združevanje pomaga, da AlexNet postane odlična tehnologija za obdelavo slik?
A:V AlexNetu, inovativni konvolucijski nevronski mreži, je koncept max združevanja vstavljen v zapleten model z več konvolucijskimi plastmi, delno zato, da bi pomagal pri opremljanju in racionaliziral delo, ki ga nevronska mreža opravlja pri delu s podobami s tem, kar strokovnjaki imenujejo „nelinearna strategija zmanjševanja vzorcev“.
AlexNet velja za precej odličnega CNN-a, saj je leta 2012 osvojil ILSVRC (ImageNet Large-Scale Visual Recognition Challenge), ki je viden kot prelomni dogodek za strojno učenje in napredek nevronske mreže (nekateri mu pravijo "olimpijada" računalniškega vida ).
V okviru mreže, kjer je usposabljanje razdeljeno na dva GPU-ja, je pet konvolucijskih slojev, tri popolnoma povezane plasti in nekaj max združevanja.
V bistvu maksimalno združevanje vzame "zbirko" izhodov iz zbirke nevronov in jih uporabi za vrednosti naslednjega sloja. Drug način za razumevanje tega je, da lahko pristop z največjim združevanjem konsolidira in poenostavi vrednosti zaradi ustreznejše namestitve modela.
Največje združevanje lahko pomaga izračunati gradiente. Lahko bi rekli, da "zmanjšuje računalniško obremenitev" ali "krči prekomerno opremljanje" - z zmanjšanjem vzorčenja, maks. Združevanje vključi, kar se imenuje "zmanjšanje dimenzije".
Zmanjšanje dimenzij obravnava vprašanje prekompliciranega modela, ki ga je težko voditi po nevronski mreži. Predstavljajte si zapleteno obliko z veliko majhnimi nazobčanimi obrisi in vsako malenkost te črte, ki jo predstavlja podatkovna točka. Z zmanjšanjem dimenzij inženirji pomagajo programu strojnega učenja pri "zmanjšanju" ali vzorčenju manj podatkovnih točk, da bi bil model v celoti enostavnejši. Zato če pogledate največji sloj združevanja in njegov izhod, lahko včasih vidite enostavnejšo pikselacijo, ki ustreza strategiji zmanjšanja dimenzijske dimenzije.
AlexNet uporablja tudi funkcijo, imenovano popravljene linearne enote (ReLU), in največje združevanje lahko dopolnjuje to tehniko pri obdelavi slik prek CNN.
Strokovnjaki in sodelujoči v projektu so predstavili obilico vizualnih modelov, enačb in drugih podrobnosti, ki prikazujejo specifično zgradbo AlexNet-a, toda na splošno lahko o največjem združevanju razmišljate kot o združevanju ali konsolidaciji izida več umetnih nevronov. Ta strategija je del celotne izdelave CNN, ki je postala sinonim za vrhunski strojni vid in klasifikacijo slik.