Domov Zvok Zakaj je ozko grlo informacij pomembna teorija globokega učenja?

Zakaj je ozko grlo informacij pomembna teorija globokega učenja?

Anonim

V:

Zakaj je "ozko grlo informacij" pomembna teorija globokega učenja?

A:

Ideja o "ozkem ozemlju informacij" v umetnih nevronskih omrežjih (ANN) deluje na posebnem principu, povezanem z razpršitvijo različnih vrst signalizacije. Videti je kot praktično orodje za preučevanje kompromisov, zaradi katerih se ti sistemi umetne inteligence samooptimizirajo. Članek o žičnikih, ki opisuje koncept ozkega grla informacij, ki ga je predstavil Tishby et. al. govori o "reševanju hrupnih vhodnih podatkov tujih podrobnosti, kot da bi stisnili informacije skozi ozko grlo" in "ohranili le funkcije, ki so najbolj pomembne za splošne koncepte."

Ideja o ozkem grlu informacij kot razmeroma nov koncept lahko pomaga izboljšati in spremeniti način uporabe ANN-jev in povezanih sistemov za modeliranje kognitivnih funkcij. Eden od načinov, kako lahko ta teorija pomaga, je tako, da nam pomaga bolje razumeti paradigme, ki podpirajo funkcije nevronske mreže. Na primer, če načelo ponazarja, kako sistem zadržuje le določen nabor funkcij, začnemo gledati, kako ta „podatkovna diskriminacija“ omrežje naredi človeške možgane in inženirji lahko to dodajo v modele nevronskih mrež. Ideja je ta, da bo sčasoma tehnologija nevronskih omrežij postala bolj "univerzalni" koncept, ne le provinca nekaj privilegiranih. Trenutno se podjetja lovijo za pomanjkljiv talent AI; teorije, kot je teorija ozkega grla informacij, lahko pomagajo pri širjenju znanja o nevronskih omrežjih na uporabnike in na "srednje uporabnike" - tiste, ki morda niso "strokovnjaki", vendar lahko pomagajo pri nastanku in razširjanju tehnologij nevronskih mrež.

Druga pomembna vrednost ozkega grla informacij je, da lahko inženirji začnejo usposabljati sisteme za bolj natančen način. Obstoj nekaterih vrhunskih smernic za sistemsko arhitekturo lahko poenostavi razvoj teh vrst tehnologij, zato je bolj definirana ideja o načelih poglobljenega učenja dragocena v svetu IT.

Na splošno bo prednja skupina, ki deluje na AI, še naprej natančno gledala na delovanje nevronskih omrežij, vključno s predstavo o "ustreznih informacijah" in na način, kako sistemi diskriminirajo delovanje. En primer je obdelava slike ali govora, kjer se morajo sistemi naučiti prepoznati številne različice kot "predmete". Na splošno ozko grlo z informacijami kaže poseben pogled na to, kako bi nevronska mreža delovala s temi predmeti, in posebej, kako ti modeli podatkov obdelati informacije.

Zakaj je ozko grlo informacij pomembna teorija globokega učenja?