Domov Zvok Kaj je alfago? - definicija iz tehopedije

Kaj je alfago? - definicija iz tehopedije

Kazalo:

Anonim

Opredelitev - Kaj pomeni AlphaGo?

AlphaGo je ozek AI, računalniški program, ki ga je razvil Google DeepMind za igranje Go, kitajske strateške igre za dva igralca, podobna šahu. AlphaGo je prvi program AI, ki je oktobra 2015 uspel profesionalno igralko človeka, 2-dannega igralca Fan Hui, premagati na polni plošči brez omejitev. Marca 2016 je nato premagal enega najvišje uvrščenih človeških igralcev na svetu, 9-dan Leeja Sedola, ki je od petih dobil štiri igre.

Tehopedija razlaga AlphaGo

Projekt AlphaGo se je začel leta 2014 kot testna plošča, da bi videli, kako dobro bi lahko algoritem nevronske mreže Google DeepMind, ki uporablja globoko učenje, tekmoval na Go. Algoritem za AlphaGo je kombinacija tehnik iskanja dreves in strojnega učenja in okrepljen z obsežnim treningom tako z ljudmi kot z drugimi računalniškimi igralci. Uporablja iskanje po drevesu v Monte Carlu in ga vodi politika in vrednostno omrežje, implementirano z uporabo tehnologij globoke nevronske mreže. Mreža pravilnikov je usposobljena in pomaga AI napovedati naslednjo potezo, ki bo najverjetneje zmagala, medtem ko je omrežje vrednosti usposobljeno za zožitev iskalnega drevesa in določitev vrednosti teh pozicij, pri čemer oceni zmagovalce na vsaki poziciji, ne pa da išče vse do konca do konca igre.

AlphaGo se je prvič hranil z zgodovinskimi potezami tekem s strani človeških igralcev, pri čemer je uporabljal bazo podatkov s približno 30 milijoni potez, zaradi česar je posnemal človeške igre. Ko je AI dosegel stopnjo strokovne usposobljenosti, je bil dodatno usposobljen, tako da je igral proti primerom samega sebe in s pomočjo okrepljenega učenja izboljšal in se naučil več.

Oktobra 2015 je distribuirana računalniška različica AlphaGo igrala in premagala Fan Hui, evropskega prvaka v dveh dneh, s čimer je prvič zaživela, da je računalniški program na Gou premagal profesionalnega igralca. Fan Hui je nato mesece po porazu pomagal kot svetovalec za ekipo DeepMind. Marca 2016 se je AlphaGo podal proti Leeu Sedolu, enemu najvišje uvrščenih igralcev na svetu, saj je dosegel najvišjo raven 9-dan. Če smo z Leejem osvojili štiri igre, je to pomenilo velik preboj v raziskavah AI, saj je to pomenilo, da algoritem globokega učenja in nevronskih omrežij, ki ga uporablja DeepMind, lahko uporabimo za kateri koli drug namen, saj v resnici ni bil programiran za igranje Go, temveč je bil poučen kako igrati Go. To odpira popolnoma nov svet za raziskave AI.

Kaj je alfago? - definicija iz tehopedije