V:
Kako bi lahko koncept ravnotežja sporočil projekte strojnega učenja?
A:Na splošno bo ravnotežje informiralo strojno učenje s prizadevanjem za stabilizacijo strojnega učnega okolja in ustvarjanje rezultatov z združljivo kombinacijo determinističnih in verjetnostnih komponent.
Strokovnjaki opisujejo "ravnotežje" kot situacijo, ko racionalni akterji v sistemu strojnega učenja dosežejo soglasje o strateškem ukrepanju - zlasti Nash-ovo ravnotežje v teoriji iger vključuje dva ali več teh racionalnih akterjev, ki utrjujejo strategije, saj priznavajo, da noben igralec nima koristi od sprememba določene strategije, če ostali igralci ne spremenijo svoje.
Prosti prenos: Strojno učenje in zakaj je pomembno |
Še posebej priljubljen in preprost prikaz Nash-ovega ravnotežja vključuje preprosto matrico, pri kateri dva igralca izberejo binarni rezultat.
Zgornje je precej tehničen način opisovanja ravnotežja in njegovega delovanja. Precej bolj neformalen način za ponazoritev koncepta ravnotežja, zlasti zgornji primer dveh racionalnih akterjev, pri katerih ima vsak binarno izbiro, je razmišljanje o tem, čemur bi lahko rekli scenarij "hoditi drug proti drugemu na hodniku srednje šole".
Predpostavimo, da dve osebi hodita v različne smeri po hodniku srednje šole (ali kateri koli drugi tip območja), ki ima prostora za dve osebi po širini. Dve odprti poti sta binarni izid. Če oba racionalna akterja izbereta različne binarne izide, ki si med seboj ne nasprotujeta, bosta šla drug mimo drugega in pozdravila. Če izberejo dva nasprotujoča si binarna rezultata - hodita v istem prostoru in eden od njiju bo moral prinesti prednost.
V zgornjem primeru, če oba racionalna akterja izbereta dva združljiva in neskladna rezultata, je splošno soglasje, da noben ne pridobi s spremembo svoje strategije - v tem primeru svojih smernih sprehodov - če druga oseba ne spremeni svoje.
Zgoraj navedeno predstavlja ravnotežje, ki ga je mogoče modelirati v katerem koli konstruktu strojnega učenja. Glede na ta preprost primer, bosta vedno sodelovala oba racionalna akterja ali z drugimi besedami dve osebi, ki hodita drug mimo drugega.
Nasprotno bi lahko rekli "neravnovesje" - če oba racionalna akterja izbereta nasprotujoče si rezultate, kot je omenjeno, bo moral eden od njiju prinesti. Vendar bi ML program, ki to modelira, lahko vrgel v neskončno zanko, če se bosta oba odločila popustiti - podobno kot dve osebi, ki se bosta premaknili, da bi se poskušali prilagoditi drug drugemu in še naprej hoditi proti trku.
Ravnotežja, kot je zgornja, se bodo na splošno uporabila pri strojnem učenju za ustvarjanje konsenza in stabilizacijo modelov. Inženirji in razvijalci bodo iskali tiste scenarije in situacije, ki jih koristi ravnotežje, in si prizadevali spremeniti ali rešiti tiste, ki tega ne storijo. Če pogledamo primere iz resničnega sveta, ki ustrezajo ML ravnotežjem, je enostavno opaziti, kako je tovrstna analiza v sistemu strojnega učenja edinstveno poučna, kako ugotoviti, kako modelirati človeško vedenje z ustvarjanjem racionalnih akterjev in agentov. To je samo en odličen primer, kako je mogoče uporabiti ravnotežje za napredek pri uporabi sistemov strojnega učenja.