Domov Zvok Kaj je delno opaziti postopek odločanja markov (pomdp)? - definicija iz tehopedije

Kaj je delno opaziti postopek odločanja markov (pomdp)? - definicija iz tehopedije

Kazalo:

Anonim

Opredelitev - Kaj pomeni delno opazljiv postopek odločanja Markov (POMDP)?

Delno opazen postopek Markove odločitve (POMPD) je Markov postopek odločanja, v katerem agent ne more neposredno opazovati osnovnih stanj v modelu. Proces odločitve Markov (MDP) je matematični okvir za modeliranje odločitev, ki prikazuje sistem z vrsto stanj in zagotavlja ukrepanje nosilcu odločanja, ki temelji na teh stanjih.

POMPD temelji na tem konceptu, da pokaže, kako se sistem spoprijema z izzivi omejenega opazovanja.

Tehopedija pojasnjuje delno opazen postopek odločitve Markov (POMDP)

Pri delno opazljivem postopku Markove odločitve, ker osnovne države za agent niso transparentne, je v pomoč koncept, imenovan "stanje verovanja". Stanje prepričanja ponuja način, kako se spopasti z dvoumnostjo, ki je značilna za model.

POMPD je uporaben pri učenju okrepitve, kjer sistem lahko preide model MPD ali POMPD z uporabo tistega, kar je znano, da ustvari jasnejšo sliko verjetnih izidov.

Kaj je delno opaziti postopek odločanja markov (pomdp)? - definicija iz tehopedije