Kazalo:
- Opredelitev - Kaj pomeni delno opazljiv postopek odločanja Markov (POMDP)?
- Tehopedija pojasnjuje delno opazen postopek odločitve Markov (POMDP)
Opredelitev - Kaj pomeni delno opazljiv postopek odločanja Markov (POMDP)?
Delno opazen postopek Markove odločitve (POMPD) je Markov postopek odločanja, v katerem agent ne more neposredno opazovati osnovnih stanj v modelu. Proces odločitve Markov (MDP) je matematični okvir za modeliranje odločitev, ki prikazuje sistem z vrsto stanj in zagotavlja ukrepanje nosilcu odločanja, ki temelji na teh stanjih.
POMPD temelji na tem konceptu, da pokaže, kako se sistem spoprijema z izzivi omejenega opazovanja.
Tehopedija pojasnjuje delno opazen postopek odločitve Markov (POMDP)
Pri delno opazljivem postopku Markove odločitve, ker osnovne države za agent niso transparentne, je v pomoč koncept, imenovan "stanje verovanja". Stanje prepričanja ponuja način, kako se spopasti z dvoumnostjo, ki je značilna za model.
POMPD je uporaben pri učenju okrepitve, kjer sistem lahko preide model MPD ali POMPD z uporabo tistega, kar je znano, da ustvari jasnejšo sliko verjetnih izidov.
