Kazalo:
- Opredelitev - Kaj pomeni postopek odločanja Markov (MDP)?
- Tehopedija pojasnjuje postopek odločanja Markov (MDP)
Opredelitev - Kaj pomeni postopek odločanja Markov (MDP)?
Proces odločitve Markov (MDP) je nekaj, kar strokovnjaki označujejo kot "diskreten časovno stohastični nadzorni postopek." Temelji na matematiki, ki jo je v 19. in začetku 20. stoletja začel voditi ruski akademik Andrey Markov.
Tehopedija pojasnjuje postopek odločanja Markov (MDP)
Eden od načinov za razlago postopka Markove odločitve in z njimi povezanih markovskih verig je, da gre za elemente sodobne teorije iger, ki jih je ruski znanstvenik pred stotimi leti nameril na preprostejše matematične raziskave. Opis postopka Markovega odločanja je, da preučuje scenarij, v katerem je sistem v določenem nizu stanj, in se premakne v drugo državo na podlagi odločitev odločevalca.
Markova veriga kot model prikazuje zaporedje dogodkov, pri katerih je verjetnost danega dogodka odvisna od prej doseženega stanja. Strokovnjaki lahko pri opisovanju postopka Markove odločitve govorijo o „štetnem državnem prostoru“ - nekateri povezujejo idejo o Markovem odločitvenem modelu z modelom „naključnega sprehoda“ ali drugim stohastičnim modelom, ki temelji na verjetnostih (naključni model hoje, ki se pogosto navaja na Wall Street, modelira gibanje lastniškega kapitala navzgor ali navzdol v tržni verjetnosti.
Na splošno se Markovi postopki odločanja pogosto uporabljajo za nekatere najbolj izpopolnjene tehnologije, s katerimi se danes ukvarjajo strokovnjaki, na primer na področju modelov robotike, avtomatizacije in raziskovanja.
