Hi,
hat sich schon mal jemand von euch mit Reinforcement Learning beschäftigt. Mir stellt sich nämlich gerade eine Frage zu diesem Thema ![]()
Und zwar geht es um folgende Ausführung der Bellman Gleichung (3.10):
http://www.univ.kiev.ua/~yawd/books/AI/3/node8.html
Was soll dieses \sum_{a} \pi(s,a) bedeuten bzw. welchen Wert liefert \pi(s,a)!?
Vielen Dank, Thomas.