1. Weiterleitung zu NetzLiving.de
  2. Forum
    1. Unerledigte Themen
  3. zum neuen Forum
  • Anmelden
  • Suche
Dieses Thema
  • Alles
  • Dieses Thema
  • Dieses Forum
  • Seiten
  • Forum
  • Erweiterte Suche
  1. Informatik Forum
  2. Community
  3. Smalltalk

Reinforcement Learning

  • Tom_
  • 28. Oktober 2006 um 10:42
  • Unerledigt
Hallo zusammen,

das Informatik-Forum geht in den Archivmodus, genaue Informationen kann man der entsprechenden Ankündigung entnehmen. Als Dankeschön für die Treue bekommt man von uns einen Gutscheincode (informatikforum30) womit man bei netzliving.de 30% auf das erste Jahr sparen kann. (Genaue Infos sind ebenfalls in der Ankündigung)

Vielen Dank für die Treue und das Verständnis!
  • Tom_
    Punkte
    35
    Beiträge
    5
    • 28. Oktober 2006 um 10:42
    • #1

    Hi,

    hat sich schon mal jemand von euch mit Reinforcement Learning beschäftigt. Mir stellt sich nämlich gerade eine Frage zu diesem Thema :)

    Und zwar geht es um folgende Ausführung der Bellman Gleichung (3.10):
    http://www.univ.kiev.ua/~yawd/books/AI/3/node8.html

    Was soll dieses \sum_{a} \pi(s,a) bedeuten bzw. welchen Wert liefert \pi(s,a)!?


    Vielen Dank, Thomas.

  • Plantschkuh!
    Punkte
    6.173
    Beiträge
    1.181
    • 28. Oktober 2006 um 10:51
    • #2

    Zweiter Absatz: "the probability pi(s,a) of taking action a when in state s".

  • Tom_
    Punkte
    35
    Beiträge
    5
    • 28. Oktober 2006 um 11:03
    • #3

    Uh -- wie konnte ich überlesen, dass das explizit drinnen steht :cool:
    Naja, war eigentlich auch relativ naheliegen --- aber so ausgelegt war und ist mir der Unterschied zur transision properbility (Pss') nicht klar....

    LG, Tom.

  • stormcrow
    Punkte
    360
    Beiträge
    72
    • 29. Oktober 2006 um 11:39
    • #4

    also \pi(s,a) gibt an mit welcher wahrscheinlichkeit die aktion a im state s ausgefuehrt wird. P(ss') gibt an mit welcher wahrscheinlichkeit du vom state s in den state s' kommst.

  • Tom_
    Punkte
    35
    Beiträge
    5
    • 31. Oktober 2006 um 19:58
    • #5

    hehe - danke! :)

  • Maximilian Rupp 29. Dezember 2024 um 15:57

    Hat das Thema aus dem Forum Sonstiges (Archiv) nach Off-Topic verschoben.

  1. Datenschutzerklärung
  2. Impressum