1. Dashboard
  2. Forum
    1. Unerledigte Themen
  3. Mitglieder
    1. Letzte Aktivitäten
    2. Benutzer online
    3. Team-Mitglieder
    4. Trophäen
    5. Mitgliedersuche
  4. Tutorial Bereich
  • Anmelden
  • Registrieren
  • Suche
Dieses Thema
  • Alles
  • Dieses Thema
  • Dieses Forum
  • Seiten
  • Forum
  • Lexikon
  • Erweiterte Suche
  1. Informatik Forum
  2. Community
  3. Smalltalk

Reinforcement Learning

  • Tom_
  • 28. Oktober 2006 um 10:42
  • Unerledigt
  • Tom_
    2
    Tom_
    Mitglied
    Punkte
    35
    Beiträge
    5
    • 28. Oktober 2006 um 10:42
    • #1

    Hi,

    hat sich schon mal jemand von euch mit Reinforcement Learning beschäftigt. Mir stellt sich nämlich gerade eine Frage zu diesem Thema :)

    Und zwar geht es um folgende Ausführung der Bellman Gleichung (3.10):
    http://www.univ.kiev.ua/~yawd/books/AI/3/node8.html

    Was soll dieses \sum_{a} \pi(s,a) bedeuten bzw. welchen Wert liefert \pi(s,a)!?


    Vielen Dank, Thomas.

  • Plantschkuh!
    24
    Plantschkuh!
    Mitglied
    Reaktionen
    163
    Punkte
    6.173
    Beiträge
    1.181
    • 28. Oktober 2006 um 10:51
    • #2

    Zweiter Absatz: "the probability pi(s,a) of taking action a when in state s".

    *plantsch*

  • Tom_
    2
    Tom_
    Mitglied
    Punkte
    35
    Beiträge
    5
    • 28. Oktober 2006 um 11:03
    • #3

    Uh -- wie konnte ich überlesen, dass das explizit drinnen steht :cool:
    Naja, war eigentlich auch relativ naheliegen --- aber so ausgelegt war und ist mir der Unterschied zur transision properbility (Pss') nicht klar....

    LG, Tom.

  • stormcrow
    6
    stormcrow
    Mitglied
    Punkte
    360
    Beiträge
    72
    • 29. Oktober 2006 um 11:39
    • #4

    also \pi(s,a) gibt an mit welcher wahrscheinlichkeit die aktion a im state s ausgefuehrt wird. P(ss') gibt an mit welcher wahrscheinlichkeit du vom state s in den state s' kommst.

    I came here to chew gum and kick ass, and I'm all out of gum...

  • Tom_
    2
    Tom_
    Mitglied
    Punkte
    35
    Beiträge
    5
    • 31. Oktober 2006 um 19:58
    • #5

    hehe - danke! :)

  • Maximilian Rupp 29. Dezember 2024 um 15:57

    Hat das Thema aus dem Forum Sonstiges (Archiv) nach Off-Topic verschoben.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!

Benutzerkonto erstellen Anmelden

Rechtliches

Impressum

Datenschutzerklärung