1. Dashboard
  2. Forum
    1. Unerledigte Themen
  3. Mitglieder
    1. Letzte Aktivitäten
    2. Benutzer online
    3. Team-Mitglieder
    4. Trophäen
    5. Mitgliedersuche
  4. Tutorial Bereich
  • Anmelden
  • Registrieren
  • Suche
Dieses Thema
  • Alles
  • Dieses Thema
  • Dieses Forum
  • Seiten
  • Forum
  • Lexikon
  • Erweiterte Suche
  1. Informatik Forum
  2. Community
  3. Smalltalk

Reinforcement Learning

  • Tom_
  • 28. Oktober 2006 um 10:42
  • Unerledigt
  • Tom_
    2
    Tom_
    Mitglied
    Punkte
    35
    Beiträge
    5
    • 28. Oktober 2006 um 10:42
    • #1

    Hi,

    hat sich schon mal jemand von euch mit Reinforcement Learning beschäftigt. Mir stellt sich nämlich gerade eine Frage zu diesem Thema :)

    Und zwar geht es um folgende Ausführung der Bellman Gleichung (3.10):
    http://www.univ.kiev.ua/~yawd/books/AI/3/node8.html

    Was soll dieses \sum_{a} \pi(s,a) bedeuten bzw. welchen Wert liefert \pi(s,a)!?


    Vielen Dank, Thomas.

  • Plantschkuh!
    24
    Plantschkuh!
    Mitglied
    Reaktionen
    163
    Punkte
    6.173
    Beiträge
    1.181
    • 28. Oktober 2006 um 10:51
    • #2

    Zweiter Absatz: "the probability pi(s,a) of taking action a when in state s".

    *plantsch*

  • Tom_
    2
    Tom_
    Mitglied
    Punkte
    35
    Beiträge
    5
    • 28. Oktober 2006 um 11:03
    • #3

    Uh -- wie konnte ich überlesen, dass das explizit drinnen steht :cool:
    Naja, war eigentlich auch relativ naheliegen --- aber so ausgelegt war und ist mir der Unterschied zur transision properbility (Pss') nicht klar....

    LG, Tom.

  • stormcrow
    6
    stormcrow
    Mitglied
    Punkte
    360
    Beiträge
    72
    • 29. Oktober 2006 um 11:39
    • #4

    also \pi(s,a) gibt an mit welcher wahrscheinlichkeit die aktion a im state s ausgefuehrt wird. P(ss') gibt an mit welcher wahrscheinlichkeit du vom state s in den state s' kommst.

    I came here to chew gum and kick ass, and I'm all out of gum...

  • Tom_
    2
    Tom_
    Mitglied
    Punkte
    35
    Beiträge
    5
    • 31. Oktober 2006 um 19:58
    • #5

    hehe - danke! :)

  • Maximilian Rupp 29. Dezember 2024 um 15:57

    Hat das Thema aus dem Forum Sonstiges (Archiv) nach Off-Topic verschoben.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!

Benutzerkonto erstellen Anmelden

Benutzer online in diesem Thema

  • 1 Besucher

Rechtliches

Impressum

Datenschutzerklärung