Logarithmic online regret bounds for undiscounted reinforcement learning
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Autoren
Organisationseinheiten
Details
Titel in Übersetzung | Logarithmic online regret bounds for undiscounted reinforcement learning |
---|---|
Originalsprache | Englisch |
Status | Veröffentlicht - 2006 |
Veranstaltung | Advances in Neural Information Processing Systems (NIPS) 2006 - Vancouver, Kanada Dauer: 4 Dez. 2006 → 7 Dez. 2006 |
Konferenz
Konferenz | Advances in Neural Information Processing Systems (NIPS) 2006 |
---|---|
Land/Gebiet | Kanada |
Ort | Vancouver |
Zeitraum | 4/12/06 → 7/12/06 |