Logarithmic online regret bounds for undiscounted reinforcement learning

Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)

Autoren

Titel in Übersetzung	Logarithmic online regret bounds for undiscounted reinforcement learning
Originalsprache	Englisch
Status	Veröffentlicht - 2006
Veranstaltung	Advances in Neural Information Processing Systems (NIPS) 2006 - Vancouver, Kanada Dauer: 4 Dez. 2006 → 7 Dez. 2006

Konferenz	Advances in Neural Information Processing Systems (NIPS) 2006
Land/Gebiet	Kanada
Ort	Vancouver
Zeitraum	4/12/06 → 7/12/06