Logarithmic online regret bounds for undiscounted reinforcement learning

Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

Details

Titel in ÜbersetzungLogarithmic online regret bounds for undiscounted reinforcement learning
OriginalspracheEnglisch
StatusVeröffentlicht - 2006
VeranstaltungAdvances in Neural Information Processing Systems (NIPS) 2006 - Vancouver, Kanada
Dauer: 4 Dez. 20067 Dez. 2006

Konferenz

KonferenzAdvances in Neural Information Processing Systems (NIPS) 2006
Land/GebietKanada
OrtVancouver
Zeitraum4/12/067/12/06