Publikationen

1 - 10 von 10Seitengröße: 10

Sortieren nach: Erscheinungsjahr

2019
Veröffentlicht
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O.-A., Dez. 2019.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Elektronische Veröffentlichung vor Drucklegung.
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O.-A., 2019, (Elektronische Veröffentlichung vor Drucklegung.) Advances in Neural Information Processing Systems. Band 32. S. 12717 12727 S.
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
2014
Veröffentlicht
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning
Ortner, R., Maillard, O.-A. & Ryabko, D., 2014, Algorithmic Learning Theory - 25th International Conference, ALT 2014, Bled, October 8-10, 2014. S. 140-154
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
2013
Veröffentlicht
Competing with an Infinite Set of Models in Reinforcement Learning
Nguyen, P., Maillard, O.-A., Ryabko, D. & Ortner, R., 2013, JMLR Workshop and Conference Proceedings Volume 31 : Proceedings of the Sixteenth International Conference on Artificial Intelligence and Statistics. S. 463-471
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Linear regression with random projections.
Maillard, O.-A., 2013, in: Journal of machine learning research (JMLR). 13, S. 1-1
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
Veröffentlicht
Optimal regret bounds for selecting the state representation in reinforcement learning.
Maillard, O.-A., Nguyen, P., Ortner, R. & Ryabko, D., 2013, JMLR Workshop and Conference Proceedings Volume 28 : Proceedings of The 30th International Conference on Machine Learning. S. 543-551
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
2011
Veröffentlicht
Adaptive bandits: Towards the best history-dependent strategy
Maillard, O.-A., 2011, Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics. S. 570-578
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences
Maillard, O.-A., 2011, Proceedings of the 24th Annual Conference on Learning Theory. S. 497-514
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Selecting the State-Representation in Reinforcement Learning
Maillard, O.-A., 2011, Advances in Neural Information Processing Systems 24. S. 2627-2635
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Sparse recovery with Brownian sensing
Maillard, O.-A., 2011, Advances in Neural Information Processing Systems 24. S. 1782-1790
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband

Forschungsportal

Publikationen

Regret Bounds for Learning State Representations in Reinforcement Learning

Regret Bounds for Learning State Representations in Reinforcement Learning

Selecting Near-Optimal Approximate State Representations in Reinforcement Learning

Competing with an Infinite Set of Models in Reinforcement Learning

Linear regression with random projections.

Optimal regret bounds for selecting the state representation in reinforcement learning.

Adaptive bandits: Towards the best history-dependent strategy

Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences

Selecting the State-Representation in Reinforcement Learning

Sparse recovery with Brownian sensing

Erweiterte Suche