Odalric-Ambrym Maillard
(Ehemalig)
Publikationen
- 2019
- Veröffentlicht
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O-A., Dez. 2019.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Elektronische Veröffentlichung vor Drucklegung.
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O-A., 2019, (Elektronische Veröffentlichung vor Drucklegung.) Advances in Neural Information Processing Systems. Band 32. S. 12717 12727 S.Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2014
- Veröffentlicht
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning
Ortner, R., Maillard, O-A. & Ryabko, D., 2014, Algorithmic Learning Theory - 25th International Conference, ALT 2014, Bled, October 8-10, 2014. S. 140-154Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2013
- Veröffentlicht
Competing with an Infinite Set of Models in Reinforcement Learning
Nguyen, P., Maillard, O-A., Ryabko, D. & Ortner, R., 2013, JMLR Workshop and Conference Proceedings Volume 31 : Proceedings of the Sixteenth International Conference on Artificial Intelligence and Statistics. S. 463-471Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Linear regression with random projections.
Maillard, O-A., 2013, in: Journal of machine learning research (JMLR). 13, S. 1-1Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Optimal regret bounds for selecting the state representation in reinforcement learning.
Maillard, O-A., Nguyen, P., Ortner, R. & Ryabko, D., 2013, JMLR Workshop and Conference Proceedings Volume 28 : Proceedings of The 30th International Conference on Machine Learning. S. 543-551Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2011
- Veröffentlicht
Adaptive bandits: Towards the best history-dependent strategy
Maillard, O-A., 2011, Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics. S. 570-578Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences
Maillard, O-A., 2011, Proceedings of the 24th Annual Conference on Learning Theory. S. 497-514Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Selecting the State-Representation in Reinforcement Learning
Maillard, O-A., 2011, Advances in Neural Information Processing Systems 24. S. 2627-2635Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Sparse recovery with Brownian sensing
Maillard, O-A., 2011, Advances in Neural Information Processing Systems 24. S. 1782-1790Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband