Odalric-Ambrym Maillard

(Ehemalig)

1 - 10 von 10Seitengröße: 10

Sortieren nach: Erscheinungsjahr

Publikationen

2019
Veröffentlicht
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O.-A., Dez. 2019.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Elektronische Veröffentlichung vor Drucklegung.
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O.-A., 2019, (Elektronische Veröffentlichung vor Drucklegung.) Advances in Neural Information Processing Systems. Band 32. S. 12717 12727 S.
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
2014
Veröffentlicht
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning
Ortner, R., Maillard, O.-A. & Ryabko, D., 2014, Algorithmic Learning Theory - 25th International Conference, ALT 2014, Bled, October 8-10, 2014. S. 140-154
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
2013
Veröffentlicht
Competing with an Infinite Set of Models in Reinforcement Learning
Nguyen, P., Maillard, O.-A., Ryabko, D. & Ortner, R., 2013, JMLR Workshop and Conference Proceedings Volume 31 : Proceedings of the Sixteenth International Conference on Artificial Intelligence and Statistics. S. 463-471
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Linear regression with random projections.
Maillard, O.-A., 2013, in: Journal of machine learning research (JMLR). 13, S. 1-1
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
Veröffentlicht
Optimal regret bounds for selecting the state representation in reinforcement learning.
Maillard, O.-A., Nguyen, P., Ortner, R. & Ryabko, D., 2013, JMLR Workshop and Conference Proceedings Volume 28 : Proceedings of The 30th International Conference on Machine Learning. S. 543-551
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
2011
Veröffentlicht
Adaptive bandits: Towards the best history-dependent strategy
Maillard, O.-A., 2011, Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics. S. 570-578
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences
Maillard, O.-A., 2011, Proceedings of the 24th Annual Conference on Learning Theory. S. 497-514
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Selecting the State-Representation in Reinforcement Learning
Maillard, O.-A., 2011, Advances in Neural Information Processing Systems 24. S. 2627-2635
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Sparse recovery with Brownian sensing
Maillard, O.-A., 2011, Advances in Neural Information Processing Systems 24. S. 1782-1790
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband

Forschungsportal

Odalric-Ambrym Maillard

Publikationen

Neuester Forschungsoutput