Ronald Ortner
Publikationen
- 2016
- Veröffentlicht
Pareto Front Identification from Stochastic Bandit Feedback
Auer, P., Chiang, C.-K., Ortner, R. & Drugan, M., 2016, Proceedings of the Nineteenth International Conference on Artificial Intelligence and Statistics, AISTATS 2016. S. 939-947 (JMLR Workshop and Conference Proceedings).Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Improved Learning Complexity in Combinatorial Pure Exploration Bandits
Gabillon, V., Lazaric, A., Ghavamzadeh, M., Ortner, R. & Bartlett, P., 10 Mai 2016.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- 2018
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
A Sliding-Window Approach for Reinforcement Learning in MDPs with Arbitrarily Changing Rewards and Transitions.
Gajane, P., Ortner, R. & Auer, P., 2018.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning
Fruit, R., Pirotta, M., Lazaric, A. & Ortner, R., 2018, Proceedings of the 35th International Conference on Machine Learning, ICML 2018. Band PMLR 80. S. 1578-1586Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Guest Editors' Foreword
Ortner, R. & Ulrich Simon, H., 2018, in: Theoretical Computer Science. 742Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung
- 2019
- Veröffentlicht
Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information
Auer, P., Chen, Y., Gajane, P., Lee, C.-W., Luo, H., Ortner, R. & Wei, C.-Y., 2019.Publikationen: Konferenzbeitrag › Abstract/Zusammenfassung › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2019, Proceedings of the 32nd Conference on Learning Theory, COLT 2019. S. 138-158Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Elektronische Veröffentlichung vor Drucklegung.
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O.-A., 2019, (Elektronische Veröffentlichung vor Drucklegung.) Advances in Neural Information Processing Systems. Band 32. S. 12717 12727 S.Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband