Ronald Ortner
Publikationen
- 2019
- Veröffentlicht
Variational Regret Bounds for Reinforcement Learning
Ortner, R., Gajane, P. & Auer, P., 2019.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Variational Regret Bounds for Reinforcement Learning
Ortner, R., Gajane, P. & Auer, P., 2019, Proceedings of The 35th Uncertainty in Artificial Intelligence Conference, UAI 2019. S. 81-90Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2018
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
A Sliding-Window Approach for Reinforcement Learning in MDPs with Arbitrarily Changing Rewards and Transitions.
Gajane, P., Ortner, R. & Auer, P., 2018.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning
Fruit, R., Pirotta, M., Lazaric, A. & Ortner, R., 2018, Proceedings of the 35th International Conference on Machine Learning, ICML 2018. Band PMLR 80. S. 1578-1586Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Guest Editors' Foreword
Ortner, R. & Ulrich Simon, H., 2018, in: Theoretical Computer Science. 742Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung
- 2016
- Veröffentlicht
Improved Learning Complexity in Combinatorial Pure Exploration Bandits
Gabillon, V., Lazaric, A., Ghavamzadeh, M., Ortner, R. & Bartlett, P., 10 Mai 2016.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Algorithmic Learning Theory: 27th International Conference, ALT 2016, Proceedings
Ortner, R. (Mit-Herausgeber), Ulrich Simon, H. (Mit-Herausgeber) & Zilles, S., 2016, Springer.Publikationen: Buch/Bericht › Sammelband › Forschung
- Veröffentlicht
Improved Learning Complexity in Combinatorial Pure Exploration Bandits
Gabillon, V., Lazaric, A., Ghavamzadeh, M., Ortner, R. & Bartlett, P., 2016, Proceedings of the Nineteenth International Conference on Artificial Intelligence and Statistics, AISTATS 2016. S. 1004-1012 (JMLR Workshop and Conference Proceedings).Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Optimal Behavior is Easier to Learn than the Truth
Ortner, R., 2016, in: Minds and Machines. 26, 3, S. 243-252Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Pareto Front Identification from Stochastic Bandit Feedback
Auer, P., Chiang, C.-K., Ortner, R. & Drugan, M., 2016, Proceedings of the Nineteenth International Conference on Artificial Intelligence and Statistics, AISTATS 2016. S. 939-947 (JMLR Workshop and Conference Proceedings).Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2015
- Veröffentlicht
Improved Regret Bounds for Undiscounted Continuous Reinforcement Learning
Kailasam, L., Ortner, R. & Ryabko, D., 7 Juli 2015.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Forcing Subarrangements in Complete Arrangements of Pseudocircles
Ortner, R., 2015, in: Journal of Computational Geometry. 6, 1, S. 235-248Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Improved Regret Bounds for Undiscounted Continuous Reinforcement Learning
Kailasam, L., Ortner, R. & Ryabko, D., 2015, Proceedings of The 32nd International Conference on Machine Learning.Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2014
- Veröffentlicht
Regret Bounds for Restless Markov Bandits
Ortner, R., Ryabko, D., Auer, P. & Munos, R., 2014, in: Theoretical Computer Science. 558, S. 62-76Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning
Ortner, R., Maillard, O.-A. & Ryabko, D., 2014, Algorithmic Learning Theory - 25th International Conference, ALT 2014, Bled, October 8-10, 2014. S. 140-154Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2013
- Veröffentlicht
Adaptive Aggregation for Reinforcement Learning in Average Reward Markov Decision Processes
Ortner, R., 2013, in: Annals of operations research. 208, S. 321-336Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Competing with an Infinite Set of Models in Reinforcement Learning
Nguyen, P., Maillard, O.-A., Ryabko, D. & Ortner, R., 2013, JMLR Workshop and Conference Proceedings Volume 31 : Proceedings of the Sixteenth International Conference on Artificial Intelligence and Statistics. S. 463-471Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Optimal regret bounds for selecting the state representation in reinforcement learning.
Maillard, O.-A., Nguyen, P., Ortner, R. & Ryabko, D., 2013, JMLR Workshop and Conference Proceedings Volume 28 : Proceedings of The 30th International Conference on Machine Learning. S. 543-551Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband