Ronald Ortner
Publikationen
- Veröffentlicht
Logarithmic online regret bounds for undiscounted reinforcement learning
Auer, P. & Ortner, R., 2006.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Logarithmic online regret bounds for undiscounted reinforcement learning
Auer, P. & Ortner, R., 2007, Advances in Neural Information Processing Systems 19. MIT Press, S. 49-56Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Near-optimal Regret Bounds for Reinforcement Learning
Auer, P., Jaksch, T. & Ortner, R., 2009, Advances in neural information processing systems 21. MIT Press, S. 89-96Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
UCB Revisited: Improved Regret Bounds for the Stochastic Multi-Armed Bandit Problem
Auer, P. & Ortner, R., 2010, in: Periodica Mathematica Hungarica. 61, S. 55-65Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Near-optimal Regret Bounds for Reinforcement Learning
Auer, P., Jaksch, T. & Ortner, R., 2008.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Pareto Front Identification from Stochastic Bandit Feedback
Auer, P., Chiang, C.-K., Ortner, R. & Drugan, M., 2016, Proceedings of the Nineteenth International Conference on Artificial Intelligence and Statistics, AISTATS 2016. S. 939-947 (JMLR Workshop and Conference Proceedings).Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 27 Juni 2019.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information
Auer, P., Chen, Y., Gajane, P., Lee, C.-W., Luo, H., Ortner, R. & Wei, C.-Y., 2019.Publikationen: Konferenzbeitrag › Abstract/Zusammenfassung › (peer-reviewed)