Ronald Ortner

11 - 20 von 79Seitengröße: 10

Sortieren nach: 1. Autor

Publikationen

Veröffentlicht
Logarithmic online regret bounds for undiscounted reinforcement learning
Auer, P. & Ortner, R., 2006.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Veröffentlicht
Logarithmic online regret bounds for undiscounted reinforcement learning
Auer, P. & Ortner, R., 2007, Advances in Neural Information Processing Systems 19. MIT Press, S. 49-56
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Near-optimal Regret Bounds for Reinforcement Learning
Auer, P., Jaksch, T. & Ortner, R., 2009, Advances in neural information processing systems 21. MIT Press, S. 89-96
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
UCB Revisited: Improved Regret Bounds for the Stochastic Multi-Armed Bandit Problem
Auer, P. & Ortner, R., 2010, in: Periodica Mathematica Hungarica. 61, S. 55-65
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
Veröffentlicht
Near-optimal Regret Bounds for Reinforcement Learning
Auer, P., Jaksch, T. & Ortner, R., 2008.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Veröffentlicht
Pareto Front Identification from Stochastic Bandit Feedback
Auer, P., Chiang, C.-K., Ortner, R. & Drugan, M., 2016, Proceedings of the Nineteenth International Conference on Artificial Intelligence and Statistics, AISTATS 2016. S. 939-947 (JMLR Workshop and Conference Proceedings).
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.
Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Veröffentlicht
Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 27 Juni 2019.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Veröffentlicht
Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information
Auer, P., Chen, Y., Gajane, P., Lee, C.-W., Luo, H., Ortner, R. & Wei, C.-Y., 2019.
Publikationen: Konferenzbeitrag › Abstract/Zusammenfassung › (peer-reviewed)

Vorherige 1 2 3 4 5 6 7 8 Nächste

Forschungsportal

Ronald Ortner

Publikationen

Logarithmic online regret bounds for undiscounted reinforcement learning

Logarithmic online regret bounds for undiscounted reinforcement learning

Near-optimal Regret Bounds for Reinforcement Learning

UCB Revisited: Improved Regret Bounds for the Stochastic Multi-Armed Bandit Problem

Near-optimal Regret Bounds for Reinforcement Learning

Pareto Front Identification from Stochastic Bandit Feedback

Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes

Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes

Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes

Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information

Kontakt

Forschungsportal

Ronald Ortner

Publikationen

Kontakt

Neuester Forschungsoutput