Ronald Ortner

Publikationen

  1. Veröffentlicht

    Logarithmic online regret bounds for undiscounted reinforcement learning

    Auer, P. & Ortner, R., 2006.

    Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

  2. Veröffentlicht

    Logarithmic online regret bounds for undiscounted reinforcement learning

    Auer, P. & Ortner, R., 2007, Advances in Neural Information Processing Systems 19. MIT Press, S. 49-56

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  3. Veröffentlicht

    Near-optimal Regret Bounds for Reinforcement Learning

    Auer, P., Jaksch, T. & Ortner, R., 2009, Advances in neural information processing systems 21. MIT Press, S. 89-96

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  4. Veröffentlicht

    UCB Revisited: Improved Regret Bounds for the Stochastic Multi-Armed Bandit Problem

    Auer, P. & Ortner, R., 2010, in: Periodica Mathematica Hungarica. 61, S. 55-65

    Publikationen: Beitrag in FachzeitschriftArtikelForschung(peer-reviewed)

  5. Veröffentlicht

    Near-optimal Regret Bounds for Reinforcement Learning

    Auer, P., Jaksch, T. & Ortner, R., 2008.

    Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

  6. Veröffentlicht

    Pareto Front Identification from Stochastic Bandit Feedback

    Auer, P., Chiang, C.-K., Ortner, R. & Drugan, M., 2016, Proceedings of the Nineteenth International Conference on Artificial Intelligence and Statistics, AISTATS 2016. S. 939-947 (JMLR Workshop and Conference Proceedings).

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  7. Veröffentlicht

    Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes

    Auer, P., Gajane, P. & Ortner, R., 2018.

    Publikationen: KonferenzbeitragPaper(peer-reviewed)

  8. Veröffentlicht

    Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes

    Auer, P., Gajane, P. & Ortner, R., 2018.

    Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

  9. Veröffentlicht

    Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes

    Auer, P., Gajane, P. & Ortner, R., 27 Juni 2019.

    Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

  10. Veröffentlicht

    Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information

    Auer, P., Chen, Y., Gajane, P., Lee, C.-W., Luo, H., Ortner, R. & Wei, C.-Y., 2019.

    Publikationen: KonferenzbeitragAbstract/Zusammenfassung(peer-reviewed)