Publikationen

  1. 2019
  2. Veröffentlicht

    Regret Bounds for Learning State Representations in Reinforcement Learning

    Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O-A., Dez. 2019.

    Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

  3. Veröffentlicht

    Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes

    Auer, P., Gajane, P. & Ortner, R., 27 Juni 2019.

    Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

  4. Veröffentlicht

    Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information

    Auer, P., Chen, Y., Gajane, P., Lee, C-W., Luo, H., Ortner, R. & Wei, C-Y., 2019.

    Publikationen: KonferenzbeitragAbstract/Zusammenfassung(peer-reviewed)

  5. Veröffentlicht

    Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes

    Auer, P., Gajane, P. & Ortner, R., 2019, Proceedings of the 32nd Conference on Learning Theory, COLT 2019. S. 138-158

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  6. Elektronische Veröffentlichung vor Drucklegung.

    Regret Bounds for Learning State Representations in Reinforcement Learning

    Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O-A., 2019, (Elektronische Veröffentlichung vor Drucklegung.) Advances in Neural Information Processing Systems. Band 32. S. 12717 12727 S.

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  7. Veröffentlicht

    Variational Regret Bounds for Reinforcement Learning

    Ortner, R., Gajane, P. & Auer, P., 2019, Proceedings of The 35th Uncertainty in Artificial Intelligence Conference, UAI 2019. S. 81-90

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  8. Veröffentlicht

    Variational Regret Bounds for Reinforcement Learning

    Ortner, R., Gajane, P. & Auer, P., 2019.

    Publikationen: KonferenzbeitragPaper(peer-reviewed)

  9. 2018
  10. Veröffentlicht

    Online learning with randomized feedback graphs for optimal PUE attacks in cognitive radio networks

    Dabaghchian, M., Alipour-Fanid, A., Zeng, K., Wang, Q. & Auer, P., 1 Okt. 2018, in: IEEE ACM transactions on networking. 26, 5, S. 2268-2281 14 S., 8466108.

    Publikationen: Beitrag in FachzeitschriftArtikelForschung(peer-reviewed)

  11. Veröffentlicht
  12. Veröffentlicht

    Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes

    Auer, P., Gajane, P. & Ortner, R., 2018.

    Publikationen: KonferenzbeitragPaper(peer-reviewed)