Publikationen

21 - 30 von 175Seitengröße: 10

Sortieren nach: Erscheinungsjahr

2019
Veröffentlicht
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O-A., Dez. 2019.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Veröffentlicht
Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 27 Juni 2019.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Veröffentlicht
Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information
Auer, P., Chen, Y., Gajane, P., Lee, C-W., Luo, H., Ortner, R. & Wei, C-Y., 2019.
Publikationen: Konferenzbeitrag › Abstract/Zusammenfassung › (peer-reviewed)
Veröffentlicht
Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2019, Proceedings of the 32nd Conference on Learning Theory, COLT 2019. S. 138-158
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Elektronische Veröffentlichung vor Drucklegung.
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O-A., 2019, (Elektronische Veröffentlichung vor Drucklegung.) Advances in Neural Information Processing Systems. Band 32. S. 12717 12727 S.
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Variational Regret Bounds for Reinforcement Learning
Ortner, R., Gajane, P. & Auer, P., 2019, Proceedings of The 35th Uncertainty in Artificial Intelligence Conference, UAI 2019. S. 81-90
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Variational Regret Bounds for Reinforcement Learning
Ortner, R., Gajane, P. & Auer, P., 2019.
Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
2018
Veröffentlicht
Online learning with randomized feedback graphs for optimal PUE attacks in cognitive radio networks
Dabaghchian, M., Alipour-Fanid, A., Zeng, K., Wang, Q. & Auer, P., 1 Okt. 2018, in: IEEE ACM transactions on networking. 26, 5, S. 2268-2281 14 S., 8466108.
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
Veröffentlicht
A Sliding-Window Approach for Reinforcement Learning in MDPs with Arbitrarily Changing Rewards and Transitions.
Gajane, P., Ortner, R. & Auer, P., 2018.
Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.
Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)

Vorherige 1 2 3 4 5 6 7 8 ...18 Nächste

Forschungsportal

Publikationen

Regret Bounds for Learning State Representations in Reinforcement Learning

Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes

Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information

Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes

Regret Bounds for Learning State Representations in Reinforcement Learning

Variational Regret Bounds for Reinforcement Learning

Variational Regret Bounds for Reinforcement Learning

Online learning with randomized feedback graphs for optimal PUE attacks in cognitive radio networks

A Sliding-Window Approach for Reinforcement Learning in MDPs with Arbitrarily Changing Rewards and Transitions.

Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes

Erweiterte Suche