Lehrstuhl für Informationstechnologie (150)
Organisation: Lehrstuhl
Publikationen
- 2019
- Veröffentlicht
Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 27 Juni 2019.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information
Auer, P., Chen, Y., Gajane, P., Lee, C-W., Luo, H., Ortner, R. & Wei, C-Y., 2019.Publikationen: Konferenzbeitrag › Abstract/Zusammenfassung › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2019, Proceedings of the 32nd Conference on Learning Theory, COLT 2019. S. 138-158Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Elektronische Veröffentlichung vor Drucklegung.
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O-A., 2019, (Elektronische Veröffentlichung vor Drucklegung.) Advances in Neural Information Processing Systems. Band 32. S. 12717 12727 S.Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Variational Regret Bounds for Reinforcement Learning
Ortner, R., Gajane, P. & Auer, P., 2019, Proceedings of The 35th Uncertainty in Artificial Intelligence Conference, UAI 2019. S. 81-90Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Variational Regret Bounds for Reinforcement Learning
Ortner, R., Gajane, P. & Auer, P., 2019.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- 2018
- Veröffentlicht
Online learning with randomized feedback graphs for optimal PUE attacks in cognitive radio networks
Dabaghchian, M., Alipour-Fanid, A., Zeng, K., Wang, Q. & Auer, P., 1 Okt. 2018, in: IEEE ACM transactions on networking. 26, 5, S. 2268-2281 14 S., 8466108.Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
A Sliding-Window Approach for Reinforcement Learning in MDPs with Arbitrarily Changing Rewards and Transitions.
Gajane, P., Ortner, R. & Auer, P., 2018.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)