Lehrstuhl für Informationstechnologie (150)

Organisation: Lehrstuhl

Publikationen

  1. 2013
  2. Veröffentlicht

    Beating Bandits in Gradually Evolving Worlds

    Chiang, C-K., 2013, Conference on Learning Theory. Shalev-Shwartz, S. & Steinwart, I. (Hrsg.). S. 210-227 (JMLR Workshop and Conference Proceedings; Band 30).

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  3. Veröffentlicht

    Competing with an Infinite Set of Models in Reinforcement Learning

    Nguyen, P., Maillard, O-A., Ryabko, D. & Ortner, R., 2013, JMLR Workshop and Conference Proceedings Volume 31 : Proceedings of the Sixteenth International Conference on Artificial Intelligence and Statistics. S. 463-471

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  4. Veröffentlicht

    Linear regression with random projections.

    Maillard, O-A., 2013, in: Journal of machine learning research (JMLR). 13, S. 1-1

    Publikationen: Beitrag in FachzeitschriftArtikelForschung(peer-reviewed)

  5. Veröffentlicht

    Optimal regret bounds for selecting the state representation in reinforcement learning.

    Maillard, O-A., Nguyen, P., Ortner, R. & Ryabko, D., 2013, JMLR Workshop and Conference Proceedings Volume 28 : Proceedings of The 30th International Conference on Machine Learning. S. 543-551

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  6. Veröffentlicht

    Reinforcement Learning (Dagstuhl Seminar 13321)

    Auer, P., 2013, in: Dagstuhl Reports. 3, S. 1-26

    Publikationen: Beitrag in FachzeitschriftArtikelForschung(peer-reviewed)

  7. 2012
  8. Veröffentlicht

    Autonomous Exploration For Navigating In MDPs.

    Lim, S. H. & Auer, P., 2012, Proceedings of the 25th Annual Conference on Learning Theory. S. 40.1-40.24

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  9. Veröffentlicht

    Entwicklung einer Simulation für Kommissioniersysteme

    Salmutter, A., 2012

    Publikationen: Thesis / Studienabschlussarbeiten und HabilitationsschriftenMasterarbeit

  10. Veröffentlicht

    Evaluation and Analysis of the Performance of the EXP3 Algorithm in Stochastic Environments

    Seldin, Y., Szepesvári, C., Auer, P. & Abbasi-Yadkori, Y., 2012, Proceedings of the Tenth European Workshop on Reinforcement Learning, EWRL 2012. S. 103-116 (JMLR proceedings).

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  11. Veröffentlicht

    Online Optimization with Gradual Variations

    Chiang, C-K., 2012, COLT 2012: Proceedings of the 25th Annual Conference on Learning Theory June 25-27, 2012, Edinburgh, Scotland. Mannor, S., Srebro, N. & Willamson, R. C. (Hrsg.). S. 6.1-6.20 (JMLR Workshop and Conference Proceedings; Band 23).

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  12. Veröffentlicht

    Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

    Ortner, R. & Ryabko, D., 2012, Advances in Neural Information Processing Systems 25. MIT Press, S. 1772-1780

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband