Publikationen

  1. 2013
  2. Veröffentlicht

    Reinforcement Learning (Dagstuhl Seminar 13321)

    Auer, P., 2013, in: Dagstuhl Reports. 3, S. 1-26

    Publikationen: Beitrag in FachzeitschriftArtikelForschung(peer-reviewed)

  3. 2012
  4. Veröffentlicht

    Autonomous Exploration For Navigating In MDPs.

    Lim, S. H. & Auer, P., 2012, Proceedings of the 25th Annual Conference on Learning Theory. S. 40.1-40.24

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  5. Veröffentlicht

    Evaluation and Analysis of the Performance of the EXP3 Algorithm in Stochastic Environments

    Seldin, Y., Szepesvári, C., Auer, P. & Abbasi-Yadkori, Y., 2012, Proceedings of the Tenth European Workshop on Reinforcement Learning, EWRL 2012. S. 103-116 (JMLR proceedings).

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  6. Veröffentlicht

    Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

    Ortner, R. & Ryabko, D., 2012, Advances in Neural Information Processing Systems 25. MIT Press, S. 1772-1780

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  7. Veröffentlicht

    Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

    Ortner, R. & Ryabko, D., 2012.

    Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

  8. Veröffentlicht

    PAC Subset Selection in Stochastic Multi-armed Bandits

    Kalyanakrishnan, S., Tewari, A., Auer, P. & Stone, P., 2012, Proceedings of the 29th International Conference on Machine Learning, ICML 2012.

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  9. Veröffentlicht

    PAC-Bayes-Bernstein Inequality for Martingales and its Application to Multiarmed Bandits.

    Seldin, Y., Cesa-Bianchi, N., Auer, P., Laviolette, F. & Shawe-Taylor, J., 2012, Proceedings of the Workshop on On-line Trading of Exploration and Exploitation 2. S. 98-111

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  10. Veröffentlicht

    PAC-Bayesian Analysis of Contextual Bandits

    Seldin, Y., Auer, P., Laviolette, F., Shawe-Taylor, J. S. & Ortner, R., 2012, Advances in Neural Information Processing Systems 24. MIT Press, S. 1683-1691

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  11. Veröffentlicht

    PAC-Bayesian Inequalities for Martingales

    Seldin, Y., Cesa-Bianchi, N., Shawe-Taylor, J. & Auer, P., 2012, Proceedings of the Twenty-Eighth Conference on Uncertainty in Artificial Intelligence, UAI 2012.

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  12. Veröffentlicht

    PAC-Bayesian Inequalities for Martingales.

    Seldin, Y., Laviolette, F., Cesa-Bianchi, N., Shawe-Taylor, J. & Auer, P., 2012, in: IEEE transactions on information theory. 58, S. 7086-7093

    Publikationen: Beitrag in FachzeitschriftArtikelForschung(peer-reviewed)