Publikationen

  1. 2012
  2. Veröffentlicht

    Autonomous Exploration For Navigating In MDPs.

    Lim, S. H. & Auer, P., 2012, Proceedings of the 25th Annual Conference on Learning Theory. S. 40.1-40.24

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  3. Veröffentlicht

    Evaluation and Analysis of the Performance of the EXP3 Algorithm in Stochastic Environments

    Seldin, Y., Szepesvári, C., Auer, P. & Abbasi-Yadkori, Y., 2012, Proceedings of the Tenth European Workshop on Reinforcement Learning, EWRL 2012. S. 103-116 (JMLR proceedings).

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  4. Veröffentlicht

    Online Optimization with Gradual Variations

    Chiang, C-K., 2012, COLT 2012: Proceedings of the 25th Annual Conference on Learning Theory June 25-27, 2012, Edinburgh, Scotland. Mannor, S., Srebro, N. & Willamson, R. C. (Hrsg.). S. 6.1-6.20 (JMLR Workshop and Conference Proceedings; Band 23).

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  5. Veröffentlicht

    PAC Subset Selection in Stochastic Multi-armed Bandits

    Kalyanakrishnan, S., Tewari, A., Auer, P. & Stone, P., 2012, Proceedings of the 29th International Conference on Machine Learning, ICML 2012.

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  6. Veröffentlicht

    PAC-Bayes-Bernstein Inequality for Martingales and its Application to Multiarmed Bandits.

    Seldin, Y., Cesa-Bianchi, N., Auer, P., Laviolette, F. & Shawe-Taylor, J., 2012, Proceedings of the Workshop on On-line Trading of Exploration and Exploitation 2. S. 98-111

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  7. Veröffentlicht

    PAC-Bayesian Analysis of Contextual Bandits

    Seldin, Y., Auer, P., Laviolette, F., Shawe-Taylor, J. S. & Ortner, R., 2012, Advances in Neural Information Processing Systems 24. MIT Press, S. 1683-1691

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  8. Veröffentlicht

    PAC-Bayesian Inequalities for Martingales

    Seldin, Y., Cesa-Bianchi, N., Shawe-Taylor, J. & Auer, P., 2012, Proceedings of the Twenty-Eighth Conference on Uncertainty in Artificial Intelligence, UAI 2012.

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  9. Veröffentlicht

    PAC-Bayesian Inequalities for Martingales.

    Seldin, Y., Laviolette, F., Cesa-Bianchi, N., Shawe-Taylor, J. & Auer, P., 2012, in: IEEE transactions on information theory. 58, S. 7086-7093

    Publikationen: Beitrag in FachzeitschriftArtikelForschung(peer-reviewed)

  10. Veröffentlicht

    Regret Bounds for Restless Markov Bandits

    Ortner, R., Ryabko, D., Auer, P. & Munos, R., 2012, Algorithmic Learning Theory 23rd International Conference, ALT 2012, Lyon, France, October 29-31, 2012. Proceedings. S. 214-228

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  11. 2011
  12. Veröffentlicht

    Upper-confidence-bound algorithms for active learning in multi-armed bandits

    Carpentier, A., Lazaric, A., Ghavamzadeh, M., Munos, R. & Auer, P., 20 Okt. 2011, Algorithmic Learning Theory - 22nd International Conference, ALT 2011, Proceedings. S. 189-203 15 S. (Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics); Band 6925 LNAI).

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband