Lehrstuhl für Informationstechnologie (150)

Organisation: Lehrstuhl

Publikationen

  1. 2012
  2. Veröffentlicht

    Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

    Ortner, R. & Ryabko, D., 2012.

    Publikationen: KonferenzbeitragPosterForschung(peer-reviewed)

  3. Veröffentlicht

    PAC Subset Selection in Stochastic Multi-armed Bandits

    Kalyanakrishnan, S., Tewari, A., Auer, P. & Stone, P., 2012, Proceedings of the 29th International Conference on Machine Learning, ICML 2012.

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  4. Veröffentlicht

    PAC-Bayes-Bernstein Inequality for Martingales and its Application to Multiarmed Bandits.

    Seldin, Y., Cesa-Bianchi, N., Auer, P., Laviolette, F. & Shawe-Taylor, J., 2012, Proceedings of the Workshop on On-line Trading of Exploration and Exploitation 2. S. 98-111

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  5. Veröffentlicht

    PAC-Bayesian Analysis of Contextual Bandits

    Seldin, Y., Auer, P., Laviolette, F., Shawe-Taylor, J. S. & Ortner, R., 2012, Advances in Neural Information Processing Systems 24. MIT Press, S. 1683-1691

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  6. Veröffentlicht

    PAC-Bayesian Inequalities for Martingales

    Seldin, Y., Cesa-Bianchi, N., Shawe-Taylor, J. & Auer, P., 2012, Proceedings of the Twenty-Eighth Conference on Uncertainty in Artificial Intelligence, UAI 2012.

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  7. Veröffentlicht

    PAC-Bayesian Inequalities for Martingales.

    Seldin, Y., Laviolette, F., Cesa-Bianchi, N., Shawe-Taylor, J. & Auer, P., 2012, in: IEEE transactions on information theory. 58, S. 7086-7093

    Publikationen: Beitrag in FachzeitschriftArtikelForschung(peer-reviewed)

  8. Veröffentlicht

    Regret Bounds for Restless Markov Bandits

    Ortner, R., Ryabko, D., Auer, P. & Munos, R., 2012, Algorithmic Learning Theory 23rd International Conference, ALT 2012, Lyon, France, October 29-31, 2012. Proceedings. S. 214-228

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  9. 2011
  10. Veröffentlicht

    Adaptive bandits: Towards the best history-dependent strategy

    Maillard, O-A., 2011, Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics. S. 570-578

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

  11. Veröffentlicht

    Analyse, Bewertung und Verbesserung der Statistiken eines Warehouse Control Systems

    Schlögl, D., 2011

    Publikationen: Thesis / Studienabschlussarbeiten und HabilitationsschriftenMasterarbeit

  12. Veröffentlicht

    Exploration and Exploitation in Online Learning

    Auer, P., 2011, International Conference on Adaptive and Intelligent Symstems - ICAIS 2011. S. 2-2

    Publikationen: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband