Lehrstuhl für Informationstechnologie (150)
Organisation: Lehrstuhl
Publikationen
- 2012
- Veröffentlicht
Regret Bounds for Restless Markov Bandits
Ortner, R., Ryabko, D., Auer, P. & Munos, R., 2012, Algorithmic Learning Theory 23rd International Conference, ALT 2012, Lyon, France, October 29-31, 2012. Proceedings. S. 214-228Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2011
- Veröffentlicht
Adaptive bandits: Towards the best history-dependent strategy
Maillard, O.-A., 2011, Proceedings of the Fourteenth International Conference on Artificial Intelligence and Statistics. S. 570-578Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Analyse, Bewertung und Verbesserung der Statistiken eines Warehouse Control Systems
Schlögl, D., 2011Publikationen: Thesis / Studienabschlussarbeiten und Habilitationsschriften › Masterarbeit
- Veröffentlicht
Exploration and Exploitation in Online Learning
Auer, P., 2011, International Conference on Adaptive and Intelligent Symstems - ICAIS 2011. S. 2-2Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences
Maillard, O.-A., 2011, Proceedings of the 24th Annual Conference on Learning Theory. S. 497-514Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Mechanizing Induction
Ortner, R. & Leitgeb, H., 2011, Handbook of the History of Logic, Volume 10: Inductive Logic. S. 719-772Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Buch/Sammelband › Forschung
- Veröffentlicht
Models for Autonomously Motivated Exploration in Reinforcement Learning
Auer, P., Lim, S. H. & Watkins, C., 2011, The Fourteenth International Conference on Discovery Science (DS 2011). S. 29-29Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Noisy Search with Comparative Feedback
Auer, P. & Lim, S. H., 2011.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
PAC-Bayesian Analysis of Contextual Bandits
Seldin, Y., Auer, P., Laviolette, F., Shawe-Taylor, J. S. & Ortner, R., 2011.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Selecting the State-Representation in Reinforcement Learning
Maillard, O.-A., 2011, Advances in Neural Information Processing Systems 24. S. 2627-2635Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Sparse recovery with Brownian sensing
Maillard, O.-A., 2011, Advances in Neural Information Processing Systems 24. S. 1782-1790Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Upper-Confidence-Bound Algorithms for Active Learning in Mulit-armed Bandits
Auer, P., Carpentier, A., Lazaric, A., Ghavamzadeh, M. & Munos, R., 2011, The 22nd International Conference on Algorithmic Learning Theory. S. 189-203Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2010
- Veröffentlicht
Evaluation of Active Learning Query Strategies
Antenreiter, M. & Jaksch, T., 2010.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Exploiting Similarity Information in Reinforcement Learning. Similarity Models for Multi-Armed Bandits and MDPs
Ortner, R., 2010, Proceedings of the 2nd International Conference on Agents and Artificial Intelligence, Volume 1 (Artificial Intelligence). S. 203-210Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Exploration-Exploitation of Eye Movement Enriched Multiple Feature Spaces for Content-Based Image Retrieval
Hussain, Z., Leung, P., Pasupa, K., Hardoon, D., Auer, P. & Shawe-Taylor, J., 2010, Exploration-Exploitation of Eye Movement Enriched Multiple Feature Spaces for Content-Based Image Retrieval. S. 2010-2010Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Implementierung eines Simulationsmodells in einem schienenproduzierenden Unternehmen
Hierzenberger, S. A., 2010Publikationen: Thesis / Studienabschlussarbeiten und Habilitationsschriften › Masterarbeit
- Veröffentlicht
Near-optimal Regret Bounds for Reinforcement Learning
Jaksch, T., Ortner, R. & Auer, P., 2010, in: Journal of machine learning research (JMLR). 11, S. 1563-1600Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Online Learning with Queries
Chiang, C.-K., 2010, Proceedings of the Twenty-First Annual ACM-SIAM Symposium on Discrete Algorithms. S. 616-629Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Online Regret Bounds for Markov Decision Processes with Deterministic Transitions
Ortner, R., 2010, in: Theoretical Computer Science. 411, S. 2684-2695Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Pinview: Implicit Feedback in Content-Based Image Retrieval
Auer, P., Hussain, Z., Kaski, S., Klami, A., Kujala, J., Laaksonen, J., Leung, P., Pasupa, K. & Shawe-Taylor, J., 2010, Pinview: Implicit Feedback in Content-Based Image Retrieval. S. 0-0Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband