Lehrstuhl für Informationstechnologie (150)
Organisation: Lehrstuhl
Publikationen
- 2011
- Veröffentlicht
Finite-Time Analysis of Multi-armed Bandits Problems with Kullback-Leibler Divergences
Maillard, O-A., 2011, Proceedings of the 24th Annual Conference on Learning Theory. S. 497-514Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Mechanizing Induction
Ortner, R. & Leitgeb, H., 2011, Handbook of the History of Logic, Volume 10: Inductive Logic. S. 719-772Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Buch/Sammelband › Forschung
- Veröffentlicht
Models for Autonomously Motivated Exploration in Reinforcement Learning
Auer, P., Lim, S. H. & Watkins, C., 2011, The Fourteenth International Conference on Discovery Science (DS 2011). S. 29-29Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Noisy Search with Comparative Feedback
Auer, P. & Lim, S. H., 2011.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
PAC-Bayesian Analysis of Contextual Bandits
Seldin, Y., Auer, P., Laviolette, F., Shawe-Taylor, J. S. & Ortner, R., 2011.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Selecting the State-Representation in Reinforcement Learning
Maillard, O-A., 2011, Advances in Neural Information Processing Systems 24. S. 2627-2635Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Sparse recovery with Brownian sensing
Maillard, O-A., 2011, Advances in Neural Information Processing Systems 24. S. 1782-1790Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Upper-Confidence-Bound Algorithms for Active Learning in Mulit-armed Bandits
Auer, P., Carpentier, A., Lazaric, A., Ghavamzadeh, M. & Munos, R., 2011, The 22nd International Conference on Algorithmic Learning Theory. S. 189-203Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2010
- Veröffentlicht
Evaluation of Active Learning Query Strategies
Antenreiter, M. & Jaksch, T., 2010.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Exploiting Similarity Information in Reinforcement Learning. Similarity Models for Multi-Armed Bandits and MDPs
Ortner, R., 2010, Proceedings of the 2nd International Conference on Agents and Artificial Intelligence, Volume 1 (Artificial Intelligence). S. 203-210Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband