Lehrstuhl für Informationstechnologie (150)

Organisation: Lehrstuhl

81 - 100 von 219Seitengröße: 20

Sortieren nach: Erscheinungsjahr

Publikationen

2014
Veröffentlicht
Regret Bounds for Restless Markov Bandits
Ortner, R., Ryabko, D., Auer, P. & Munos, R., 2014, in: Theoretical Computer Science. 558, S. 62-76
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
Veröffentlicht
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning
Ortner, R., Maillard, O.-A. & Ryabko, D., 2014, Algorithmic Learning Theory - 25th International Conference, ALT 2014, Bled, October 8-10, 2014. S. 140-154
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Trackingvarianten für Augmented Reality Kommissioniersysteme
Heily, D., 2014
Publikationen: Thesis / Studienabschlussarbeiten und Habilitationsschriften › Masterarbeit
2013
Veröffentlicht
Adaptive Aggregation for Reinforcement Learning in Average Reward Markov Decision Processes
Ortner, R., 2013, in: Annals of operations research. 208, S. 321-336
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
Veröffentlicht
Beating Bandits in Gradually Evolving Worlds
Chiang, C.-K., 2013, Conference on Learning Theory. Shalev-Shwartz, S. & Steinwart, I. (Hrsg.). S. 210-227 (JMLR Workshop and Conference Proceedings; Band 30).
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Competing with an Infinite Set of Models in Reinforcement Learning
Nguyen, P., Maillard, O.-A., Ryabko, D. & Ortner, R., 2013, JMLR Workshop and Conference Proceedings Volume 31 : Proceedings of the Sixteenth International Conference on Artificial Intelligence and Statistics. S. 463-471
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Linear regression with random projections.
Maillard, O.-A., 2013, in: Journal of machine learning research (JMLR). 13, S. 1-1
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
Veröffentlicht
Optimal regret bounds for selecting the state representation in reinforcement learning.
Maillard, O.-A., Nguyen, P., Ortner, R. & Ryabko, D., 2013, JMLR Workshop and Conference Proceedings Volume 28 : Proceedings of The 30th International Conference on Machine Learning. S. 543-551
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Reinforcement Learning (Dagstuhl Seminar 13321)
Auer, P., 2013, in: Dagstuhl Reports. 3, S. 1-26
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
2012
Veröffentlicht
Autonomous Exploration For Navigating In MDPs.
Lim, S. H. & Auer, P., 2012, Proceedings of the 25th Annual Conference on Learning Theory. S. 40.1-40.24
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Entwicklung einer Simulation für Kommissioniersysteme
Salmutter, A., 2012
Publikationen: Thesis / Studienabschlussarbeiten und Habilitationsschriften › Masterarbeit
Veröffentlicht
Evaluation and Analysis of the Performance of the EXP3 Algorithm in Stochastic Environments
Seldin, Y., Szepesvári, C., Auer, P. & Abbasi-Yadkori, Y., 2012, Proceedings of the Tenth European Workshop on Reinforcement Learning, EWRL 2012. S. 103-116 (JMLR proceedings).
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Online Optimization with Gradual Variations
Chiang, C.-K., 2012, COLT 2012: Proceedings of the 25th Annual Conference on Learning Theory June 25-27, 2012, Edinburgh, Scotland. Mannor, S., Srebro, N. & Willamson, R. C. (Hrsg.). S. 6.1-6.20 (JMLR Workshop and Conference Proceedings; Band 23).
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Online Regret Bounds for Undiscounted Continuous Reinforcement Learning
Ortner, R. & Ryabko, D., 2012, Advances in Neural Information Processing Systems 25. MIT Press, S. 1772-1780
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Online Regret Bounds for Undiscounted Continuous Reinforcement Learning
Ortner, R. & Ryabko, D., 2012.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Veröffentlicht
PAC-Bayes-Bernstein Inequality for Martingales and its Application to Multiarmed Bandits.
Seldin, Y., Cesa-Bianchi, N., Auer, P., Laviolette, F. & Shawe-Taylor, J., 2012, Proceedings of the Workshop on On-line Trading of Exploration and Exploitation 2. S. 98-111
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
PAC-Bayesian Analysis of Contextual Bandits
Seldin, Y., Auer, P., Laviolette, F., Shawe-Taylor, J. S. & Ortner, R., 2012, Advances in Neural Information Processing Systems 24. MIT Press, S. 1683-1691
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
PAC-Bayesian Inequalities for Martingales
Seldin, Y., Cesa-Bianchi, N., Shawe-Taylor, J. & Auer, P., 2012, Proceedings of the Twenty-Eighth Conference on Uncertainty in Artificial Intelligence, UAI 2012.
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
PAC-Bayesian Inequalities for Martingales.
Seldin, Y., Laviolette, F., Cesa-Bianchi, N., Shawe-Taylor, J. & Auer, P., 2012, in: IEEE transactions on information theory. 58, S. 7086-7093
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
Veröffentlicht
PAC Subset Selection in Stochastic Multi-armed Bandits
Kalyanakrishnan, S., Tewari, A., Auer, P. & Stone, P., 2012, Proceedings of the 29th International Conference on Machine Learning, ICML 2012.
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband

Vorherige 1 2 3 4 5 6 7 8 ...11 Nächste

Forschungsportal

Lehrstuhl für Informationstechnologie (150)

Publikationen

Regret Bounds for Restless Markov Bandits

Selecting Near-Optimal Approximate State Representations in Reinforcement Learning

Trackingvarianten für Augmented Reality Kommissioniersysteme

Adaptive Aggregation for Reinforcement Learning in Average Reward Markov Decision Processes

Beating Bandits in Gradually Evolving Worlds

Competing with an Infinite Set of Models in Reinforcement Learning

Linear regression with random projections.

Optimal regret bounds for selecting the state representation in reinforcement learning.

Reinforcement Learning (Dagstuhl Seminar 13321)

Autonomous Exploration For Navigating In MDPs.

Entwicklung einer Simulation für Kommissioniersysteme

Evaluation and Analysis of the Performance of the EXP3 Algorithm in Stochastic Environments

Online Optimization with Gradual Variations

Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

PAC-Bayes-Bernstein Inequality for Martingales and its Application to Multiarmed Bandits.

PAC-Bayesian Analysis of Contextual Bandits

PAC-Bayesian Inequalities for Martingales

PAC-Bayesian Inequalities for Martingales.

PAC Subset Selection in Stochastic Multi-armed Bandits

Kontaktinformationen