Publikationen

51 - 60 von 175Seitengröße: 10

Sortieren nach: Erscheinungsjahr

2013
Veröffentlicht
Adaptive Aggregation for Reinforcement Learning in Average Reward Markov Decision Processes
Ortner, R., 2013, in: Annals of operations research. 208, S. 321-336
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
Veröffentlicht
Competing with an Infinite Set of Models in Reinforcement Learning
Nguyen, P., Maillard, O-A., Ryabko, D. & Ortner, R., 2013, JMLR Workshop and Conference Proceedings Volume 31 : Proceedings of the Sixteenth International Conference on Artificial Intelligence and Statistics. S. 463-471
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Optimal regret bounds for selecting the state representation in reinforcement learning.
Maillard, O-A., Nguyen, P., Ortner, R. & Ryabko, D., 2013, JMLR Workshop and Conference Proceedings Volume 28 : Proceedings of The 30th International Conference on Machine Learning. S. 543-551
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Reinforcement Learning (Dagstuhl Seminar 13321)
Auer, P., 2013, in: Dagstuhl Reports. 3, S. 1-26
Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
2012
Veröffentlicht
Autonomous Exploration For Navigating In MDPs.
Lim, S. H. & Auer, P., 2012, Proceedings of the 25th Annual Conference on Learning Theory. S. 40.1-40.24
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Evaluation and Analysis of the Performance of the EXP3 Algorithm in Stochastic Environments
Seldin, Y., Szepesvári, C., Auer, P. & Abbasi-Yadkori, Y., 2012, Proceedings of the Tenth European Workshop on Reinforcement Learning, EWRL 2012. S. 103-116 (JMLR proceedings).
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Online Regret Bounds for Undiscounted Continuous Reinforcement Learning
Ortner, R. & Ryabko, D., 2012, Advances in Neural Information Processing Systems 25. MIT Press, S. 1772-1780
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
Online Regret Bounds for Undiscounted Continuous Reinforcement Learning
Ortner, R. & Ryabko, D., 2012.
Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
Veröffentlicht
PAC Subset Selection in Stochastic Multi-armed Bandits
Kalyanakrishnan, S., Tewari, A., Auer, P. & Stone, P., 2012, Proceedings of the 29th International Conference on Machine Learning, ICML 2012.
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
Veröffentlicht
PAC-Bayes-Bernstein Inequality for Martingales and its Application to Multiarmed Bandits.
Seldin, Y., Cesa-Bianchi, N., Auer, P., Laviolette, F. & Shawe-Taylor, J., 2012, Proceedings of the Workshop on On-line Trading of Exploration and Exploitation 2. S. 98-111
Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband

Vorherige 1 2 3 4 5 6 7 8 9 ...18 Nächste

Forschungsportal

Publikationen

Adaptive Aggregation for Reinforcement Learning in Average Reward Markov Decision Processes

Competing with an Infinite Set of Models in Reinforcement Learning

Optimal regret bounds for selecting the state representation in reinforcement learning.

Reinforcement Learning (Dagstuhl Seminar 13321)

Autonomous Exploration For Navigating In MDPs.

Evaluation and Analysis of the Performance of the EXP3 Algorithm in Stochastic Environments

Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

Online Regret Bounds for Undiscounted Continuous Reinforcement Learning

PAC Subset Selection in Stochastic Multi-armed Bandits

PAC-Bayes-Bernstein Inequality for Martingales and its Application to Multiarmed Bandits.

Erweiterte Suche