Ronald Ortner
Publikationen
- 2025
- Angenommen/In Druck
Online Regret Bounds for Satisficing in MDPs
Hajiabolhassan, H. & Ortner, R., 2025, (Angenommen/In Druck) in: Mathematics of Operations Research. ??? Stand: 27. März 2025, ??? Stand: 27. März 2025, S. ??? Stand: 27. März 2025Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- 2024
- Veröffentlicht
Understanding the Gaps in Satisficing Bandits
Rouyer, C., Ortner, R. & Auer, P., 2024.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- 2023
- Veröffentlicht
Adaptive Algorithms for Meta-Induction
Ortner, R., 7 Okt. 2023, in: Journal for general philosophy of science = Zeitschrift für allgemeine Wissenschaftstheorie. 54.2023, 3, S. 433–450 18 S.Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Regret Bounds for Satisficing in Multi-Armed Bandit Problems
Michel, T., Hajiabolhassan, H. & Ortner, R., 7 Juni 2023, in: Transactions on machine learning research. 2023, August, 19 S.Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
A Reinforcement Learning Approach for Real-Time Autonomous Decision-Making in Well Construction
Keshavarz, S., Vita, P., Rückert, E., Ortner, R. & Thonhauser, G., 19 Jan. 2023, SPE AI Symposium 2023: Leveraging Artificial Intelligence to Shape the Future of the Energy Industry. (Society of Petroleum Engineers - SPE Symposium: Leveraging Artificial Intelligence to Shape the Future of the Energy Industry, AIS 2023).Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Autonomous Exploration for Navigating in MDPs Using Blackbox RL Algorithms
Gajane, P., Auer, P. & Ortner, R., 2023, Proceedings of the Thirty-Second International Joint Conference on Artificial Intelligence (IJCAI-23). S. 3714-3722Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Angenommen/In Druck
Online Regret Bounds for Satisficing in MDPs
Hajiabolhassan, H. & Ortner, R., 2023, (Angenommen/In Druck).Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
When is Cartesian product a Cayley graph?
Dobson, E., Hujdurovic, A., Imrich, W. & Ortner, R., 2023, Proceedings of the 12th European Conference on Combinatorics, Graph Theory and Applications. S. 362-367Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2022
- Veröffentlicht
Decision Making Under Uncertainty and Reinforcement Learning
Dimitrakakis, C. & Ortner, R., Dez. 2022, Springer. (Intelligent Systems Reference Library; Band 223)Publikationen: Buch/Bericht › Buch › Lehre
- Veröffentlicht
Quantification of Transfer in Reinforcement Learning via Regret Bounds for Learning Agents
Tuynman, A. & Ortner, R., Sept. 2022.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Regret Bounds for Satisficing in Multi-Armed Bandit Problems
Michel, T., Hajiabolhassan, H. & Ortner, R., Sept. 2022.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Predicting Packaging Sizes Using Machine Learning
Heininger, M. & Ortner, R., 22 Aug. 2022, in: Operations research forum. 43.2022, 3, 14 S., 43.Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- 2021
- Veröffentlicht
A new heuristic and an exact approach for a production planning problem
Auer, P., Dósa, G., Dulai, T., Fügenschuh, A., Näser, P., Ortner, R. & Werner-Starkne, A., Sept. 2021, in: Central European Journal of Operations Research. 29, 3, S. 1079-1113 35 S.Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Regret Bounds for Reinforcement Learning via Markov Chain Concentration
Ortner, R., 26 Aug. 2021.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- 2020
- Veröffentlicht
Regret Bounds for Reinforcement Learning via Markov Chain Concentration
Ortner, R., 23 Jan. 2020, in: The journal of artificial intelligence research. 67.2020, 1, S. 115-128 14 S.Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- 2019
- Veröffentlicht
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O.-A., Dez. 2019.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 27 Juni 2019.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Achieving Optimal Dynamic Regret for Non-stationary Bandits without Prior Information
Auer, P., Chen, Y., Gajane, P., Lee, C.-W., Luo, H., Ortner, R. & Wei, C.-Y., 2019.Publikationen: Konferenzbeitrag › Abstract/Zusammenfassung › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Bandit Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2019, Proceedings of the 32nd Conference on Learning Theory, COLT 2019. S. 138-158Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Elektronische Veröffentlichung vor Drucklegung.
Regret Bounds for Learning State Representations in Reinforcement Learning
Ortner, R., Pirotta, M., Lazaric, A., Fruit, R. & Maillard, O.-A., 2019, (Elektronische Veröffentlichung vor Drucklegung.) Advances in Neural Information Processing Systems. Band 32. S. 12717 12727 S.Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Variational Regret Bounds for Reinforcement Learning
Ortner, R., Gajane, P. & Auer, P., 2019.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Variational Regret Bounds for Reinforcement Learning
Ortner, R., Gajane, P. & Auer, P., 2019, Proceedings of The 35th Uncertainty in Artificial Intelligence Conference, UAI 2019. S. 81-90Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2018
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Adaptively Tracking the Best Arm with an Unknown Number of Distribution Changes
Auer, P., Gajane, P. & Ortner, R., 2018.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
A Sliding-Window Approach for Reinforcement Learning in MDPs with Arbitrarily Changing Rewards and Transitions.
Gajane, P., Ortner, R. & Auer, P., 2018.Publikationen: Konferenzbeitrag › Paper › (peer-reviewed)
- Veröffentlicht
Efficient Bias-Span-Constrained Exploration-Exploitation in Reinforcement Learning
Fruit, R., Pirotta, M., Lazaric, A. & Ortner, R., 2018, Proceedings of the 35th International Conference on Machine Learning, ICML 2018. Band PMLR 80. S. 1578-1586Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Guest Editors' Foreword
Ortner, R. & Ulrich Simon, H., 2018, in: Theoretical Computer Science. 742Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung
- 2016
- Veröffentlicht
Improved Learning Complexity in Combinatorial Pure Exploration Bandits
Gabillon, V., Lazaric, A., Ghavamzadeh, M., Ortner, R. & Bartlett, P., 10 Mai 2016.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Algorithmic Learning Theory: 27th International Conference, ALT 2016, Proceedings
Ortner, R. (Mit-Herausgeber), Ulrich Simon, H. (Mit-Herausgeber) & Zilles, S., 2016, Springer.Publikationen: Buch/Bericht › Sammelband › Forschung
- Veröffentlicht
Improved Learning Complexity in Combinatorial Pure Exploration Bandits
Gabillon, V., Lazaric, A., Ghavamzadeh, M., Ortner, R. & Bartlett, P., 2016, Proceedings of the Nineteenth International Conference on Artificial Intelligence and Statistics, AISTATS 2016. S. 1004-1012 (JMLR Workshop and Conference Proceedings).Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Optimal Behavior is Easier to Learn than the Truth
Ortner, R., 2016, in: Minds and Machines. 26, 3, S. 243-252Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Pareto Front Identification from Stochastic Bandit Feedback
Auer, P., Chiang, C.-K., Ortner, R. & Drugan, M., 2016, Proceedings of the Nineteenth International Conference on Artificial Intelligence and Statistics, AISTATS 2016. S. 939-947 (JMLR Workshop and Conference Proceedings).Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2015
- Veröffentlicht
Improved Regret Bounds for Undiscounted Continuous Reinforcement Learning
Kailasam, L., Ortner, R. & Ryabko, D., 7 Juli 2015.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Forcing Subarrangements in Complete Arrangements of Pseudocircles
Ortner, R., 2015, in: Journal of Computational Geometry. 6, 1, S. 235-248Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Improved Regret Bounds for Undiscounted Continuous Reinforcement Learning
Kailasam, L., Ortner, R. & Ryabko, D., 2015, Proceedings of The 32nd International Conference on Machine Learning.Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2014
- Veröffentlicht
Regret Bounds for Restless Markov Bandits
Ortner, R., Ryabko, D., Auer, P. & Munos, R., 2014, in: Theoretical Computer Science. 558, S. 62-76Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Selecting Near-Optimal Approximate State Representations in Reinforcement Learning
Ortner, R., Maillard, O.-A. & Ryabko, D., 2014, Algorithmic Learning Theory - 25th International Conference, ALT 2014, Bled, October 8-10, 2014. S. 140-154Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2013
- Veröffentlicht
Adaptive Aggregation for Reinforcement Learning in Average Reward Markov Decision Processes
Ortner, R., 2013, in: Annals of operations research. 208, S. 321-336Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Competing with an Infinite Set of Models in Reinforcement Learning
Nguyen, P., Maillard, O.-A., Ryabko, D. & Ortner, R., 2013, JMLR Workshop and Conference Proceedings Volume 31 : Proceedings of the Sixteenth International Conference on Artificial Intelligence and Statistics. S. 463-471Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Optimal regret bounds for selecting the state representation in reinforcement learning.
Maillard, O.-A., Nguyen, P., Ortner, R. & Ryabko, D., 2013, JMLR Workshop and Conference Proceedings Volume 28 : Proceedings of The 30th International Conference on Machine Learning. S. 543-551Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2012
- Veröffentlicht
Online Regret Bounds for Undiscounted Continuous Reinforcement Learning
Ortner, R. & Ryabko, D., 2012, Advances in Neural Information Processing Systems 25. MIT Press, S. 1772-1780Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Online Regret Bounds for Undiscounted Continuous Reinforcement Learning
Ortner, R. & Ryabko, D., 2012.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
PAC-Bayesian Analysis of Contextual Bandits
Seldin, Y., Auer, P., Laviolette, F., Shawe-Taylor, J. S. & Ortner, R., 2012, Advances in Neural Information Processing Systems 24. MIT Press, S. 1683-1691Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Regret Bounds for Restless Markov Bandits
Ortner, R., Ryabko, D., Auer, P. & Munos, R., 2012, Algorithmic Learning Theory 23rd International Conference, ALT 2012, Lyon, France, October 29-31, 2012. Proceedings. S. 214-228Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2011
- Veröffentlicht
Mechanizing Induction
Ortner, R. & Leitgeb, H., 2011, Handbook of the History of Logic, Volume 10: Inductive Logic. S. 719-772Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Buch/Sammelband › Forschung
- Veröffentlicht
PAC-Bayesian Analysis of Contextual Bandits
Seldin, Y., Auer, P., Laviolette, F., Shawe-Taylor, J. S. & Ortner, R., 2011.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- 2010
- Veröffentlicht
Exploiting Similarity Information in Reinforcement Learning. Similarity Models for Multi-Armed Bandits and MDPs
Ortner, R., 2010, Proceedings of the 2nd International Conference on Agents and Artificial Intelligence, Volume 1 (Artificial Intelligence). S. 203-210Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Near-optimal Regret Bounds for Reinforcement Learning
Jaksch, T., Ortner, R. & Auer, P., 2010, in: Journal of machine learning research (JMLR). 11, S. 1563-1600Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Online Regret Bounds for Markov Decision Processes with Deterministic Transitions
Ortner, R., 2010, in: Theoretical Computer Science. 411, S. 2684-2695Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
UCB Revisited: Improved Regret Bounds for the Stochastic Multi-Armed Bandit Problem
Auer, P. & Ortner, R., 2010, in: Periodica Mathematica Hungarica. 61, S. 55-65Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- 2009
- Veröffentlicht
Anordnungen von Pseudokreisen
Ortner, R., 2009.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Combining Classifiers for Improved Multilabel Image Classification
Antenreiter, M., Ortner, R. & Auer, P., 2009, Learning from Multi-label Data, MLD Workshop at ECML 2009. S. 16-27Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Combining Classifiers for Improved Multilabel Image Classification
Antenreiter, M., Ortner, R. & Auer, P., 2009.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Near-optimal Regret Bounds for Reinforcement Learning
Auer, P., Jaksch, T. & Ortner, R., 2009Publikationen: Buch/Bericht › Forschungsbericht › Transfer › (peer-reviewed)
- Veröffentlicht
Near-optimal Regret Bounds for Reinforcement Learning
Auer, P., Jaksch, T. & Ortner, R., 2009, Advances in neural information processing systems 21. MIT Press, S. 89-96Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Reinforcement Learning
Ortner, R., 2009.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- 2008
- Veröffentlicht
A Note on Convex Realizability of Arrangements of Pseudocircles
Linhart, J. & Ortner, R., 2008, in: Geombinatorics. XVIII, S. 66-71Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Embeddability of arrangements of pseudocircles into the sphere
Ortner, R., 2008, in: European journal of combinatorics. 29, S. 457-469Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Improved Upper Bounds on the Number of Vertices of Weight <=k
Ortner, R., 2008, 24th European Workshop on Computational Geometry. S. 35-38Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Joining Two Paradigms of Machine Learning
Ortner, R., 2008, in: ÖGAI-Journal. 27, S. 3-6Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Near-optimal Regret Bounds for Reinforcement Learning
Auer, P., Jaksch, T. & Ortner, R., 2008.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Online Regret Bounds for Markov Decision Processes with Deterministic Transitions
Ortner, R., 2008, Proceedings of the 19th International Conference on Algorithmic Learning Theory. S. 123-137Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Optimism in the Face of Uncertainty Should be Refutable
Ortner, R., 2008, in: Minds and Machines. 18, S. 521-526Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- 2007
- Veröffentlicht
A new PAC bound for intersection-closed concept classes
Auer, P. & Ortner, R., 2007, in: Machine learning. 66, S. 151-163Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Improved Rates for the Stochastic Continuum-Armed Bandit Problem
Auer, P., Ortner, R. & Szepesvári, C., 2007, Proceedings of the 20th Annual Conference on Learning Theory. Springer, S. 454-468Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Linear dependence of stationary distributions in ergodic Markov decision processes
Ortner, R., 2007, in: Operations Research Letters. 35, S. 619-626Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Logarithmic online regret bounds for undiscounted reinforcement learning
Auer, P. & Ortner, R., 2007, Advances in Neural Information Processing Systems 19. MIT Press, S. 49-56Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
Non-backtracking random walks and cogrowth of graphs
Ortner, R. & Woess, W., 2007, in: Canadian journal of mathematics : Journal canadien de mathématiques. 59, S. 828-844Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Pseudometrics for State Aggregation in Average Reward Markov Decision Processes
Ortner, R., 2007, Proceedings of the 18th International Conference on Algorithmic Learning Theory. S. 373-387Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2006
- Veröffentlicht
Empirical evaluation of a new online reinforcement learning algorithm
Auer, P., Jaksch, T. & Ortner, R., 2006Publikationen: Buch/Bericht › Forschungsbericht › Transfer › (peer-reviewed)
- Veröffentlicht
Logarithmic online regret bounds for undiscounted reinforcement learning
Auer, P. & Ortner, R., 2006.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- Veröffentlicht
Pawlow'sche Steuerungen
Ortner, R., 2006.Publikationen: Konferenzbeitrag › Poster › Forschung › (peer-reviewed)
- 2005
- Veröffentlicht
A boosting approach to multiple-instance learning
Auer, P. & Ortner, R., 2005Publikationen: Buch/Bericht › Forschungsbericht › Transfer › (peer-reviewed)
- Veröffentlicht
An Arrangement of Pseudocircles not Realizable with Circles
Linhart, J. & Ortner, R., 2005, in: Beiträge zur Algebra und Geometrie = Contributions to algebra and geometry. 46, S. 351-356Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)
- Veröffentlicht
Combinations and Mixtures of Optimal Policies in Unichain MDPs are Optimal: arXiv.org e-Print archive
Ortner, R., 2005Publikationen: Elektronische/multimediale Veröffentlichungen › Webpublikation oder Website › Forschung
- Veröffentlicht
Online Regret Bounds for a New Reinforcement Learning Algorithm
Auer, P. & Ortner, R., 2005, 1st Austrian Cognitive Vision Workshop. Österr. Computer-Ges., S. 35-42Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- 2004
- Veröffentlicht
A Boosting Approach to Multiple Instance Learning
Auer, P. & Ortner, R., 2004, Machine Learning, 15th European Conference on Machine Learning, ECML 2004. Springer, S. 63-74Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
A New PAC-bound for Intersection-closed Concept Classes
Auer, P. & Ortner, R., 2004, Learning Theory, 17th Annual Conference on Learning Theory. Springer, S. 408-414Publikationen: Beitrag in Buch/Bericht/Konferenzband › Beitrag in Konferenzband
- Veröffentlicht
On the Combinatorial Structure of Arrangements of Oriented Pseudocircles
Linhart, J. & Ortner, R., 2004, in: The journal of combinatorics. 11, S. R30-R30Publikationen: Beitrag in Fachzeitschrift › Artikel › Forschung › (peer-reviewed)