Markov Chain Estimation, Approximation, and Aggregation for Average Reward Markov Decision Processes and Reinforcement Learning Ronald Ortner a Montanuniversität Leoben, Franz-Joseph-Strasse 18,…
FROM SATISFICING TO OPTIMIZATION IN ONLINE REINFORCEMENT LEARNING PROPOSAL FOR AN FWF PROJECT RONALD ORTNER Contents Scientifc Abstract 2 1. Introduction 3 2. Setting 3 3. Related Work 5 …
From Satisficing to Optimization in Reinforcement Learning
FWF project PAT6918624 (2025-2027)
Project leader: Ronald Ortner Department für Mathematik und Informationstechnologie Lehrstuhl…
MATHEMATICS OF OPERATIONS RESEARCH https://pubsonline.informs.org/journal/moor Vol. 00, No. 0, Xxxxx 0000, pp. 000–000 Submitted to Mathematics of Operations Research ISSN 0364-765X, EISSN…
Highlights A Note on the Bias and Kemeny’s Constant in Markov Reward Processes with an Application to Markov Chain Perturbation Ronald Ortner presents a new identity for the bias in Markov reward…
Installationsanleitung für den MUL Upload Client für Apple® macOS® Version: 2024-Q1 0. Prämissen Als Apple macOS Benutzer benötigen Sie für diese Lehrveranstaltung mindestens macOS 12 Monterey oder…
Themen Bakk-/Masterarbeiten R.ORTNER Online Matching Matching-Probleme, in denen Zuordnungen zwischen zwei Mengen mit bestimmten Eigenschaften gesucht werden, sind ein klassisches Thema, das sowohl…
Projects at the Chair for Information Technology
Current Projects
Reinforcement Learning: Beyond Optimality
Past Projects
Dynamically Evolving Long-Term Autonomy (DELTA) Structured and…