Robust exploration in linear quadratic reinforcement learning

Jack Umenberger; Mina Ferizbegovic; Thomas B Schön; Håkan Hjalmarsson

2019 NIPS NeurIPS 2019

Robust exploration in linear quadratic reinforcement learning

Abstract

Learning to make decisions in an uncertain and dynamic environment is a task of fundamental performance in a number of domains. This paper concerns the problem of learning control policies for an unknown linear dynamical system so as to minimize a quadratic cost function. We present a method, based on convex optimization, that accomplishes this task ‘robustly’, i.e., the worst-case cost, accounting for system uncertainty given the observed data, is minimized. The method balances exploitation and exploration, exciting the system in such a way so as to reduce uncertainty in the model parameters to which the worst-case cost is most sensitive. Numerical simulations and application to a hardware-in-the-loop servo-mechanism are used to demonstrate the approach, with appreciable performance and robustness gains over alternative methods observed in both.

🌉 Interdisciplinary Bridge — Machine Learning and Mathematics & Optimization and Reinforcement Learning

📈 Trend Setter — Robust Optimization

🧭 Keyword Pioneer — quadratic cost

🐣 Hot Topic Early Bird — optimal control

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Jack Umenberger , Mina Ferizbegovic , Thomas B Schön , Håkan Hjalmarsson

Topics

Reinforcement Learning > Methods > Policy Learning Reinforcement Learning > Applications > Robotics Mathematics & Optimization > Optimization > Continuous Optimization Machine Learning > Learning Types > Reinforcement Learning Mathematics & Optimization > Optimization > Optimal Control Mathematics & Optimization > Optimization > Robust Optimization

Keywords

reinforcement learning robust optimization convex optimization optimal control model-based reinforcement learning linear quadratic robust control linear dynamical system quadratic cost quadratic cost function

Download PDF

Related papers

Two Generator Game: Learning to Sample via Linear Goodness-of-Fit Test 2019

Metalearned Neural Memory 2019

Model Similarity Mitigates Test Set Overuse 2019

Continual Unsupervised Representation Learning 2019

Reinforcement Learning with Convex Constraints 2019