Constrained episodic reinforcement learning in concave-convex and knapsack settings

Kianté Brantley; Miro Dudik; Thodoris Lykouris; Sobhan Miryoosefi; Max Simchowitz; Aleksandrs Slivkins; Wen Sun

2020 NIPS NeurIPS 2020

Constrained episodic reinforcement learning in concave-convex and knapsack settings

Abstract

We propose an algorithm for tabular episodic reinforcement learning with constraints. We provide a modular analysis with strong theoretical guarantees for settings with concave rewards and convex constraints, and for settings with hard constraints (knapsacks). Most of the previous work in constrained reinforcement learning is limited to linear constraints, and the remaining work focuses on either the feasibility question or settings with a single episode. Our experiments demonstrate that the proposed algorithm significantly outperforms these approaches in existing constrained episodic environments.

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Machine Learning, Mathematics & Optimization, Reinforcement Learning, Robotics

Authors

Kianté Brantley , Miro Dudik , Thodoris Lykouris , Sobhan Miryoosefi , Max Simchowitz , Aleksandrs Slivkins , Wen Sun

Topics

Machine Learning > Optimization & Theory > Optimization

Keywords

episodic learning constrained reinforcement learning concave optimization convex constraint

Download PDF

Related papers

Higher-Order Spectral Clustering of Directed Graphs 2020

Self-Supervised MultiModal Versatile Networks 2020

Multi-Robot Collision Avoidance under Uncertainty with Probabilistic Safety Barrier Certificates 2020

Causal Intervention for Weakly-Supervised Semantic Segmentation 2020

Taming Discrete Integration via the Boon of Dimensionality 2020