Learning Robust Decision Policies from Observational Data

Muhammad Osama; Dave Zachariah; Peter Stoica

2020 NIPS NeurIPS 2020

Learning Robust Decision Policies from Observational Data

Abstract

We address the problem of learning a decision policy from observational data of past decisions in contexts with features and associated outcomes. The past policy maybe unknown and in safety-critical applications, such as medical decision support, it is of interest to learn robust policies that reduce the risk of outcomes with high costs. In this paper, we develop a method for learning policies that reduce tails of the cost distribution at a specified level and, moreover, provide a statistically valid bound on the cost of each decision. These properties are valid under finite samples -- even in scenarios with uneven or no overlap between features for different decisions in the observed data -- by building on recent results in conformal prediction. The performance and statistical properties of the proposed method are illustrated using both real and synthetic data.

🌉 Interdisciplinary Bridge — Artificial Intelligence and Machine Learning

📈 Trend Setter — Robust Learning

🧭 Keyword Pioneer — cost distribution

🐣 Hot Topic Early Bird — conformal prediction

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Muhammad Osama , Dave Zachariah , Peter Stoica

Topics

Artificial Intelligence > Core AI > Causal Inference Machine Learning > Optimization & Theory > Statistical Learning Machine Learning > Application Areas > Risk Management Machine Learning > Learning Types > Robust Learning Artificial Intelligence > Core AI > Decision Making

Keywords

robust optimization risk management conformal prediction decision policy tail risk observational datum robust policy medical decision support cost distribution robust decision policy

Download PDF

Related papers

Higher-Order Spectral Clustering of Directed Graphs 2020

Self-Supervised MultiModal Versatile Networks 2020

Multi-Robot Collision Avoidance under Uncertainty with Probabilistic Safety Barrier Certificates 2020

Causal Intervention for Weakly-Supervised Semantic Segmentation 2020

Taming Discrete Integration via the Boon of Dimensionality 2020