Black-Box Policy Search with Probabilistic Programs

Jan-Willem Vandemeent; Brooks Paige; David Tolpin; Frank Wood

2016 AISTATS AISTATS 2016

Black-Box Policy Search with Probabilistic Programs

Abstract

In this work we show how to represent policies as programs: that is, as stochastic simulators with tunable parameters. To learn the parameters of such policies we develop connections between black box variational inference and existing policy search approaches. We then explain how such learning can be implemented in a probabilistic programming system. Using our own novel implementation of such a system we demonstrate both conciseness of policy representation and automatic policy parameter learning for a set of canonical reinforcement learning problems.

🌉 Interdisciplinary Bridge — Machine Learning and Reinforcement Learning

🧭 Keyword Pioneer — stochastic simulator

🐣 Hot Topic Early Bird — reinforcement learning

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Jan-Willem Vandemeent , Brooks Paige , David Tolpin , Frank Wood

Topics

Reinforcement Learning > Methods > Policy Learning Machine Learning > Bayesian & Probabilistic > Variational Inference

Keywords

reinforcement learning black-box optimization variational inference policy search probabilistic programming black box variational inference stochastic simulator

Download PDF

Related papers

Bipartite Correlation Clustering: Maximizing Agreements 2016

Precision Matrix Estimation in High Dimensional Gaussian Graphical Models with Faster Rates 2016

On Sparse Variational Methods and the Kullback-Leibler Divergence between Stochastic Processes 2016

Time-Varying Gaussian Process Bandit Optimization 2016

Bayesian Markov Blanket Estimation 2016