Reinforcement Learning › Methods ›

Policy Learning

2068 directly classified papers

Papers per year

Papers

On the Use of Non-Stationary Policies for Stationary Infinite-Horizon Markov Decision Processes NIPS 2012

Online Regret Bounds for Undiscounted Continuous Reinforcement Learning NIPS 2012

Finite-Sample Analysis of Least-Squares Policy Iteration JMLR 2012

Clustering via Dirichlet Process Mixture Models for Portable Skill Discovery NIPS 2011

A Bayesian Approach for Learning and Planning in Partially Observable Markov Decision Processes JMLR 2011

Exploiting Best-Match Equations for Efficient Reinforcement Learning JMLR 2011

Improving Policy Gradient Estimates with Influence Information ACML 2011

Speedy Q-Learning NIPS 2011

A Non-Parametric Approach to Dynamic Programming NIPS 2011

The Fixed Points of Off-Policy TD NIPS 2011

Monte Carlo Value Iteration with Macro-Actions NIPS 2011

Relative Entropy Inverse Reinforcement Learning AISTATS 2011

Nonlinear Inverse Reinforcement Learning with Gaussian Processes NIPS 2011

Analysis and Improvement of Policy Gradient Estimation NIPS 2011

MAP Inference for Bayesian Inverse Reinforcement Learning NIPS 2011

Action-Gap Phenomenon in Reinforcement Learning NIPS 2011

Optimal Reinforcement Learning for Gaussian Systems NIPS 2011

A reinterpretation of the policy oscillation phenomenon in approximate policy iteration NIPS 2011

Reward Design via Online Gradient Ascent NIPS 2010

Double Q-learning NIPS 2010

Feature Construction for Inverse Reinforcement Learning NIPS 2010

Linear Complementarity for Regularized Policy Evaluation and Improvement NIPS 2010

A Generalized Path Integral Control Approach to Reinforcement Learning JMLR 2010

Learning Policy Improvements with Path Integrals AISTATS 2010

Efficient Reductions for Imitation Learning AISTATS 2010