Reinforcement Learning › Methods ›

Policy Learning

2068 directly classified papers

Papers per year

Papers

Temporal Difference Based Actor Critic Learning - Convergence and Neural Implementation NIPS 2008

Accelerated Neural Evolution through Cooperatively Coevolved Synapses JMLR 2008

MDPs with Non-Deterministic Policies NIPS 2008

Biasing Approximate Dynamic Programming with a Lower Discount Factor NIPS 2008

Learning to Manipulate Articulated Objects in Unstructured Environments Using a Grounded Relational Representation RSS 2008

Fitted Q-iteration by Advantage Weighted Regression NIPS 2008

Bounding Performance Loss in Approximate MDP Homomorphisms NIPS 2008

Policy Search for Motor Primitives in Robotics NIPS 2008

Signal-to-Noise Ratio Analysis of Policy Gradient Algorithms NIPS 2008

Particle Filter-based Policy Gradient in POMDPs NIPS 2008

Regularized Policy Iteration NIPS 2008

Multi-resolution Exploration in Continuous Spaces NIPS 2008

A computational model of hippocampal function in trace conditioning NIPS 2008

Near-optimal Regret Bounds for Reinforcement Learning NIPS 2008

Incremental Natural Actor-Critic Algorithms NIPS 2007

Bayesian Policy Learning with Trans-Dimensional MCMC NIPS 2007

Fitted Q-iteration in continuous action-space MDPs NIPS 2007

Reinforcement Learning in Continuous Action Spaces through Sequential Monte Carlo Methods NIPS 2007

Optimistic Linear Programming gives Logarithmic Regret for Irreducible MDPs NIPS 2007

Random Sampling of States in Dynamic Programming NIPS 2007

Theoretical Analysis of Learning with Reward-Modulated Spike-Timing-Dependent Plasticity NIPS 2007

Proto-value Functions: A Laplacian Framework for Learning Representation and Control in Markov Decision Processes JMLR 2007

Hierarchical Apprenticeship Learning with Application to Quadruped Locomotion NIPS 2007

Hierarchical Average Reward Reinforcement Learning JMLR 2007

Learning Operational Space Control RSS 2006