Coarse-To-Fine Q-Attention: Efficient Learning for Visual Robotic Manipulation via Discretisation

Stephen James; Kentaro Wada; Tristan Laidlow; Andrew J. Davison

2022 CVPR CVPR 2022

Coarse-To-Fine Q-Attention: Efficient Learning for Visual Robotic Manipulation via Discretisation

Abstract

We present a coarse-to-fine discretisation method that enables the use of discrete reinforcement learning approaches in place of unstable and data-inefficient actor-critic methods in continuous robotics domains. This approach builds on the recently released ARM algorithm, which replaces the continuous next-best pose agent with a discrete one, with coarse-to-fine Q-attention. Given a voxelised scene, coarse-to-fine Q-attention learns what part of the scene to 'zoom' into. When this 'zooming' behaviour is applied iteratively, it results in a near-lossless discretisation of the translation space, and allows the use of a discrete action, deep Q-learning method. We show that our new coarse-to-fine algorithm achieves state-of-the-art performance on several difficult sparsely rewarded RLBench vision-based robotics tasks, and can train real-world policies, tabula rasa, in a matter of minutes, with as little as 3 demonstrations.

🌉 Interdisciplinary Bridge — Machine Learning and Reinforcement Learning and Robotics

🧭 Keyword Pioneer — visual robotic manipulation

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Stephen James , Kentaro Wada , Tristan Laidlow , Andrew J. Davison

Topics

Machine Learning > Application Areas > Efficient Computing Reinforcement Learning > Methods > Deep RL Reinforcement Learning > Applications > Robotics Robotics > Capabilities > Manipulation

Keywords

deep reinforcement learning reinforcement learning robotic manipulation sparse reward visual robotic manipulation discrete action space coarse-to-fine attention

Download PDF

Related papers

UniCoRN: A Unified Conditional Image Repainting Network 2022

Why Discard if You Can Recycle?: A Recycling Max Pooling Module for 3D Point Cloud Analysis 2022

All-in-One Image Restoration for Unknown Corruption 2022

Stability-Driven Contact Reconstruction From Monocular Color Images 2022

Forecasting Characteristic 3D Poses of Human Actions 2022