Refactoring Policy for Compositional Generalizability using Self-Supervised Object Proposals

Tongzhou Mu; Jiayuan Gu; Zhiwei Jia; Hao Tang; Hao Su

2020 NIPS NeurIPS 2020

Refactoring Policy for Compositional Generalizability using Self-Supervised Object Proposals

Abstract

We study how to learn a policy with compositional generalizability. We propose a two-stage framework, which refactorizes a high-reward teacher policy into a generalizable student policy with strong inductive bias. Particularly, we implement an object-centric GNN-based student policy, whose input objects are learned from images through self-supervised learning. Empirically, we evaluate our approach on four difficult tasks that require compositional generalizability, and achieve superior performance compared to baselines.

🌉 Interdisciplinary Bridge — Deep Learning and Machine Learning

🧭 Keyword Pioneer — compositional generalizability

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Tongzhou Mu , Jiayuan Gu , Zhiwei Jia , Hao Tang , Hao Su

Topics

Machine Learning > Learning Types > Self-Supervised Learning Deep Learning > Architectures > Graph Neural Networks

Keywords

reinforcement learning self-supervised learning object proposal graph neural network compositional generalizability

Download PDF

Related papers

Higher-Order Spectral Clustering of Directed Graphs 2020

Self-Supervised MultiModal Versatile Networks 2020

Multi-Robot Collision Avoidance under Uncertainty with Probabilistic Safety Barrier Certificates 2020

Causal Intervention for Weakly-Supervised Semantic Segmentation 2020

Taming Discrete Integration via the Boon of Dimensionality 2020