Graph Diffusion Policy Optimization

Yijing Liu; Chao Du; Tianyu Pang; Chongxuan Li; Min Lin; Wei Chen

2024 NIPS NeurIPS 2024

Graph Diffusion Policy Optimization

Abstract

Recent research has made significant progress in optimizing diffusion models for downstream objectives, which is an important pursuit in fields such as graph generation for drug design. However, directly applying these models to graph presents challenges, resulting in suboptimal performance. This paper introduces graph diffusion policy optimization (GDPO), a novel approach to optimize graph diffusion models for arbitrary (e.g., non-differentiable) objectives using reinforcement learning. GDPO is based on an eager policy gradient tailored for graph diffusion models, developed through meticulous analysis and promising improved performance. Experimental results show that GDPO achieves state-of-the-art performance in various graph generation tasks with complex and diverse objectives. Code is available at https://github.com/sail-sg/GDPO.

🌉 Interdisciplinary Bridge — Machine Learning and Reinforcement Learning

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics

🧭 Keyword Pioneer — graph diffusion model

Authors

Yijing Liu , Chao Du , Tianyu Pang , Chongxuan Li , Min Lin , Wei Chen

Topics

Machine Learning > Optimization & Theory > Optimization Deep Learning > Architectures > Graph Neural Networks Deep Learning > Models > Diffusion Models Reinforcement Learning > Methods > Deep RL Healthcare & Medicine > Research > Bioinformatics Machine Learning > Learning Types > Reinforcement Learning

Keywords

reinforcement learning policy optimization policy gradient graph generation graph diffusion diffusion model drug design graph diffusion model

Download PDF

Related papers

SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers 2024

Training for Stable Explanation for Free 2024

NeuralSolver: Learning Algorithms For Consistent and Efficient Extrapolation Across General Tasks 2024

Expectation Alignment: Handling Reward Misspecification in the Presence of Expectation Mismatch 2024

MicroAdam: Accurate Adaptive Optimization with Low Space Overhead and Provable Convergence 2024