Yuanzhao Zhai

5 papers · 2024–2025 · 3 conferences · across top CS/AI conferences

Achievements

🌍 Conference Polyglot (3) 🌈 Renaissance Researcher (5) 🌉 Interdisciplinary Bridge 🗺️ Taxonomy Completionist (15) 🧭 Keyword Pioneer 🐝 Cross-Pollinator (15)

Conferences

AAAI (3) ACL (1) ICML (1)

Top co-authors

Huaimin Wang (3) Kele Xu (3) Zhuo Zhang (2) Bo Ding (2) Dawei Feng (2) Lin Gui (2) Yu Lei (2) Bin Liang (2) Ruifeng Xu (2) Yue Yu (2)

Keywords

large language model (3) reinforcement learning (2) offline reinforcement learning (1) policy optimization (1) preference learning (1) preference optimization (1) out-of-distribution generalization (1) markov decision process (1) model alignment (1) model-based reinforcement learning (1) monte carlo tree search (1) human feedback (1) influence function (1) model collapse (1) policy regularization (1) ai alignment (1) multi-agent system (1) pessimistic markov decision process (1) optimistic rollout (1) direct policy optimization (1)

Papers

Correcting Large Language Model Behavior via Influence Function AAAI 2025

Enhancing Decision-Making for LLM Agents via Step-Level Q-Value Models AAAI 2025

COPR: Continual Human Preference Learning via Optimal Policy Regularization ACL 2025

Optimistic Model Rollouts for Pessimistic Offline Policy Optimization AAAI 2024

Iterative Regularized Policy Optimization with Imperfect Demonstrations ICML 2024