Research Explorer

MemGuide: Intent-Driven Memory Selection for Goal-Oriented Multi-Session LLM Agents

Yiming Du, Bingbing Wang, Yang He et al.

2026 AAAI

When Instinct Guides and Insight Grounds: Staged RL Training for LLM Agents

Zijing Zhang, Boning Zhang

2026 AAAI

MoralReason: Generalizable Moral Decision Alignment for LLM Agents Using Reasoning-Level Reinforcement Learning

Zhiyu An, Wan Du

2026 AAAI

SARA: Leveraging LLM Agents and Jurisprudential Ontologies for Automated Legal Reasoning

Francisco C J Bonfim, Sara Pessoa SIlva, Alicia S Neves et al.

2026 AAAI

Physics-Informed Autonomous LLM Agents for Explainable Power Electronics Modulation Design

Junhua Liu, Fanfan Lin, Xinze Li et al.

2026 AAAI

RefLens: End-to-End Evidence-Grounded Citation Verification with LLM Agents

SeungHoo Lee, JuneHyoung Kwon, Jooweon Choi et al.

2026 AAAI

AriGraph: Learning Knowledge Graph World Models with Episodic Memory for LLM Agents

Petr Anokhin, Nikita Semenov, Artyom Sorokin et al.

2025 IJCAI

Can Graph Learning Improve Planning in LLM-based Agents?

Xixi Wu, Yifei Shen, Caihua Shan et al.

2024 NIPS

Richelieu: Self-Evolving LLM-Based Agents for AI Diplomacy

Zhenyu Guan, Xiangyu Kong, Fangwei Zhong et al.

2024 NIPS

OPEx: A Component-Wise Analysis of LLM-Centric Agents in Embodied Instruction Following

Haochen Shi, Zhiyuan Sun, Xingdi Yuan et al.

2024 ACL

AXIS: Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents

Junting Lu, Zhiyang Zhang, Fangkai Yang et al.

2025 ACL

Embracing Imperfection: Simulating Students with Diverse Cognitive Levels Using LLM-based Agents

Tao Wu, Jingyuan Chen, Wang Lin et al.

2025 ACL

ChatSOP: An SOP-Guided MCTS Planning Framework for Controllable LLM Dialogue Agents

Zhigen Li, Jianxiang Peng, Yanmeng Wang et al.

2025 ACL

Benchmarking LLMs and LLM-based Agents in Practical Vulnerability Detection for Code Repositories

Alperen Yildiz, Sin G Teo, Yiling Lou et al.

2025 ACL

Can a Large Language Model Keep My Secrets? A Study on LLM-Controlled Agents

Niklas Hemken, Sai Koneru, Florian Jacob et al.

2025 ACL

A Survey of LLM-based Agents in Medicine: How far are we from Baymax?

Wenxuan Wang, Zizhan Ma, Zheng Wang et al.

2025 ACL

MemBench: Towards More Comprehensive Evaluation on the Memory of LLM-based Agents

Haoran Tan, Zeyu Zhang, Chen Ma et al.

2025 ACL

StateAct: Enhancing LLM Base Agents via Self-prompting and State-tracking

Nikolai Rozanov, Marek Rei

2025 ACL

A Review of Prominent Paradigms for LLM-Based Agents: Tool Use, Planning (Including RAG), and Feedback Learning

Xinzhe Li

2025 COLING

ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems

Xiangyuan Xue, Zeyu Lu, Di Huang et al.

2025 CVPR

An Evaluation Mechanism of LLM-based Agents on Manipulating APIs

Bing Liu, Zhou Jianxiang, Dan Meng et al.

2024 EMNLP

TrustAgent: Towards Safe and Trustworthy LLM-based Agents

Wenyue Hua, Xianjun Yang, Mingyu Jin et al.

2024 EMNLP

FlowBench: Revisiting and Benchmarking Workflow-Guided Planning for LLM-based Agents

Ruixuan Xiao, Wentao Ma, Ke Wang et al.

2024 EMNLP

Beyond Demographics: Aligning Role-playing LLM-based Agents Using Human Belief Networks

Yun-Shiuan Chuang, Krirk Nirunwiroj, Zach Studdiford et al.

2024 EMNLP

SPARK: Simulating the Co-evolution of Stance and Topic Dynamics in Online Discourse with LLM-based Agents

Bowen Zhang, Yi Yang, Fuqiang Niu et al.

2025 EMNLP

Papers