Research Explorer

Breaking Agents: Compromising Autonomous LLM Agents Through Malfunction Amplification

Boyang Zhang, Yicong Tan, Yun Shen et al.

2025 EMNLP

Towards Effective Offensive Security LLM Agents: Hyperparameter Tuning, LLM as a Judge, and a Lightweight CTF Benchmark

Minghao Shao, Nanda Rani, Kimberly Milner et al.

2026 AAAI

Star-Agents: Automatic Data Optimization with LLM Agents for Instruction Tuning

Hang Zhou, Yehui Tang, Haochen Qin et al.

2024 NIPS

Watch Out for Your Agents! Investigating Backdoor Threats to LLM-Based Agents

Wenkai Yang, Xiaohan Bi, Yankai Lin et al.

2024 NIPS

AutoManual: Constructing Instruction Manuals by LLM Agents via Interactive Environmental Learning

Minghao Chen, Yihang Li, Yanting Yang et al.

2024 NIPS

AGILE: A Novel Reinforcement Learning Framework of LLM Agents

Peiyuan Feng, Yichen He, Guanhua Huang et al.

2024 NIPS

AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning

Shirley Wu, Shiyu Zhao, Qian Huang et al.

2024 NIPS

AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents

Chang Ma, Junlei Zhang, Zhihao Zhu et al.

2024 NIPS

AgentDojo: A Dynamic Environment to Evaluate Prompt Injection Attacks and Defenses for LLM Agents

Edoardo Debenedetti, Jie Zhang, Mislav Balunovic et al.

2024 NIPS

Reinforcing LLM Agents via Policy Optimization with Action Decomposition

Muning Wen, Ziyu Wan, Jun Wang et al.

2024 NIPS

Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents

Giorgio Piatti, Zhijing Jin, Max Kleiman-Weiner et al.

2024 NIPS

AgentPoison: Red-teaming LLM Agents via Poisoning Memory or Knowledge Bases

Zhaorun Chen, Zhen Xiang, Chaowei Xiao et al.

2024 NIPS

Aligning LLM Agents by Learning Latent Preference from User Edits

Ge Gao, Alexey Taymanov, Eduardo Salinas et al.

2024 NIPS

VELMA: Verbalization Embodiment of LLM Agents for Vision and Language Navigation in Street View

Raphael Schumann, Wanrong Zhu, Weixi Feng et al.

2024 AAAI

ExpeL: LLM Agents Are Experiential Learners

Andrew Zhao, Daniel Huang, Quentin Xu et al.

2024 AAAI

MDD-5k: A New Diagnostic Conversation Dataset for Mental Disorders Synthesized via Neuro-Symbolic LLM Agents

Congchi Yin, Feng Li, Shu Zhang et al.

2025 AAAI

LLM Agents Can Be Choice-Supportive Biased Evaluators: An Empirical Study

Nan Zhuang, Boyu Cao, Yi Yang et al.

2025 AAAI

Enhancing Decision-Making for LLM Agents via Step-Level Q-Value Models

Yuanzhao Zhai, Tingkai Yang, Kele Xu et al.

2025 AAAI

Trial and Error: Exploration-Based Trajectory Optimization of LLM Agents

Yifan Song, Da Yin, Xiang Yue et al.

2024 ACL

BadAgent: Inserting and Activating Backdoor Attacks in LLM Agents

Yifei Wang, Dizhan Xue, Shengjie Zhang et al.

2024 ACL

Evaluating Very Long-Term Conversational Memory of LLM Agents

Adyasha Maharana, Dong-Ho Lee, Sergey Tulyakov et al.

2024 ACL

PsychoGAT: A Novel Psychological Measurement Paradigm through Interactive Fiction Games with LLM Agents

Qisen Yang, Zekun Wang, Honghui Chen et al.

2024 ACL

Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View

Jintian Zhang, Xin Xu, Ningyu Zhang et al.

2024 ACL

Boosting LLM Agents with Recursive Contemplation for Effective Deception Handling

Shenzhi Wang, Chang Liu, Zilong Zheng et al.

2024 ACL

LegalAgentBench: Evaluating LLM Agents in Legal Domain

Haitao Li, Junjie Chen, Jingli Yang et al.

2025 ACL

Papers