Papers

16,137 papers found

Long-form RewardBench: Evaluating Reward Models for Long-form Generation

Hui Huang, Yancheng He, Wei Liu et al.

2026 AAAI

Think-J: Learning to Think for Generative LLM-as-a-Judge

Hui Huang, Yancheng He, Hongli Zhou et al.

2026 AAAI

Hybrid Routing for a Mixture of LoRA Experts

Yitong Huang, Ziqi Yang, Zihui Wang et al.

2026 AAAI

Large Language Model Unlearning for Source Code

Xue Jiang, Yihong Dong, Huangzhao Zhang et al.

2026 AAAI

Confidence-Guided Stepwise Model Routing for Cost-Efficient Reasoning

Sangmook Lee, Dohyung Kim, Hyukhun Koh et al.

2026 AAAI

OSVBench: Benchmarking LLMs on Specification Generation Tasks for Operating System Verification

Shangyu Li, Juyong Jiang, Tiancheng Zhao et al.

2026 AAAI

VerifyBench: A Systematic Benchmark for Evaluating Reasoning Verifiers Across Domains

Xuzhao Li, Xuchen Li, Shiyu Hu et al.

2026 AAAI

SepPrune: Structured Pruning for Efficient Deep Speech Separation

Yuqi Li, Kai Li, Xin Yin et al.

2026 AAAI

RLMR: Reinforcement Learning with Mixed Rewards for Creative Writing

JianXing Liao, Tian Zhang, Xiao Feng et al.

2026 AAAI

Talk2Image: A Multi-Agent System for Multi-Turn Image Generation and Editing

Shichao Ma, Yunhe Guo, Jiahao Su et al.

2026 AAAI

GateRA: Token-aware Modulation for Parameter-Efficient Fine-tuning

Jie Ou, Shuaihong Jiang, Yingjun Du et al.

2026 AAAI

RetrySQL: Text-to-SQL Training with Retry Data for Self-Correcting Query Generation

Alicja Rączkowska, Riccardo Belluzzo, Piotr Zieliński et al.

2026 AAAI

Scaling LLM Speculative Decoding: Non-Autoregressive Forecasting in Large-Batch Scenarios

Luohe Shi, Zuchao Li, Lefei Zhang et al.

2026 AAAI

GUI-G²: Gaussian Reward Modeling for GUI Grounding

Fei Tang, Zhangxuan Gu, Zhengxi Lu et al.

2026 AAAI

PRIME: Planning and Retrieval-Integrated Memory for Enhanced Reasoning

Hieu Tran, Zonghai Yao, Nguyen Luong Tran et al.

2026 AAAI

GRAM-R²: Self-Training Generative Foundation Reward Models for Reward Reasoning

Chenglong Wang, Yongyu Mu, Hang Zhou et al.

2026 AAAI

ICL-Router: In-Context Learned Model Representations for LLM Routing

Chenxu Wang, Hao Li, Yiqun Zhang et al.

2026 AAAI

Rethinking Flow and Diffusion Bridge Models for Speech Enhancement

Dahan Wang, Jun Gao, Tong Lei et al.

2026 AAAI

OptScale: Probabilistic Optimality for Inference-time Scaling

Youkang Wang, Jian Wang, Rubing Chen et al.

2026 AAAI

DeepOR: A Deep Reasoning Foundation Model for Optimization Modeling

Ziyang Xiao, Yuan Jessica Wang, Xiongwei Han et al.

2026 AAAI

Multiplicative Orthogonal Sequential Editing for Language Models

Hao-Xiang Xu, Jun-Yu Ma, Ziqi Peng et al.

2026 AAAI

HyCoRA: Hyper-Contrastive Role-Adaptive Learning for Role-Playing

Shihao Yang, Zhicong Lu, Yong Yang et al.

2026 AAAI

SASST: Leveraging Syntax-Aware Chunking and LLMs for Simultaneous Speech Translation

Zeyu Yang, Lai Wei, Roman Koshkin et al.

2026 AAAI

ExPairT-LLM: Exact Learning for LLM Code Selection by Pairwise Queries

Tom Yuviler, Dana Drachsler-Cohen

2026 AAAI

Prune4Web: DOM Tree Pruning Programming for Web Agent

Jiayuan Zhang, Kaiquan Chen, Zhihao Lu et al.

2026 AAAI