Papers

16,557 papers found

SPA: Achieving Consensus in LLM Alignment via Self-Priority Optimization

Yue Huang, Xiangqi Wang, Xiangliang Zhang

2026 AAAI

Backdooring Rationalization

Lingxiao Kong, Jiahui Jiang, Wenchao Xu et al.

2026 AAAI

KVmix: Gradient-Based Layer Importance-Aware Mixed-Precision Quantization for KV Cache

Fei Li, Song Liu, Weiguo Wu et al.

2026 AAAI

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

Qiyang Li, Rui Kong, Yuchen Li et al.

2026 AAAI

DMOSpeech 2: Reinforcement Learning for Duration Prediction in Metric-Optimized Speech Synthesis

Yinghao Aaron Li, Xilin Jiang, Fei Tao et al.

2026 AAAI

Bias-Restrained Prefix Representation Finetuning for Mathematical Reasoning

Sirui Liang, Pengfei Cao, Jian Zhao et al.

2026 AAAI

SparseRM: A Lightweight Preference Modeling with Sparse Autoencoder

Dengcan Liu, Jiahao Li, Zheren Fu et al.

2026 AAAI

Judge Q: Trainable Queries for Optimized Information Retention in KV Cache Eviction

Yijun Liu, Yixuan Wang, Yuzhuang Xu et al.

2026 AAAI

InfiGUI-G1: Advancing GUI Grounding with Adaptive Exploration Policy Optimization

Yuhang Liu, Zeyu Liu, Shuanghe Zhu et al.

2026 AAAI

SlimInfer: Accelerating Long-Context LLM Inference via Dynamic Token Pruning

Lingkun Long, Rubing Yang, Yushi Huang et al.

2026 AAAI

URPO: A Unified Reward & Policy Optimization Framework for Large Language Models

Songshuo Lu, Hua Wang, Zhi Chen et al.

2026 AAAI

Better Datasets Start from RefineLab: Automatic Optimization for High-Quality Dataset Refinement

Xiaonan Luo, Yue Huang, Ping He et al.

2026 AAAI

QueryAligner: Customizing User Query to Match LLMs Preferences for Better Intent Recognition

Yunlong Ma, Bo Wang, Yihong Tang et al.

2026 AAAI

Inference-Aware Prompt Optimization for Aligning Black-Box Large Language Models

Saaduddin Mahmud, Mason Nakamura, Kyle Hollins Wray et al.

2026 AAAI

RefRea: Reference-Guided Reasoning with Meta-Cognition for Accurate Language Model Agents

Yuxiang Mai, Qiyue Yin, Wancheng Ni et al.

2026 AAAI

Confidence Estimation for Text-to-SQL in Large Language Models

Sepideh Entezari Maleki, Mohammadreza Pourreza, Davood Rafiei

2026 AAAI

TokenPowerBench: Benchmarking the Power Consumption of LLM Inference

Chenxu Niu, Wei Zhang, Jie Li et al.

2026 AAAI

SPARE: Single-Pass Annotation with Reference-Guided Evaluation for Automatic Process Supervision and Reward Modelling

Md Imbesat Hassan Rizvi, Xiaodan Zhu, Iryna Gurevych

2026 AAAI

Optimization and Robustness-Informed Membership Inference Attacks for LLMs

Zichen Song, Qixin Zhang, Ming Li et al.

2026 AAAI

ECD: Evidence-guided Contrastive Decoding in Retrieval-Augmented Generation with Accurate Knowledge Reference Adjustment

Yize Sui, Yan Xu, Kun Hu et al.

2026 AAAI

CO-Bench: Benchmarking Language Model Agents in Algorithm Search for Combinatorial Optimization

Weiwei Sun, Shengyu Feng, Shanda Li et al.

2026 AAAI

Well Begun, Half Done: Reinforcement Learning with Prefix Optimization for LLM Reasoning

Yiliu Sun, Zicheng Zhao, Yang Wei et al.

2026 AAAI

Improving the Accuracy of Dense Retrieval on the Quantized Indexes via Gradient Optimization of the Target Embeddings

Cong Tan, Yongqi Shao, Hong Huo et al.

2026 AAAI

Put the Space of LoRA Initialization to the Extreme to Preserve Pre-trained Knowledge

Pengwei Tang, Xiaolin Hu, Yong Liu et al.

2026 AAAI

Rectify Evaluation Preference: Improving LLMs’ Critique on Math Reasoning via Perplexity-aware Reinforcement Learning

Changyuan Tian, Zhicong Lu, Shuang Qian et al.

2026 AAAI