Papers

16,557 papers found

Adaptive KL Control for Direct Preference Optimization in Instruction-Following LLMs

Yi Khuen Chai

2026 AAAI

CAPO: Confidence Aware Preference Optimization Learning for Multilingual Preferences

Rhitabrat Pokharel, Yufei Tao, Ameeta Agrawal

2025 AACL

NHK Submission to WAT 2025: Leveraging Preference Optimization for Article-level Japanese–English News Translation

Hideya Mino, Rei Endo, Yoshihiko Kawai

2025 AACL

High-Dimensional Dueling Optimization with Preference Embedding

Yangwenhui Zhang, Hong Qian, Xiang Shu et al.

2023 AAAI

Preference Ranking Optimization for Human Alignment

Feifan Song, Bowen Yu, Minghao Li et al.

2024 AAAI

FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning Schema

Junru Lu, Siyu An, Min Zhang et al.

2025 COLING

POPEN: Preference-Based Optimization and Ensemble for LVLM-Based Reasoning Segmentation

Lanyun Zhu, Tianrun Chen, Qianxiong Xu et al.

2025 CVPR

Neural Dueling Bandits: Preference-Based Optimization with Human Feedback

Arun Verma, Zhongxiang Dai, Xiaoqiang Lin et al.

2025 ICLR

Relation-Augmented Dueling Bayesian Optimization via Preference Propagation

Xiang Xia, Xiang Shu, Shuo Liu et al.

2025 IJCAI

Direct Preference-based Policy Optimization without Reward Modeling

Gaon An, Junhyeok Lee, Xingdong Zuo et al.

2023 NIPS

Gradient-Based Optimization for Bayesian Preference Elicitation

Ivan Vendrov, Tyler Lu, Qingqing Huang et al.

2020 AAAI

Multi-Objective Bayesian Optimization with Active Preference Learning

Ryota Ozaki, Kazuki Ishikawa, Youhei Kanzaki et al.

2024 AAAI

DreamAlign: Dynamic Text-to-3D Optimization with Human Preference Alignment

Gaofeng Liu, Zhiyuan Ma, Tao Fang

2025 AAAI

Multi-attribute Bayesian optimization with interactive preference learning

Raul Astudillo, Peter Frazier

2020 AISTATS

DORM: Preference Data Weights Optimization for Reward Modeling in LLM Alignment

Rongzhi Zhang, Chenwei Zhang, Xinyang Zhang et al.

2025 EMNLP

Multimodal Large Language Model-Guided ISP Hyperparameter Optimization with Dynamic Preference Learning

Xinyu Sun, Zhikun Zhao, Congyan Lang et al.

2025 ICCV

Beyond Reward: Offline Preference-guided Policy Optimization

Yachen Kang, Diyuan Shi, Jinxin Liu et al.

2023 ICML

Suit the Remedy to the Retriever: Interpretable Query Optimization with Retriever Preference Alignment for Vision-Language Retrieval

GuangHao Meng, Jinpeng Wang, Jieming Zhu et al.

2026 AAAI

Bootstrapping LLMs via Preference-Based Policy Optimization

Chen Jia

2026 AAAI

Token-level Preference Self-Alignment Optimization for Multi-style Outline Controllable Generation

Zihao Li, Xuekong Xu, Ziyao Chen et al.

2025 ACL

MWPO: Enhancing LLMs Performance through Multi-Weight Preference Strength and Length Optimization

Shiyue Xu, Fu Zhang, Jingwei Cheng et al.

2025 ACL

Adversarial Policy Optimization for Offline Preference-based Reinforcement Learning

Hyungkyu Kang, Min-hwan Oh

2025 ICLR

TO-GATE: Clarifying Questions and Summarizing Responses with Trajectory Optimization for Eliciting Human Preference

Yulin Dou, Jiangming Liu

2026 AAAI

Preference Exploration for Efficient Bayesian Optimization with Multiple Outcomes

Zhiyuan Jerry Lin, Raul Astudillo, Peter Frazier et al.

2022 AISTATS

Direct Preference-Based Evolutionary Multi-Objective Optimization with Dueling Bandits

Tian Huang, Shengbo Wang, Ke Li

2024 NIPS