Papers

16,557 papers found

Refining Text Generation for Realistic Conversational Recommendation via Direct Preference Optimization

Manato Tajiri, Michimasa Inaba

2025 EMNLP

Image Difference Captioning via Adversarial Preference Optimization

Zihan Huang, Junda Wu, Rohan Surana et al.

2025 EMNLP

Learning to Translate Ambiguous Terminology by Preference Optimization on Post-Edits

Nathaniel Berger, Johannes Eschbach-Dymanus, Miriam Exel et al.

2025 EMNLP

Auto-Weighted Group Relative Preference Optimization for Multi-Objective Text Generation Tasks

Yuki Ichihara, Yuu Jinnai

2025 EMNLP

DCRM: A Heuristic to Measure Response Pair Quality in Preference Optimization

Chengyu Huang, Tanya Goyal

2025 EMNLP

SPO: Self Preference Optimization with Self Regularization

Yuhao Sun, Yifan Zhang, Quandong Wang et al.

2025 EMNLP

Creative Preference Optimization

Mete Ismayilzada, Antonio Laverghetta Jr., Simone A. Luchini et al.

2025 EMNLP

ReCUT: Balancing Reasoning Length and Accuracy in LLMs via Stepwise Trails and Preference Optimization

Zhensheng Jin, Xinze Li, Yifan Ji et al.

2025 EMNLP

Captioning for Text-Video Retrieval via Dual-Group Direct Preference Optimization

Ji Soo Lee, Byungoh Ko, Jaewon Cho et al.

2025 EMNLP

SeaPO: Strategic Error Amplification for Robust Preference Optimization of Large Language Models

Jun Rao, Yunjie Liao, Xuebo Liu et al.

2025 EMNLP

MidPO: Dual Preference Optimization for Safety and Helpfulness in Large Language Models via a Mixture of Experts Framework

Yupeng Qi, Ziyu Lyu, Min Yang et al.

2025 EMNLP

Adaptive Preference Optimization with Uncertainty-aware Utility Anchor

Xiaobo Wang, Zixia Jia, Jiaqi Li et al.

2025 EMNLP

Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation

Jihao Gu, Yingyao Wang, Meng Cao et al.

2025 EMNLP

CoTD-PO: Chain-of-Thought Distillation with Preference Optimization

Lujie Niu, Haochen Sun, Fangkun Zhao et al.

2025 EMNLP

DecoupledESC: Enhancing Emotional Support Generation via Strategy-Response Decoupled Preference Optimization

Chao Zhang, Xin Shi, Xueqiao Zhang et al.

2025 EMNLP

Perspective-driven Preference Optimization with Entropy Maximization for Diverse Argument Generation

Yilin Cao, Ruike Zhang, Penghui Wei et al.

2025 EMNLP

Instruction-Tuned English to Bhojpuri Neural Machine Translation Using Contrastive Preference Optimization

Kshetrimayum Boynao Singh, Deepak Kumar, Asif Ekbal

2025 EMNLP

MagicID: Hybrid Preference Optimization for ID-Consistent and Dynamic-Preserved Video Customization

Hengjia Li, Lifan Jiang, Xi Xiao et al.

2025 ICCV

Unsupervised Visual Chain-of-Thought Reasoning via Preference Optimization

Kesen Zhao, Beier Zhu, Qianru Sun et al.

2025 ICCV

Scalable Ranked Preference Optimization for Text-to-Image Generation

Shyamgopal Karthik, Huseyin Coskun, Zeynep Akata et al.

2025 ICCV

Group Preference Optimization: Few-Shot Alignment of Large Language Models

Siyan Zhao, John Dang, Aditya Grover

2024 ICLR

Beyond Reverse KL: Generalizing Direct Preference Optimization with Diverse Divergence Constraints

Chaoqi Wang, Yibo Jiang, Chenghao Yang et al.

2024 ICLR

Statistical Rejection Sampling Improves Preference Optimization

Tianqi Liu, Yao Zhao, Rishabh Joshi et al.

2024 ICLR

Value-Incentivized Preference Optimization: A Unified Approach to Online and Offline RLHF

Shicong Cen, Jincheng Mei, Katayoon Goshvadi et al.

2025 ICLR

Correcting the Mythos of KL-Regularization: Direct Alignment without Overoptimization via Chi-Squared Preference Optimization

Audrey Huang, Wenhao Zhan, Tengyang Xie et al.

2025 ICLR