Research Explorer

VidChain: Chain-of-Tasks with Metric-based Direct Preference Optimization for Dense Video Captioning

Ji Soo Lee, Jongha Kim, Jeehye Na et al.

2025 AAAI

Radiology Report Generation via Multi-objective Preference Optimization

Ting Xiao, Lei Shi, Peng Liu et al.

2025 AAAI

Forward KL Regularized Preference Optimization for Aligning Diffusion Policies

Zhao Shan, Chenyou Fan, Shuang Qiu et al.

2025 AAAI

Multi-Reference Preference Optimization for Large Language Models

Hung Le, Quan Hung Tran, Dung Nguyen et al.

2025 AAAI

Self-Evolutionary Large Language Models Through Uncertainty-Enhanced Preference Optimization

Jianing Wang, Yang Zhou, Xiaocheng Zhang et al.

2025 AAAI

Enhancing Audiovisual Speech Recognition Through Bifocal Preference Optimization

Yihan Wu, Yichen Lu, Yifan Peng et al.

2025 AAAI

KnowPO: Knowledge-Aware Preference Optimization for Controllable Knowledge Selection in Retrieval-Augmented Language Models

Ruizhe Zhang, Yongxin Xu, Yuzhen Xiao et al.

2025 AAAI

Advancing Audio-Based Text Generation with Imbalance Preference Optimization

Zhenghao Zhou, Yongjie Liu, Chen Cao

2025 AAAI

WEPO: Web Element Preference Optimization for LLM-based Web Navigation

Jiarun Liu, Jia Hao, Chunhong Zhang et al.

2025 AAAI

JailPO: A Novel Black-Box Jailbreak Framework via Preference Optimization Against Aligned LLMs

Hongyi Li, Jiawei Ye, Jie Wu et al.

2025 AAAI

Atomic Consistency Preference Optimization for Long-Form Question Answering

Jingfeng Chen, Raghuveer Thirukovalluru, Junlin Wang et al.

2025 AACL

MAPO: Advancing Multilingual Reasoning through Multilingual-Alignment-as-Preference Optimization

Shuaijie She, Wei Zou, Shujian Huang et al.

2024 ACL

Self-Training with Direct Preference Optimization Improves Chain-of-Thought Reasoning

Tianduo Wang, Shichen Li, Wei Lu

2024 ACL

BiasDPO: Mitigating Bias in Language Models through Direct Preference Optimization

Ahmed Allam

2024 ACL

Adversarial Preference Optimization: Enhancing Your Alignment via RM-LLM Game

Pengyu Cheng, Yifan Yang, Jian Li et al.

2024 ACL

Disentangling Length from Quality in Direct Preference Optimization

Ryan Park, Rafael Rafailov, Stefano Ermon et al.

2024 ACL

Direct Preference Optimization with an Offset

Afra Amini, Tim Vieira, Ryan Cotterell

2024 ACL

Fine-grained Video Dubbing Duration Alignment with Segment Supervised Preference Optimization

Chaoqun Cui, Liangbin Huang, Shijing Wang et al.

2025 ACL

RPO: Retrieval Preference Optimization for Robust Retrieval-Augmented Generation

Shi-Qi Yan, Quan Liu, Zhen-Hua Ling

2025 ACL

SDPO: Segment-Level Direct Preference Optimization for Social Agents

Aobo Kong, Wentao Ma, Shiwan Zhao et al.

2025 ACL

Enhancing Safe and Controllable Protein Generation via Knowledge Preference Optimization

Yuhao Wang, Keyan Ding, Kehua Feng et al.

2025 ACL

DiffPO: Diffusion-styled Preference Optimization for Inference Time Alignment of Large Language Models

Ruizhe Chen, Wenhao Chai, Zhifei Yang et al.

2025 ACL

AutoMixAlign: Adaptive Data Mixing for Multi-Task Preference Optimization in LLMs

Nicholas E. Corrado, Julian Katz-Samuels, Adithya M Devraj et al.

2025 ACL

Uncovering the Impact of Chain-of-Thought Reasoning for Direct Preference Optimization: Lessons from Text-to-SQL

Hanbing Liu, Haoyang Li, Xiaokang Zhang et al.

2025 ACL

Optimal Transport-Based Token Weighting scheme for Enhanced Preference Optimization

Meng Li, Guangda Huzhang, Haibo Zhang et al.

2025 ACL

Papers