Research Explorer

Full-Step-DPO: Self-Supervised Preference Optimization with Step-wise Rewards for Mathematical Reasoning

Huimin Xu, Xin Mao, Feng-Lin Li et al.

2025 ACL

RadQA-DPO: A Radiology Question Answering System with Encoder-Decoder Models Enhanced by Direct Preference Optimization

Md Sultan Al Nahian, Ramakanth Kavuluru

2025 ACL

The Fellowship of the LLMs: Multi-Model Workflows for Synthetic Preference Optimization Dataset Generation

Samee Arif, Sualeha Farid, Abdul Hameed Azeemi et al.

2025 ACL

RedHit: Adaptive Red-Teaming of Large Language Models via Search, Reasoning, and Preference Optimization

Mohsen Sorkhpour, Abbas Yazdinejad, Ali Dehghantanha

2025 ACL

Sakura at SemEval-2025 Task 2: Enhancing Named Entity Translation with Fine-Tuning and Preference Optimization

Alberto Poncelas, Ohnmar Htun

2025 ACL

Dataground at SemEval-2025 Task 8: Small LLMs and Preference Optimization for Tabular QA

Giuseppe Attardi, Andrea Nelson Mauro, Daniele Sartiano

2025 ACL

Atyaephyra at SemEval-2025 Task 4: Low-Rank Negative Preference Optimization

Jan Bronec, Jindřich Helcl

2025 ACL

Using LLMs and Preference Optimization for Agreement-Aware HateWiC Classification

Sebastian Loftus, Adrian Mülthaler, Sanne Hoeken et al.

2025 ACL

MPPO: Multi Pair-wise Preference Optimization for LLMs with Arbitrary Negative Samples

Shuo Xie, Fangzhi Zhu, Jiahui Wang et al.

2025 COLING

Edit-Wise Preference Optimization for Grammatical Error Correction

Jiehao Liang, Haihui Yang, Shiping Gao et al.

2025 COLING

Alternate Preference Optimization for Unlearning Factual Knowledge in Large Language Models

Anmol Mekala, Vineeth Dorna, Shreya Dubey et al.

2025 COLING

MDPO: Customized Direct Preference Optimization with a Metric-based Sampler for Question and Answer Generation

Yihang Wang, Bowen Tian, Yueyang Su et al.

2025 COLING

Northeastern Uni at Multilingual Counterspeech Generation: Enhancing Counter Speech Generation with LLM Alignment through Direct Preference Optimization

Sahil Wadhwa, Chengtian Xu, Haoming Chen et al.

2025 COLING

Diffusion Model Alignment Using Direct Preference Optimization

Bram Wallace, Meihua Dang, Rafael Rafailov et al.

2024 CVPR

Task Preference Optimization: Improving Multimodal Large Language Models with Vision Task Alignment

Ziang Yan, Zhilin Li, Yinan He et al.

2025 CVPR

SymDPO: Boosting In-Context Learning of Large Multimodal Models with Symbol Demonstration Direct Preference Optimization

Hongrui Jia, Chaoya Jiang, Haiyang Xu et al.

2025 CVPR

Debiasing Multimodal Large Language Models via Noise-Aware Preference Optimization

Zefeng Zhang, Hengzhu Tang, Jiawei Sheng et al.

2025 CVPR

Aesthetic Post-Training Diffusion Models from Generic Preferences with Step-by-step Preference Optimization

Zhanhao Liang, Yuhui Yuan, Shuyang Gu et al.

2025 CVPR

Curriculum Direct Preference Optimization for Diffusion and Consistency Models

Florinel-Alin Croitoru, Vlad Hondru, Radu Tudor Ionescu et al.

2025 CVPR

Enhancing SAM with Efficient Prompting and Preference Optimization for Semi-supervised Medical Image Segmentation

Aishik Konwer, Zhijian Yang, Erhan Bas et al.

2025 CVPR

Boost Your Human Image Generation Model via Direct Preference Optimization

Sanghyeon Na, Yonggyu Kim, Hyunjoon Lee

2025 CVPR

Calibrated Multi-Preference Optimization for Aligning Diffusion Models

Kyungmin Lee, Xiahong Li, Qifei Wang et al.

2025 CVPR

InPO: Inversion Preference Optimization with Reparametrized DDIM for Efficient Diffusion Model Alignment

Yunhong Lu, Qichao Wang, Hengyuan Cao et al.

2025 CVPR

Eliminating Biased Length Reliance of Direct Preference Optimization via Down-Sampled KL Divergence

Junru Lu, Jiazheng Li, Siyu An et al.

2024 EMNLP

Controllable Preference Optimization: Toward Controllable Multi-Objective Alignment

Yiju Guo, Ganqu Cui, Lifan Yuan et al.

2024 EMNLP

Papers