Research Explorer

APLOT: Robust Reward Modeling via Adaptive Preference Learning with Optimal Transport

Zhuo Li, Yuege Feng, Dandan Guo et al.

2025 EMNLP

A Position Paper on the Automatic Generation of Machine Learning Leaderboards

Roelien C. Timmer, Yufang Hou, Stephen Wan

2025 EMNLP

A Preliminary Exploration of Phrase-Based SMT and Multi-BPE Segmentations through Concatenated Tokenised Corpora for Low-Resource Indian Languages

Saumitra Yadav, Manish Shrivastava

2025 EMNLP

A Preliminary Study of AI Agent Model in Machine Translation

Ahrii Kim

2025 EMNLP

A Proactive Reliability Metric for Detecting Failures in Language Model Training

Maryam Fatima

2025 EMNLP

A Probabilistic Inference Scaling Theory for LLM Self-Correction

Zhe Yang, Yichang Zhang, Yudong Wang et al.

2025 EMNLP

AQuilt: Weaving Logic and Self-Inspection into Low-Cost, High-Relevance Data Synthesis for Specialist LLMs

Xiaopeng Ke, Hexuan Deng, Xuebo Liu et al.

2025 EMNLP

ArabEmoNet: A Lightweight Hybrid 2D CNN-BiLSTM Model with Attention for Robust Arabic Speech Emotion Recognition

Ali Abouzeid, Bilal Elbouardi, Mohamed Maged et al.

2025 EMNLP

ArabicWeb-Edu: Educational Quality Data for Arabic LLM Training

Majd Hawasly, Tasnim Mohiuddin, Hamdy Mubarak et al.

2025 EMNLP

ArabJobs: A Multinational Corpus of Arabic Job Ads

Mo El-Haj

2025 EMNLP

AraEval: An Arabic Multi-Task Evaluation Suite for Large Language Models

Alhanoof Althnian, Norah A. Alzahrani, Shaykhah Z. Alsubaie et al.

2025 EMNLP

AraHalluEval: A Fine-grained Hallucination Evaluation Framework for Arabic LLMs

Aisha Alansari, Hamzah Luqman

2025 EMNLP

AraHealthQA 2025: The First Shared Task on Arabic Health Question Answering

Hassan Alhuzali, Walid Al-Eisawi, Muhammad Abdul-Mageed et al.

2025 EMNLP

AraReasoner: Evaluating Reasoning-Based LLMs for Arabic NLP

Ahmed Abul Hasanaath, Aisha Alansari, Ahmed Ashraf et al.

2025 EMNLP

AraSafe: Benchmarking Safety in Arabic LLMs

Hamdy Mubarak, Abubakr Mohamed, Majd Hawasly

2025 EMNLP

Archaeology at TSAR 2025 Shared Task Teaching Small Models to do CEFR Simplifications

Rareş-Alexandru Roşcan, Sergiu Nisioi

2025 EMNLP

A Reasoner for Real-World Event Detection: Scaling Reinforcement Learning via Adaptive Perplexity-Aware Sampling Strategy

Xiaoyun Zhang, Jingqing Ruan, Xing Ma et al.

2025 EMNLP

Are BabyLMs Deaf to Gricean Maxims? A Pragmatic Evaluation of Sample-efficient Language Models

Raha Askari, Sina Zarrieß, Özge Alacam et al.

2025 EMNLP

Are Checklists Really Useful for Automatic Evaluation of Generative Tasks?

Momoka Furuhashi, Kouta Nakayama, Takashi Kodama et al.

2025 EMNLP

Are Economists Always More Introverted? Analyzing Consistency in Persona-Assigned LLMs

Manon Reusens, Bart Baesens, David Jurgens

2025 EMNLP

Are Generative Models Underconfident? Better Quality Estimation with Boosted Model Probability

Tu Anh Dinh, Jan Niehues

2025 EMNLP

Are Knowledge and Reference in Multilingual Language Models Cross-Lingually Consistent?

Xi Ai, Mahardika Krisna Ihsani, Min-Yen Kan

2025 EMNLP

Are Language Models Consequentialist or Deontological Moral Reasoners?

Keenan Samway, Max Kleiman-Weiner, David Guzman Piedrahita et al.

2025 EMNLP

Are Large Language Models Chronically Online Surfers? A Dataset for Chinese Internet Meme Explanation

Yubo Xie, Chenkai Wang, Zongyang Ma et al.

2025 EMNLP

Are LLMs Better than Reported? Detecting Label Errors and Mitigating Their Effect on Model Performance

Omer Nahum, Nitay Calderon, Orgad Keller et al.

2025 EMNLP

Papers