XCOMPS: A Multilingual Benchmark of Conceptual Minimal Pairs

Linyang He; Ercong Nie; Sukru Samet Dindar; Arsalan Firoozi; Adrian Florea; Van Nguyen; Corentin Puffay; Riki Shimizu; Haotian Ye; Jonathan Brennan; Helmut Schmid; Hinrich Schütze; Nima Mesgarani

2025 ACL ACL 2025

XCOMPS: A Multilingual Benchmark of Conceptual Minimal Pairs

Abstract

AbstractIn this work, we introduce XCOMPS, a multilingual conceptual minimal pair dataset that covers 17 languages.Using this dataset, we evaluate LLMs’ multilingual conceptual understanding through metalinguistic prompting, direct probability measurement, and neurolinguistic probing. We find that: 1) LLMs exhibit weaker conceptual understanding for low-resource languages, and accuracy varies across languages despite being tested on the same concept sets. 2) LLMs excel at distinguishing concept-property pairs that are visibly different but exhibit a marked performance drop when negative pairs share subtle semantic similarities. 3) More morphologically complex languages yield lower concept understanding scores and require deeper layers for conceptual reasoning.

🌉 Interdisciplinary Bridge — Machine Learning and Natural Language Processing

🧭 Keyword Pioneer — conceptual understanding

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Speech & Audio

Authors

Linyang He , Ercong Nie , Sukru Samet Dindar , Arsalan Firoozi , Adrian Florea , Van Nguyen , Corentin Puffay , Riki Shimizu , Haotian Ye , Jonathan Brennan , Helmut Schmid , Hinrich Schütze , Nima Mesgarani

Topics

Machine Learning > Core Methods > Metric Learning Natural Language Processing > Resources & Methods > Large Language Models Natural Language Processing > Resources & Methods > Multilingual NLP

Keywords

low-resource language morphological complexity multilingual benchmark minimal pair conceptual understanding conceptual minimal pair large language model metalinguistic prompting concept-property pair multilingual conceptual understanding neurolinguistic probing

Download PDF

Graphically Speaking: Unmasking Abuse in Social Media with Conversation Insights 2025

CodeTool: Enhancing Programmatic Tool Invocation of LLMs via Process Supervision 2025

Structural Deep Encoding for Table Question Answering 2025

Vision-aided Unsupervised Constituency Parsing with Multi-MLLM Debating 2025

XCOMPS: A Multilingual Benchmark of Conceptual Minimal Pairs

Abstract

Authors

Topics

Keywords

Related papers