Pruning Multilingual Large Language Models for Multilingual Inference

Hwichan Kim; Jun Suzuki; Tosho Hirasawa; Mamoru Komachi

2024 EMNLP EMNLP 2024

Pruning Multilingual Large Language Models for Multilingual Inference

Abstract

AbstractMultilingual large language models (MLLMs), trained on multilingual balanced data, demonstrate better zero-shot learning performance in non-English languages compared to large language models trained on English-dominant data. However, the disparity in performance between English and non-English languages remains a challenge yet to be fully addressed. This study introduces a promising direction for enhancing non-English performance through a specialized pruning approach. Specifically, we prune MLLMs using bilingual sentence pairs from English and other languages and empirically demonstrate that this pruning strategy can enhance the MLLMs’ performance in non-English language.

🌉 Interdisciplinary Bridge — Artificial Intelligence and Deep Learning and Machine Learning and Natural Language Processing

🧭 Keyword Pioneer — bilingual pair

🐣 Hot Topic Early Bird — multilingual large language model

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Hwichan Kim , Jun Suzuki , Tosho Hirasawa , Mamoru Komachi

Topics

Artificial Intelligence > Core AI > Model Compression Machine Learning > Application Areas > Model Merging Natural Language Processing > Resources & Methods > Multilingual NLP Artificial Intelligence > Core AI > Large Language Models Deep Learning > Optimization & Theory > Model Compression Artificial Intelligence > Core AI > Multi-Modal Learning

Keywords

zero-shot learning cross-lingual transfer model pruning multilingual model bilingual datum multilingual large language model multilingual inference bilingual pair

Download PDF

Related papers

EmbodiedBERT: Cognitively Informed Metaphor Detection Incorporating Sensorimotor Information 2024

Mitigating Matthew Effect: Multi-Hypergraph Boosted Multi-Interest Self-Supervised Learning for Conversational Recommendation 2024

Learning to Extract Structured Entities Using Language Models 2024

Towards Understanding Jailbreak Attacks in LLMs: A Representation Space Analysis 2024

CSSL: Contrastive Self-Supervised Learning for Dependency Parsing on Relatively Free Word Ordered and Morphologically Rich Low Resource Languages 2024