IMPARA: Impact-Based Metric for GEC Using Parallel Data

Koki Maeda; Masahiro Kaneko; Naoaki Okazaki

2022 COLING COLING 2022

IMPARA: Impact-Based Metric for GEC Using Parallel Data

Abstract

AbstractAutomatic evaluation of grammatical error correction (GEC) is essential in developing useful GEC systems. Existing methods for automatic evaluation require multiple reference sentences or manual scores. However, such resources are expensive, thereby hindering automatic evaluation for various domains and correction styles. This paper proposes an Impact-based Metric for GEC using PARAllel data, IMPARA, which utilizes correction impacts computed by parallel data comprising pairs of grammatical/ungrammatical sentences. As parallel data is cheaper than manually assessing evaluation scores, IMPARA can reduce the cost of data creation for automatic evaluation. Correlations between IMPARA and human scores indicate that IMPARA is comparable or better than existing evaluation methods. Furthermore, we find that IMPARA can perform evaluations that fit different domains and correction styles trained on various parallel data.

🌉 Interdisciplinary Bridge — Artificial Intelligence and Machine Learning and Natural Language Processing

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Koki Maeda , Masahiro Kaneko , Naoaki Okazaki

Topics

Artificial Intelligence > Core AI > Interpretability Natural Language Processing > Generation > Text Generation Machine Learning > Optimization & Theory > Statistics Natural Language Processing > Applications > Natural Language Inference Natural Language Processing > Applications > Text Generation Machine Learning > Optimization & Theory > Evaluation

Keywords

domain adaptation grammatical error correction text generation evaluation metric correlation analysis automatic evaluation parallel datum human correlation text correction automatic evaluation metric

Download PDF

Related papers

MulZDG: Multilingual Code-Switching Framework for Zero-shot Dialogue Generation 2022

The Role of Context and Uncertainty in Shallow Discourse Parsing 2022

SelfMix: Robust Learning against Textual Label Noise with Self-Mixup Training 2022

Complicate Then Simplify: A Novel Way to Explore Pre-trained Models for Text Classification 2022

Repo4QA: Answering Coding Questions via Dense Retrieval on GitHub Repositories 2022