Answers Unite! Unsupervised Metrics for Reinforced Summarization Models

Thomas Scialom; Sylvain Lamprier; Benjamin Piwowarski; Jacopo Staiano

2019 EMNLP EMNLP 2019

Answers Unite! Unsupervised Metrics for Reinforced Summarization Models

Abstract

AbstractAbstractive summarization approaches based on Reinforcement Learning (RL) have recently been proposed to overcome classical likelihood maximization. RL enables to consider complex, possibly non differentiable, metrics that globally assess the quality and relevance of the generated outputs. ROUGE, the most used summarization metric, is known to suffer from bias towards lexical similarity as well as from sub-optimal accounting for fluency and readability of the generated abstracts. We thus explore and propose alternative evaluation measures: the reported human-evaluation analysis shows that the proposed metrics, based on Question Answering, favorably compare to ROUGE – with the additional property of not requiring reference summaries. Training a RL-based model on these metrics leads to improvements (both in terms of human or automated metrics) over current approaches that use ROUGE as reward.

🌉 Interdisciplinary Bridge — Machine Learning and Natural Language Processing and Reinforcement Learning

🧭 Keyword Pioneer — unsupervised metrics

🐣 Hot Topic Early Bird — summarization evaluation

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Thomas Scialom , Sylvain Lamprier , Benjamin Piwowarski , Jacopo Staiano

Topics

Machine Learning > Optimization & Theory > Loss Functions Reinforcement Learning > Methods > Deep RL Reinforcement Learning > Applications > Value Iteration Natural Language Processing > Applications > Summarization

Keywords

reinforcement learning question answering summarization evaluation reward function evaluation metric abstractive summarization rouge score unsupervised metric unsupervised metrics

Download PDF

Related papers

Read, Attend and Comment: A Deep Architecture for Automatic News Comment Generation 2019

Chains-of-Reasoning at TextGraphs 2019 Shared Task: Reasoning over Chains of Facts for Explainable Multi-hop Inference 2019

A Boundary-aware Neural Model for Nested Named Entity Recognition 2019

Iterative Dual Domain Adaptation for Neural Machine Translation 2019

A Multi-Pairwise Extension of Procrustes Analysis for Multilingual Word Translation 2019