Detecting (Un)Important Content for Single-Document News Summarization

Yinfei Yang; Forrest Bao; Ani Nenkova

2017 EACL EACL 2017

Detecting (Un)Important Content for Single-Document News Summarization

Abstract

AbstractWe present a robust approach for detecting intrinsic sentence importance in news, by training on two corpora of document-summary pairs. When used for single-document summarization, our approach, combined with the “beginning of document” heuristic, outperforms a state-of-the-art summarizer and the beginning-of-article baseline in both automatic and manual evaluations. These results represent an important advance because in the absence of cross-document repetition, single document summarizers for news have not been able to consistently outperform the strong beginning-of-article baseline.

🧭 Keyword Pioneer — single-document summarization

🐣 Hot Topic Early Bird — document summarization

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Security & Privacy, Speech & Audio

Authors

Yinfei Yang , Forrest Bao , Ani Nenkova

Topics

Natural Language Processing > Generation > Summarization Natural Language Processing > Applications > Summarization

Keywords

extractive summarization document summarization text summarization news summarization sentence importance single-document summarization

Download PDF

Related papers

Cross-Lingual Dependency Parsing with Late Decoding for Truly Low-Resource Languages 2017

Learning and Knowledge Transfer with Memory Networks for Machine Comprehension 2017

Is this a Child, a Girl or a Car? Exploring the Contribution of Distributional Similarity to Learning Referential Word Meanings 2017

Building Web-Interfaces for Vector Semantic Models with the WebVectors Toolkit 2017

Assessing Convincingness of Arguments in Online Debates with Limited Number of Features 2017