Attention Optimization for Abstractive Document Summarization

Min Gui; Junfeng Tian; Rui Wang; Zhenglu Yang

2019 IJCNLP IJCNLP 2019

Attention Optimization for Abstractive Document Summarization

Abstract

AbstractAttention plays a key role in the improvement of sequence-to-sequence-based document summarization models. To obtain a powerful attention helping with reproducing the most salient information and avoiding repetitions, we augment the vanilla attention model from both local and global aspects. We propose attention refinement unit paired with local variance loss to impose supervision on the attention model at each decoding step, and we also propose a global variance loss to optimize the attention distributions of all decoding steps from the global perspective. The performances on CNN/Daily Mail dataset verify the effectiveness of our methods.

🌉 Interdisciplinary Bridge — Machine Learning and Natural Language Processing

🧭 Keyword Pioneer — attention optimization

🐣 Hot Topic Early Bird — document summarization

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Min Gui , Junfeng Tian , Rui Wang , Zhenglu Yang

Topics

Machine Learning > Optimization & Theory > Neural Network Optimization Natural Language Processing > Generation > Summarization

Keywords

document summarization sequence-to-sequence model abstractive summarization attention optimization local variance loss global variance loss attention refinement unit

Download PDF

Related papers

Fine-grained Knowledge Fusion for Sequence Labeling Domain Adaptation 2019

Exploiting Monolingual Data at Scale for Neural Machine Translation 2019

Distributionally Robust Language Modeling 2019

Unsupervised Domain Adaptation of Contextualized Embeddings for Sequence Labeling 2019

ARAML: A Stable Adversarial Training Framework for Text Generation 2019