Improving Factuality in Clinical Abstractive Multi-Document Summarization by Guided Continued Pre-training

Ahmed Elhady; Khaled Elsayed; Eneko Agirre; Mikel Artetxe

2024 NAACL NAACL 2024

Improving Factuality in Clinical Abstractive Multi-Document Summarization by Guided Continued Pre-training

Abstract

AbstractFactual accuracy is an important property of neural abstractive summarization models, especially in fact-critical domains such as the clinical literature. In this work, we introduce a guided continued pre-training stage for encoder-decoder models that improves their understanding of the factual attributes of documents, which is followed by supervised fine-tuning on summarization. Our approach extends the pre-training recipe of BART to incorporate 3 additional objectives based on PICO spans, which capture the population, intervention, comparison, and outcomes related to a clinical study. Experiments on multi-document summarization in the clinical domain demonstrate that our approach is competitive with prior work, improving the quality and factuality of the summaries and achieving the best-published results in factual accuracy on the MSLR task.

🧭 Keyword Pioneer — pico span

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Speech & Audio

Authors

Ahmed Elhady , Khaled Elsayed , Eneko Agirre , Mikel Artetxe

Topics

Natural Language Processing > Generation > Summarization Natural Language Processing > Applications > Fact-Checking

Keywords

factual accuracy multi-document summarization encoder-decoder model clinical domain continued pre-training pico span

Download PDF

Related papers

Working Alliance Transformer for Psychotherapy Dialogue Classification 2024

Named Entity Recognition Under Domain Shift via Metric Learning for Life Sciences 2024

Assessing Logical Puzzle Solving in Large Language Models: Insights from a Minesweeper Case Study 2024

TelME: Teacher-leading Multimodal Fusion Network for Emotion Recognition in Conversation 2024

Extractive Summarization with Text Generator 2024