ConQuest: Contextual Question Paraphrasing through Answer-Aware Synthetic Question Generation

Mostafa Mirshekari; Jing Gu; Aaron Sisto

2021 EMNLP EMNLP 2021

ConQuest: Contextual Question Paraphrasing through Answer-Aware Synthetic Question Generation

Abstract

AbstractDespite excellent performance on tasks such as question answering, Transformer-based architectures remain sensitive to syntactic and contextual ambiguities. Question Paraphrasing (QP) offers a promising solution as a means to augment existing datasets. The main challenges of current QP models include lack of training data and difficulty in generating diverse and natural questions. In this paper, we present Conquest, a framework for generating synthetic datasets for contextual question paraphrasing. To this end, Conquest first employs an answer-aware question generation (QG) model to create a question-pair dataset and then uses this data to train a contextualized question paraphrasing model. We extensively evaluate Conquest and show its ability to produce more diverse and fluent question pairs than existing approaches. Our contextual paraphrase model also establishes a strong baseline for end-to-end contextual paraphrasing. Further, We find that context can improve BLEU-1 score on contextual compression and expansion by 4.3 and 11.2 respectively, compared to a non-contextual model.

🌉 Interdisciplinary Bridge — Deep Learning and Natural Language Processing

🧭 Keyword Pioneer — answer-aware question generation

🐣 Hot Topic Early Bird — synthetic dataset

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Mostafa Mirshekari , Jing Gu , Aaron Sisto

Topics

Deep Learning > Architectures > Transformers Natural Language Processing > Generation > Text Generation Natural Language Processing > Resources & Methods > Large Language Models Deep Learning > Models > Transformers

Keywords

transformer architecture text generation question generation synthetic data generation synthetic dataset question paraphrasing synthetic question generation answer-aware question generation transformer-based architecture bleu-1 score

Download PDF

Related papers

Continual Learning in Multilingual NMT via Language-Specific Embeddings 2021

MultiDoc2Dial: Modeling Dialogues Grounded in Multiple Documents 2021

Efficient Multi-Task Auxiliary Learning: Selecting Auxiliary Data by Feature Similarity 2021

Neural Machine Translation with Heterogeneous Topic Knowledge Embeddings 2021

Semantics-Preserved Data Augmentation for Aspect-Based Sentiment Analysis 2021