Modeling Intra and Inter-modality Incongruity for Multi-Modal Sarcasm Detection

Hongliang Pan; Zheng Lin; Peng Fu; Yatao Qi; Weiping Wang

2020 EMNLP EMNLP 2020

Modeling Intra and Inter-modality Incongruity for Multi-Modal Sarcasm Detection

Abstract

AbstractSarcasm is a pervasive phenomenon in today’s social media platforms such as Twitter and Reddit. These platforms allow users to create multi-modal messages, including texts, images, and videos. Existing multi-modal sarcasm detection methods either simply concatenate the features from multi modalities or fuse the multi modalities information in a designed manner. However, they ignore the incongruity character in sarcastic utterance, which is often manifested between modalities or within modalities. Inspired by this, we propose a BERT architecture-based model, which concentrates on both intra and inter-modality incongruity for multi-modal sarcasm detection. To be specific, we are inspired by the idea of self-attention mechanism and design inter-modality attention to capturing inter-modality incongruity. In addition, the co-attention mechanism is applied to model the contradiction within the text. The incongruity information is then used for prediction. The experimental results demonstrate that our model achieves state-of-the-art performance on a public multi-modal sarcasm detection dataset.

🌉 Interdisciplinary Bridge — Artificial Intelligence and Deep Learning and Natural Language Processing

🧭 Keyword Pioneer — inter-modality incongruity

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Hongliang Pan , Zheng Lin , Peng Fu , Yatao Qi , Weiping Wang

Topics

Deep Learning > Architectures > Transformers Deep Learning > Techniques > Model Architecture Natural Language Processing > Understanding > Sentiment Analysis Natural Language Processing > Applications > Sentiment Analysis Deep Learning > Learning Types > Multimodal Learning Artificial Intelligence > Core AI > Multi-Modal Learning

Keywords

self-attention mechanism visual question answering multi-modal sarcasm detection co-attention mechanism bert architecture incongruity modeling inter-modality attention inter-modality incongruity intra-modality incongruity

Download PDF

Related papers

Fast semantic parsing with well-typedness guarantees 2020

Detecting Objectifying Language in Online Professor Reviews 2020

Analogous Process Structure Induction for Sub-event Sequence Prediction 2020

Aspect Sentiment Classification with Aspect-Specific Opinion Spans 2020

Robust and Interpretable Grounding of Spatial References with Relation Networks 2020