← Models

Deep Learning › Models ›

Vision-Language Models

685 directly classified papers

Papers per year

Papers

Semantics Disentangling for Text-To-Image Generation CVPR 2019

Connective Cognition Network for Directional Visual Commonsense Reasoning NIPS 2019

Visual Concept-Metaconcept Learning NIPS 2019

MirrorGAN: Learning Text-To-Image Generation by Redescription CVPR 2019

Pushing the Limits of Radiology with Joint Modeling of Visual and Textual Information ACL 2018

Enhancing Video Summarization via Vision-Language Embedding CVPR 2017

Captioning Images With Diverse Objects CVPR 2017

Interpretable and Globally Optimal Prediction for Textual Grounding using Image Concepts NIPS 2017

MDL-CW: A Multimodal Deep Learning Framework With Cross Weights CVPR 2016

Exploring Models and Data for Image Question Answering NIPS 2015