Partially Does It: Towards Scene-Level FG-SBIR With Partial Input

Pinaki Nath Chowdhury; Ayan Kumar Bhunia; Viswanatha Reddy Gajjala; Aneeshan Sain; Tao Xiang; Yi-Zhe Song

2022 CVPR CVPR 2022

Partially Does It: Towards Scene-Level FG-SBIR With Partial Input

Abstract

We scrutinise an important observation plaguing scene-level sketch research -- that a significant portion of scene sketches are "partial". A quick pilot study reveals: (i) a scene sketch does not necessarily contain all objects in the corresponding photo, due to the subjective holistic interpretation of scenes, (ii) there exists significant empty (white) regions as a result of object-level abstraction, and as a result, (iii) existing scene-level fine-grained sketch-based image retrieval methods collapse as scene sketches become more partial. To solve this "partial" problem, we advocate for a simple set-based approach using optimal transport (OT) to model cross-modal region associativity in a partially-aware fashion. Importantly, we improve upon OT to further account for holistic partialness by comparing intra-modal adjacency matrices. Our proposed method is not only robust to partial scene-sketches but also yields state-of-the-art performance on existing datasets.

🌉 Interdisciplinary Bridge — Computer Science and Computer Vision and Machine Learning and Mathematics & Optimization

🧭 Keyword Pioneer — partial input

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Pinaki Nath Chowdhury , Ayan Kumar Bhunia , Viswanatha Reddy Gajjala , Aneeshan Sain , Tao Xiang , Yi-Zhe Song

Topics

Computer Vision > Analysis > Scene Understanding Mathematics & Optimization > Optimization > Continuous Optimization Computer Science > Applications > Information Retrieval Machine Learning > Core Methods > Optimization Computer Vision > Analysis > Image Retrieval

Keywords

computer vision scene understanding optimal transport cross-modal retrieval sketch-based image retrieval partial input

Download PDF

Related papers

UniCoRN: A Unified Conditional Image Repainting Network 2022

Why Discard if You Can Recycle?: A Recycling Max Pooling Module for 3D Point Cloud Analysis 2022

All-in-One Image Restoration for Unknown Corruption 2022

Stability-Driven Contact Reconstruction From Monocular Color Images 2022

Forecasting Characteristic 3D Poses of Human Actions 2022