Research Explorer

Temporally Streaming Audio-Visual Synchronization for Real-World Videos

Jordan G Voas, Wei-Cheng Tseng, Layne Berry et al.

2025 WACV

Learning Visual Grounding from Generative Vision and Language Model

Shijie Wang, Dahun Kim, Ali Taalimi et al.

2025 WACV

When Visual State Space Model Meets Backdoor Attacks

Sankalp Nagaonkar, Achyut Mani Tripathi, Ashish Mishra

2025 WACV

PTQ4VM: Post-Training Quantization for Visual Mamba

Younghyun Cho, Changhun Lee, Seonggon Kim et al.

2025 WACV

WiGNet: Windowed Vision Graph Neural Network

Gabriele Spadaro, Marco Grangetto, Attilio Fiandrotti et al.

2025 WACV

From Visual Explanations to Counterfactual Explanations with Latent Diffusion

Tung Luu, Nam Le, Duc Le et al.

2025 WACV

Scene-LLM: Extending Language Model for 3D Visual Reasoning

Rao Fu, Jingyu Liu, Xilun Chen et al.

2025 WACV

CusConcept: Customized Visual Concept Decomposition with Diffusion Models

Zhi Xu, Shaozhe Hao, Kai Han

2025 WACV

Improving Accuracy and Generalization for Efficient Visual Tracking

Ram Zaveri, Shivang Patel, Yu Gu et al.

2025 WACV

SUM: Saliency Unification through Mamba for Visual Attention Modeling

Alireza Hosseini, Amirhossein Kazerouni, Saeed Akhavan et al.

2025 WACV

Adaptive Deviation Learning for Visual Anomaly Detection with Data Contamination

Anindya Sundar Das, Guansong Pang, Monowar Bhuyan

2025 WACV

Dance Any Beat: Blending Beats with Visuals in Dance Video Generation

Xuanchen Wang, Heng Wang, Dongnan Liu et al.

2025 WACV

Enhancing Visual Classification using Comparative Descriptors

Hankyeol Lee, Gawon Seo, Wonseok Choi et al.

2025 WACV

AdQuestA: Knowledge-Guided Visual Question Answer Framework for Advertisements

Neha Choudhary, Poonam Goyal, Devashish Siwatch et al.

2025 WACV

Learning to Visually Connect Actions and their Effects

Paritosh Parmar, Eric Peh, Basura Fernando

2025 WACV

3D Part Segmentation via Geometric Aggregation of 2D Visual Features

Marco Garosi, Riccardo Tedoldi, Davide Boscaini et al.

2025 WACV

Diffusion-Based Visual Anagram as Multi-Task Learning

Zhiyuan Xu, Yinhe Chen, Huan-ang Gao et al.

2025 WACV

Visual Robustness Benchmark for Visual Question Answering (VQA)

Farhan Ishmam, Ishmam Tashdeed, Talukder Asir Saadat et al.

2025 WACV

Dataset Augmentation by Mixing Visual Concepts

Md Abdullah Al Rahat Kutubi, Hemanth Venkateswara

2025 WACV

Enhancing Skin Disease Diagnosis: Interpretable Visual Concept Discovery with SAM

Xin Hu, Janet Wang, Jihun Hamm et al.

2025 WACV

Breaking the Frame: Visual Place Recognition by Overlap Prediction

Tong Wei, Philipp Lindenberger, Jirí Matas et al.

2025 WACV

OpenCowID: Zero-Shot Visual Identification of Dairy Cows

Omkar Prabhune, Younghyun Kim

2026 WACV

Grounding Descriptions in Images informs Zero-Shot Visual Recognition

Shaunak Halbe, Junjiao Tian, K J Joseph et al.

2026 WACV

Direct Visual Grounding by Directing Attention of Visual Tokens

Parsa Esmaeilkhani, Longin Jan Latecki

2026 WACV

Enhancing Visual Planning with Auxiliary Tasks and Multi-token Prediction

Ce Zhang, Yale Song, Ruta Desai et al.

2026 WACV

Papers