Computer Vision › Analysis ›

Video Understanding

1098 directly classified papers

Papers per year

Papers

TGBFormer: Transformer-GraphFormer Blender Network for Video Object Detection AAAI 2025

VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary CVPR 2025

Dual Conditioned Motion Diffusion for Pose-Based Video Anomaly Detection AAAI 2025

SMILE: Infusing Spatial and Motion Semantics in Masked Video Learning CVPR 2025

Reverse Distribution Based Video Moment Retrieval for Effective Bias Elimination AAAI 2025

FineVQ: Fine-Grained User Generated Content Video Quality Assessment CVPR 2025

Action Detail Matters: Refining Video Recognition with Local Action Queries CVPR 2025

Anomize: Better Open Vocabulary Video Anomaly Detection CVPR 2025

Learning Conditional Space-Time Prompt Distributions for Video Class-Incremental Learning CVPR 2025

MLVU: Benchmarking Multi-task Long Video Understanding CVPR 2025

HuPerFlow: A Comprehensive Benchmark for Human vs. Machine Motion Estimation Comparison CVPR 2025

Face Forgery Video Detection via Temporal Forgery Cue Unraveling CVPR 2025

FIction: 4D Future Interaction Prediction from Video CVPR 2025

CASP: Consistency-aware Audio-induced Saliency Prediction Model for Omnidirectional Video CVPR 2025

Unified Reconstruction of Static and Dynamic Scenes from Events CVPR 2025

KVQ: Boosting Video Quality Assessment via Saliency-guided Local Perception CVPR 2025

Efficient Motion-Aware Video MLLM CVPR 2025

DynFocus: Dynamic Cooperative Network Empowers LLMs with Video Understanding CVPR 2025

Seeing Beyond: Enhancing Visual Question Answering with Multi-Modal Retrieval COLING 2025

A Dataset for Programming-based Instructional Video Classification and Question Answering COLING 2025

Temporal Working Memory: Query-Guided Segment Refinement for Enhanced Multimodal Understanding NAACL 2025

MSR2: A Benchmark for Multi-Source Retrieval and Reasoning in Visual Question Answering NAACL 2025

Reliable and Diverse Hierarchical Adapter for Zero-shot Video Classification IJCAI 2025

TEST-V: TEst-time Support-set Tuning for Zero-shot Video Classification IJCAI 2025

Condensing Action Segmentation Datasets via Generative Network Inversion CVPR 2025