Computer Vision › Analysis ›

Video Understanding

1098 directly classified papers

Papers per year

Papers

Sketch-Based Video Object Localization WACV 2024

Frequency Decoupling for Motion Magnification via Multi-Level Isomorphic Architecture CVPR 2024

JOADAA: Joint Online Action Detection and Action Anticipation WACV 2024

VEATIC: Video-Based Emotion and Affect Tracking in Context Dataset WACV 2024

Multi-Scale Video Anomaly Detection by Multi-Grained Spatio-Temporal Representation Learning CVPR 2024

Random Walks for Temporal Action Segmentation With Timestamp Supervision WACV 2024

Spatio-Temporal Filter Analysis Improves 3D-CNN for Action Classification WACV 2024

Learning Spatial Adaptation and Temporal Coherence in Diffusion Models for Video Super-Resolution CVPR 2024

Leveraging Next-Active Objects for Context-Aware Anticipation in Egocentric Videos WACV 2024

OTAS: Unsupervised Boundary Detection for Object-Centric Temporal Action Segmentation WACV 2024

What When and Where? Self-Supervised Spatio-Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions CVPR 2024

DeVos: Flow-Guided Deformable Transformer for Video Object Segmentation WACV 2024

RankDVQA: Deep VQA Based on Ranking-Inspired Hybrid Training WACV 2024

Compositional Video Understanding with Spatiotemporal Structure-based Transformers CVPR 2024

Video-kMaX: A Simple Unified Approach for Online and Near-Online Video Panoptic Segmentation WACV 2024

Differentially Private Video Activity Recognition WACV 2024

VideoGrounding-DINO: Towards Open-Vocabulary Spatio-Temporal Video Grounding CVPR 2024

VRetouchEr: Learning Cross-frame Feature Interdependence with Imperfection Flow for Face Retouching in Videos CVPR 2024

Ego-Exo4D: Understanding Skilled Human Activity from First- and Third-Person Perspectives CVPR 2024

Exploiting Auxiliary Caption for Video Grounding AAAI 2024

Earthfarsser: Versatile Spatio-Temporal Dynamical Systems Modeling in One Model AAAI 2024

Video-Based Human Pose Regression via Decoupled Space-Time Aggregation CVPR 2024

SpFormer: Spatio-Temporal Modeling for Scanpaths with Transformer AAAI 2024

VideoCLIP-XL: Advancing Long Description Understanding for Video CLIP Models EMNLP 2024

Prompt-Enhanced Multiple Instance Learning for Weakly Supervised Video Anomaly Detection CVPR 2024