Papers

3,673 papers found

Visual Bridge: Universal Visual Perception Representations Generating

Yilin Gao, Shuguang Dou, Junzhou Li et al.

2026 AAAI

rMMEA: Robust Multi-Modal Entity Alignment with Missing and Noise Visual Modality

Lingbing Guo, Zhuo Chen, Yichi Zhang et al.

2026 AAAI

AV-Edit: Multimodal Generative Sound Effect Editing via Audio-Visual Semantic Joint Control

Xinyue Guo, Xiaoran Yang, Lipan Zhang et al.

2026 AAAI

Enhancing Spatial Reasoning Through Visual and Textual Thinking

Xun Liang, Xin Guo, Zhongming Jin et al.

2026 AAAI

Guided Perturbation Sensitivity (GPS): Detecting Adversarial Text via Embedding Stability and Word Importance

Bryan E. Tuck, Rakesh M. Verma

2026 AAAI

MAVERIX: Multimodal Audio-Visual Evaluation and Recognition IndeX

Liuyue Xie, Avik Kuthiala, George Z Wei et al.

2026 AAAI

AMS-KV: Adaptive KV Caching in Multi-Scale Visual Autoregressive Transformers

Boxun Xu, Yu Wang, Zihu Wang et al.

2026 AAAI

Activating Visual Context and Commonsense Reasoning Through Masked Prediction in VLMs

Jiaao Yu, Shenwei Li, Mingjie Han et al.

2026 AAAI

Learning Optimal Prompt Ensemble for Multi-source Visual Prompt Transfer

Enming Zhang, Liwen Cao, Yanru Wu et al.

2026 AAAI

Parameter-Free Clustering via Self-Supervised Consensus Maximization

Lijun Zhang, Suyuan Liu, Siwei Wang et al.

2026 AAAI

Seeing Is Believing: Rich-Context Hallucination Detection for MLLMs via Backward Visual Grounding

Pinxue Guo, Chongruo Wu, Xinyu Zhou et al.

2026 AAAI

VipAct: Visual-Perception Enhancement via Specialized VLM Agent Collaboration and Tool-use

Zhehao Zhang, Ryan A. Rossi, Tong Yu et al.

2026 AAAI

Bayesian Network Structural Consensus via Greedy Min-Cut Analysis

Pablo Torrijos, Jose M. Puerta, Juan A. Aledo et al.

2026 AAAI

Ordinal Secretaries with Advice

Hasti Nourmohammadi, Ying Cao, Bo Sun et al.

2026 AAAI

SMPRO: Self-Supervised Visual Preference Alignment via Differentiable Multi-Preference Multi-Group Ranking

Sirnam Swetha, Rui Meng, Shwetha Ram et al.

2026 AAAI

Visual-Friendly Concept Protection via Selective Adversarial Perturbations

Xiaoyue Mi, Fan Tang, You Wu et al.

2026 AAAI

From Representation to Reasoning: Toward General-Purpose Visual Intelligence

Chen Wei

2026 AAAI

Exploiting Graph-Based Structural Priors for Visual Recognition

Depanshu Sani

2026 AAAI

Traffic Signal Plans Explorer: A General Framework for Visualising Traffic Evolution

Francesco Doria, Francesco Percassi, Marco Maratea et al.

2026 AAAI

A Visualized Framework for Event Cooperation with Generative Agents

Yuyang Tian, Shunqiang Mao, Wenchang Gao et al.

2026 AAAI

AgentSeer: Visualizing and Evaluating Temporal Actions in Agentic AI Systems

Ilham Wicaksono, Zekun Wu, Rahul Patel et al.

2026 AAAI

SPORTSQL: An Interactive System for Real-Time Sports Reasoning and Visualization

Sebastian Martinez, Naman Ahuja, Fenil Bardoliya et al.

2025 AACL

XL-DURel: Finetuning Sentence Transformers for Ordinal Word-in-Context Classification

Sachin Yadav, Dominik Schlechtweg

2025 AACL