ZeroComp: Zero-Shot Object Compositing from Image Intrinsics via Diffusion

Zitian Zhang; Frédéric Fortier-Chouinard; Mathieu Garon; Anand Bhattad; Jean-Francois Lalonde

2025 WACV WACV 2025

ZeroComp: Zero-Shot Object Compositing from Image Intrinsics via Diffusion

Abstract

We present ZeroComp an effective zero-shot 3D object compositing approach that does not require paired composite-scene images during training. Our method leverages ControlNet to condition from intrinsic images and combines it with a Stable Diffusion model to utilize its scene priors together operating as an effective rendering engine. During training ZeroComp uses intrinsic images based on geometry albedo and masked shading all without the need for paired images of scenes with and without composite objects. Once trained it seamlessly integrates virtual 3D objects into scenes adjusting shading to create realistic composites. We develop a high-quality evaluation dataset and demonstrate that ZeroComp outperforms methods using explicit lighting estimations and generative techniques in quantitative and human perception benchmarks. Additionally ZeroComp extends to real and outdoor image compositing even when trained solely on synthetic indoor data showcasing its effectiveness in image compositing.

🌉 Interdisciplinary Bridge — Computer Vision and Deep Learning and Machine Learning

🧭 Keyword Pioneer — image intrinsics

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Zitian Zhang , Frédéric Fortier-Chouinard , Mathieu Garon , Anand Bhattad , Jean-Francois Lalonde

Topics

Machine Learning > Learning Types > Zero-Shot Learning Deep Learning > Models > Diffusion Models Computer Vision > Generation > Image Generation

Keywords

zero-shot learning diffusion model image composition intrinsic image object compositing image intrinsics 3d object insertion zero-shot object compositing

Download PDF

Related papers

Neural Graph Map: Dense Mapping with Efficient Loop Closure Integration 2025

ELMGS: Enhancing Memory and Computation Scalability through Compression for 3D Gaussian Splatting 2025

Feature Fusion Transferability Aware Transformer for Unsupervised Domain Adaptation 2025

Uncertainty-Aware Online Extrinsic Calibration: A Conformal Prediction Approach 2025

Disentangling Spatio-Temporal Knowledge for Weakly Supervised Object Detection and Segmentation in Surgical Video 2025