TurboFill: Adapting Few-step Text-to-image Model for Fast Image Inpainting

Liangbin Xie; Daniil Pakhomov; Zhonghao Wang; Zongze Wu; Ziyan Chen; Yuqian Zhou; Haitian Zheng; Zhifei Zhang; Zhe Lin; Jiantao Zhou; Chao Dong

2025 CVPR CVPR 2025

TurboFill: Adapting Few-step Text-to-image Model for Fast Image Inpainting

Abstract

This paper introduces TurboFill, a fast image inpainting model that enhances a few-step text-to-image diffusion model with an inpainting adapter for high-quality and efficient inpainting. While standard diffusion models generate high-quality results, they incur high computational costs. We overcome this by training an inpainting adapter on a few-step distilled text-to-image model, DMD2, using a novel 3-step adversarial training scheme to ensure realistic, structurally consistent, and visually harmonious inpainted regions. To evaluate TurboFill, we propose two benchmarks: DilationBench, which tests performance across mask sizes, and HumanBench, based on human feedback for complex prompts. Experiments show that TurboFill outperforms both multi-step BrushNet and few-step inpainting methods, setting a new benchmark for high-performance inpainting tasks. The project page is available \href https://liangbinxie.github.io/projects/TurboFill/ here

🌉 Interdisciplinary Bridge — Computer Vision and Deep Learning and Machine Learning

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Liangbin Xie , Daniil Pakhomov , Zhonghao Wang , Zongze Wu , Ziyan Chen , Yuqian Zhou , Haitian Zheng , Zhifei Zhang , Zhe Lin , Jiantao Zhou , Chao Dong

Topics

Machine Learning > Application Areas > Efficient Computing Deep Learning > Models > Diffusion Models Computer Vision > Generation > Image Generation Deep Learning > Techniques > Transfer Learning

Keywords

image generation knowledge distillation adversarial training model adaptation image inpainting diffusion model text-to-image diffusion few-step generation model adapter

Download PDF

Related papers

AnyCam: Learning to Recover Camera Poses and Intrinsics from Casual Videos 2025

SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding 2025

FADE: Frequency-Aware Diffusion Model Factorization for Video Editing 2025

Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning 2025

Reversible Decoupling Network for Single Image Reflection Removal 2025