ViBT

ViBT: Vision Bridge Transformer at Scale
Zhenxiong Tan, Zeqing Wang, Xingyi Yang, Songhua Liu, Xinchao Wang
xML Lab, National University of Singapore; The Hong Kong Polytechnic University; Shanghai Jiao Tong University

Features

Bridge formulation: Data-to-data trajectories between inputs and outputs instead of noise-to-data diffusion.
Scaled transformers: 20B and 1.3B parameter ViBT variants for image/video translation.
Stabilized training: Variance-stabilized velocity-matching objective for robust large-model optimization.
Fast inference: Removal of conditional tokens yields up to 4× faster runs versus token-heavy baselines.

Quick Start

Setup (Optional)

Environment

conda create -n ViBT python=3.12
conda activate ViBT

Install requirements

pip install -e .

Examples

Image instruction-based editing and stylization: examples/image_stylization.ipynb
Video stylization: examples/video_stylization.ipynb
Video colorization: examples/video_colorization.ipynb
Video frame interpolation: examples/video_frame_interpolation.ipynb

Models and Training

We keep different models for image and video tasks.

Image tasks (stylization, editing) are trained on Qwen-Image-Editing.
Video tasks (stylization, depth-to-video, colorization, frame interpolation) are trained on Wan2.1 1.3B.

Training code is under development; we will add full instructions once released.

BibTeX

@article{tan2025vision,
  title={Vision Bridge Transformer at Scale},
  author={Tan, Zhenxiong and Wang, Zeqing and Yang, Xingyi and Liu, Songhua and Wang, Xinchao},
  journal={arXiv preprint arXiv:2511.23199},
  year={2025}
}

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
assets		assets
examples		examples
train		train
vibt		vibt
.gitignore		.gitignore
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ViBT

Features

Quick Start

Setup (Optional)

Examples

Models and Training

BibTeX

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ViBT

Features

Quick Start

Setup (Optional)

Examples

Models and Training

BibTeX

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages