Skip to content

Supported Matrix

Currently, cache-dit library supports almost Any Diffusion Transformers (with Transformer Blocks that match the specific Input and Output patterns). Please check πŸŽ‰Examples for more details. Here are just some of the tested models listed.

Transformers Optimization

One Model Series may contain many pipelines. cache-dit applies optimizations at the Transformer level; thus,any pipelines that include the supported transformer are already supported by cache-dit. βœ…: supported now; βœ–οΈ: not supported now; πŸ€–Q: nunchaku w/ SVDQ W4A4;

πŸ“šModels: πŸ€—70+ Hybrid Cache Context Parallel Tensor Parallel
FLUX.2-Klein-9b-kv βœ–οΈ βœ–οΈ βœ…
FLUX.2-Klein-4B βœ… βœ… βœ…
FLUX.2-Klein-base-4B βœ… βœ… βœ…
FLUX.2-Klein-9B βœ… βœ… βœ…
FLUX.2-Klein-base-9B βœ… βœ… βœ…
Helios-Base βœ… βœ… βœ…
Helios-Mid βœ… βœ… βœ…
Helios-Distilled βœ… βœ… βœ…
FireRed-Image-Edit-1.0 βœ… βœ… βœ…
FireRed-Image-Edit-1.1 βœ… βœ… βœ…
GLM-Image-T2I βœ… βœ–οΈ βœ…
GLM-Image-I2I βœ… βœ–οΈ βœ…
Z-Image βœ… βœ… βœ…
LTX-2-I2V βœ… βœ… βœ…
LTX-2-T2V βœ… βœ… βœ…
Qwen-Image-2512 βœ… βœ… βœ…
Z-Image-Turbo πŸ€–Q βœ… βœ… βœ–οΈ
Qwen-Image-Layered βœ… βœ… βœ…
Qwen-Image-Edit-2511-Lightning βœ… βœ… βœ…
Qwen-Image-Edit-2511 βœ… βœ… βœ…
LongCat-Image βœ… βœ… βœ…
LongCat-Image-Edit βœ… βœ… βœ…
Z-Image-Turbo βœ… βœ… βœ…
Z-Image-Turbo-Fun-ControlNet-2.0 βœ… βœ… βœ…
Z-Image-Turbo-Fun-ControlNet-2.1 βœ… βœ… βœ…
Ovis-Image βœ… βœ… βœ…
FLUX.2-dev βœ… βœ… βœ…
FLUX.1-dev βœ… βœ… βœ…
FLUX.1-Fill-dev βœ… βœ… βœ…
FLUX.1-Kontext-dev βœ… βœ… βœ…
Qwen-Image βœ… βœ… βœ…
Qwen-Image-Edit βœ… βœ… βœ…
Qwen-Image-Edit-2509 βœ… βœ… βœ…
Qwen-Image-ControlNet βœ… βœ… βœ…
Qwen-Image-ControlNet-Inpainting βœ… βœ… βœ…
Qwen-Image-Lightning βœ… βœ… βœ…
Qwen-Image-Edit-Lightning βœ… βœ… βœ…
Qwen-Image-Edit-2509-Lightning βœ… βœ… βœ…
Wan-2.2-T2V βœ… βœ… βœ…
Wan-2.2-I2V βœ… βœ… βœ…
Wan-2.2-VACE-Fun βœ… βœ… βœ…
Wan-2.1-T2V βœ… βœ… βœ…
Wan-2.1-I2V βœ… βœ… βœ…
Wan-2.1-FLF2V βœ… βœ… βœ…
Wan-2.1-VACE βœ… βœ… βœ…
HunyuanImage-2.1 βœ… βœ… βœ…
HunyuanVideo-1.5 βœ… βœ–οΈ βœ–οΈ
HunyuanVideo βœ… βœ… βœ…
FLUX.1-dev πŸ€–Q βœ… βœ… βœ–οΈ
FLUX.1-Fill-dev πŸ€–Q βœ… βœ… βœ–οΈ
FLUX.1-Kontext-dev πŸ€–Q βœ… βœ… βœ–οΈ
Qwen-Image πŸ€–Q βœ… βœ… βœ–οΈ
Qwen-Image-Edit πŸ€–Q βœ… βœ… βœ–οΈ
Qwen-Image-Edit-2509 πŸ€–Q βœ… βœ… βœ–οΈ
Qwen-Image-Lightning πŸ€–Q βœ… βœ… βœ–οΈ
Qwen-Image-Edit-Lightning πŸ€–Q βœ… βœ… βœ–οΈ
Qwen-Image-Edit-2509-Lightning πŸ€–Q βœ… βœ… βœ–οΈ
SkyReels-V2-T2V βœ… βœ… βœ…
LongCat-Video βœ… βœ–οΈ βœ–οΈ
ChronoEdit-14B βœ… βœ… βœ…
Kandinsky-5.0-T2V-Lite βœ… βœ…οΈ βœ…οΈ
PRX-512-t2i-sft βœ… βœ–οΈ βœ–οΈ
LTX-Video-v0.9.8 βœ… βœ… βœ…
LTX-Video-v0.9.7 βœ… βœ… βœ…
CogVideoX βœ… βœ… βœ…
CogVideoX-1.5 βœ… βœ… βœ…
CogView-4 βœ… βœ… βœ…
CogView-3-Plus βœ… βœ… βœ…
Chroma1-HD βœ… βœ… βœ…
PixArt-Sigma-XL-2-1024-MS βœ… βœ… βœ…
PixArt-XL-2-1024-MS βœ… βœ… βœ…
VisualCloze-512 βœ… βœ… βœ…
ConsisID-preview βœ… βœ… βœ…
mochi-1-preview βœ… βœ–οΈ βœ…
Lumina-Image-2.0 βœ… βœ–οΈ βœ…
HiDream-I1-Full βœ… βœ–οΈ βœ–οΈ
HunyuanDiT βœ… βœ–οΈ βœ…
Sana-1600M-1024px βœ… βœ–οΈ βœ–οΈ
DiT-XL-2-256 βœ… βœ… βœ–οΈ
Allegro-T2V βœ… βœ–οΈ βœ–οΈ
OmniGen-2 βœ… βœ–οΈ βœ–οΈ
stable-diffusion-3.5-large βœ… βœ–οΈ βœ…
Amused-512 βœ… βœ–οΈ βœ–οΈ
AuraFlow βœ… βœ–οΈ βœ–οΈ

Text Encoder & VAE Optimization

πŸ“šModels: πŸ€—70+ Text Encoder Parallel AutoEncoder(VAE) Parallel
FLUX.2-Klein-9b-kv βœ… βœ…
FLUX.2-Klein-4B βœ… βœ…
FLUX.2-Klein-base-4B βœ… βœ…
FLUX.2-Klein-9B βœ… βœ…
FLUX.2-Klein-base-9B βœ… βœ…
FLUX.2-dev βœ… βœ…
Helios-Base βœ… βœ…
Helios-Mid βœ… βœ…
Helios-Distilled βœ… βœ…
FireRed-Image-Edit-1.0 βœ… βœ…
FireRed-Image-Edit-1.1 βœ… βœ…
GLM-Image-T2I βœ–οΈ βœ…
GLM-Image-I2I βœ–οΈ βœ…
Z-Image βœ… βœ…
LTX-2-I2V βœ… βœ…
LTX-2-T2V βœ… βœ…
Qwen-Image-2512 βœ… βœ…
Z-Image-Turbo πŸ€–Q βœ… βœ…
Qwen-Image-Layered βœ… βœ…
Qwen-Image-Edit-2511-Lightning βœ… βœ…
Qwen-Image-Edit-2511 βœ… βœ…
LongCat-Image βœ… βœ…
LongCat-Image-Edit βœ… βœ…
Z-Image-Turbo βœ… βœ…
Z-Image-Turbo-Fun-ControlNet-2.0 βœ… βœ…
Z-Image-Turbo-Fun-ControlNet-2.1 βœ… βœ…
Ovis-Image βœ… βœ…
FLUX.1-dev βœ… βœ…
FLUX.1-Fill-dev βœ… βœ…
FLUX.1-Kontext-dev βœ… βœ…
Qwen-Image βœ… βœ…
Qwen-Image-Edit βœ… βœ…
Qwen-Image-Edit-2509 βœ… βœ…
Qwen-Image-ControlNet βœ… βœ…
Qwen-Image-ControlNet-Inpainting βœ… βœ…
Qwen-Image-Lightning βœ… βœ…
Qwen-Image-Edit-Lightning βœ… βœ…
Qwen-Image-Edit-2509-Lightning βœ… βœ…
Wan-2.2-T2V βœ… βœ…
Wan-2.2-I2V βœ… βœ…
Wan-2.2-VACE-Fun βœ… βœ…
Wan-2.1-T2V βœ… βœ…
Wan-2.1-I2V βœ… βœ…
Wan-2.1-FLF2V βœ… βœ…
Wan-2.1-VACE βœ… βœ…
HunyuanImage-2.1 βœ… βœ–οΈ
HunyuanVideo-1.5 βœ… βœ–οΈ
HunyuanVideo βœ… βœ…
FLUX.1-dev πŸ€–Q βœ… βœ…
FLUX.1-Fill-dev πŸ€–Q βœ… βœ…
FLUX.1-Kontext-dev πŸ€–Q βœ… βœ…
Qwen-Image πŸ€–Q βœ… βœ…
Qwen-Image-Edit πŸ€–Q βœ… βœ…
Qwen-Image-Edit-2509 πŸ€–Q βœ… βœ…
Qwen-Image-Lightning πŸ€–Q βœ… βœ…
Qwen-Image-Edit-Lightning πŸ€–Q βœ… βœ…
Qwen-Image-Edit-2509-Lightning πŸ€–Q βœ… βœ…
SkyReels-V2-T2V βœ… βœ…
ChronoEdit-14B βœ… βœ…
Kandinsky-5.0-T2V-Lite βœ… βœ…
PRX-512-t2i-sft βœ… βœ–οΈ
LTX-Video-v0.9.8 βœ… βœ–οΈ
LTX-Video-v0.9.7 βœ… βœ–οΈ
CogVideoX βœ… βœ–οΈ
CogVideoX-1.5 βœ… βœ–οΈ
CogView-4 βœ… βœ…
CogView-3-Plus βœ… βœ…
Chroma1-HD βœ… βœ…
PixArt-Sigma-XL-2-1024-MS βœ… βœ…
PixArt-XL-2-1024-MS βœ… βœ…
VisualCloze-512 βœ… βœ…
ConsisID-preview βœ… βœ–οΈ
mochi-1-preview βœ… βœ–οΈ
Lumina-Image-2.0 βœ… βœ…
HiDream-I1-Full βœ… βœ…
HunyuanDiT βœ… βœ…
Sana-1600M-1024px βœ… βœ–οΈ
DiT-XL-2-256 βœ… βœ…
Allegro-T2V βœ… βœ–οΈ
OmniGen-2 βœ… βœ…
stable-diffusion-3.5-large βœ–οΈ βœ…
Amused-512 βœ… βœ–οΈ
AuraFlow βœ… βœ…

ControlNet Optimization

Models ControlNet Parallel
Z-Image-Turbo-Fun-ControlNet-2.0 βœ…
Z-Image-Turbo-Fun-ControlNet-2.1 βœ…
Qwen-Image-ControlNet TODO
Qwen-Image-ControlNet-Inpainting TODO