Wan AI 是一款由 Tongyi Lab 開發的先進視覺生成模型,專注於將文字、圖像等控制信號轉化為視頻內容。其 Wan 2.1 系列模型已全面開源,為用戶帶來了前所未有的視頻生成體驗。

Wan 2.1 在多個領域表現卓越,無論是文字到視頻、圖像到視頻,還是視頻剪輯、文字生成以及視頻到音頻等任務,都能輕鬆應對。它支持消費者級 GPU,其中 T2V-1.3B 模型僅需 8.19 GB VRAM,即可在 RTX 4090 上生成 5 秒 480P 視頻,速度之快令人驚嘆。
此外,Wan 2.1 還能生成逼真的複雜動作、精確的物理模擬以及電影級別的畫質,並支持多語言文本生成,讓全球用戶都能輕鬆使用。其開源的 Wan2.1-I2V-14B 模型在性能上更是超越了市面上的大多數模型,為視頻生成領域樹立了新的標桿。