Wan21是一個開源的AI視頻生成模型

基於阿里巴巴開源模式的人工智慧視頻生成平台可以通過簡單的文本或圖像輸入快速生成高質量的視頻。
只需選擇輸入法、描述或上傳內容，然後點擊生成按鈕，即可在幾秒鐘內獲取專業品質的視頻並下載多種格式。

什麼是Wan 2.1？

Wan 2.1 它是阿里巴巴團隊開源的先進人工智慧視頻生成模型系列，用於從文本或圖片生成高質量視頻內容
它支持多項任務，不僅包括：
- 文本生成視頻（文本轉視頻，T2 V）
- 圖像生成視頻（圖像到視頻，I2V）
- 還包括 視頻編輯、文本生成圖像(T2I)和 視頻生成音頻(V2A)功能
它是一個開源項目，並在Apache-2.0許可下發布。代碼和模型權重可以在GitHub、Hugging Face等平台上下載，支持二次開發和部署。

領先的性能：Wan 2.1在多個基準測試上優於現有開源模型和部分商業模型，屬於SOTA（最先進）級別。
硬體友好：T2 V-1.3B型號僅需要約8 GB的VRAM（例如RTX 3060 Ti等消費級圖形處理器）;在RTX 4090上生成5秒的480 p視頻大約需要4分鐘。
多輸入輸出模式：兼容文本和圖片作為輸入，支持480 p、720 p甚至最高1080 p視頻的生成。
Wan-VAE框架：採用3D變分自動編碼器（VAE）以確保高效的視頻壓縮和呈現，並考慮時間維度的連續性。
雙語文本生成功能：Wan 2.1是第一個可以在生成的視頻（如廣告牌，字幕等）中準確呈現中英文文本的模型。
強大的多模式兼容性：不僅支持視頻編輯，還可以執行視頻到圖像和音頻生成任務

官方網站中文版突出了多種使用場景，涵蓋創意領域到工業應用：

使用過程非常簡潔，通常分三個步驟完成：選擇模式（文本或圖像）、輸入描述或上傳圖像、點擊「生成」並下載視頻（MP4、GIF、WebM支持）。

輸油管：