描述:
WanX 2.1是阿里巴巴同益萬向團隊開發的前沿視頻生成模型,代表了人工智慧驅動視覺內容創作的重大突破。它不僅支持高質量的文本到視頻和圖像到視頻生成,而且在物理模擬、多語言支持和視覺一致性方面也表現出色。通過其開源計劃,WanX 2.1將為世界各地的開發人員提供強大的工具,以支持創意內容製作、教育和培訓、娛樂和營銷等多個領域的應用創新。
功能:
文本到視頻生成:支持從文本描述動態視頻生成,特別擅長將中文文本生成為視頻,滿足多語言需求。
圖像到視頻生成:它可以將靜態圖片轉換為動態視頻,並採用兩級生成技術確保對象一致性和多樣化的運動軌跡。
高質量產出:支持1080 P解析度,結合高效編碼/解碼和時空上下文建模,為視頻內容提供出色的視覺連續性。
物理模擬和特效:擅長模擬物理規律和生成複雜場景,例如粒子效果、動態光影等,以避免傳統模型中的肢體變形等問題。
多語言支持:不僅支持中文,還兼容多種語言,適合全球應用場景。
亮點:
出色的發電能力:以單一模式實現高質量的文本轉視頻和圖像轉視頻生成,顯著提高創意內容製作效率。
高效的計算性能:它基於VAE和DiT混合架構進行優化,將實時性能與高保真度相結合,降低了計算成本。
領先的基準性能:在VBench視頻生成基準中排名第二,超過了OpenAI的Sora和Adobe的CausVid等知名型號。
開源計劃:計劃於2025年第二季度開源,包括訓練數據集和輕量級工具包,以促進人工智慧社區的協作和創新。
資源:
博客:WanX 2.1詳細居間(https://agientry.com/blog/370)
在線體驗:擁抱臉空間(https://huggingface.co/spaces/WanX-AI/WanX2.1)
官方網站:通益萬向官方網站(https://tongyi.aliyun.com/wanxiang/wanxvideo)
輸油管: