Google刚刚发布了VideoPoet：多模态视频生成模型！

24 1 月, 2024 Tarogo Cloud AI项目

Google刚刚发布了VideoPoet：多模态视频生成模型！

Google刚刚发布了VideoPoet：多模态视频生成模型！

Watch this video on YouTube

它是大规模多模态的，可以作为输入：文本、图像、深度和光流或蒙版视频，并且是第一个生成视频+音频的模型之一！

更多信息如下 ⬇️ ⬇️

通过输入视频，无需任何文本提示，它就会为其生成可信的音频！

以上就是全部，原作者@alexcarliera

来看看剑桥大学开发的这个超赞的免费工具

12 5 月, 2024

AI项目多媒体处理

SAM模型视频分割项目

17 5 月, 2024

2024年的不容错过的课程

7 4 月, 2024

AI项目开源项目

H2O-Danube3：可以直接在手机上运行的开源模型

20 8 月, 2024

分類