繁中

谷歌剛剛發布了VideoPoet:多模式視頻生成模型!

它是大規模多模式的,可用作輸入:文本、圖像、深度和光流或屏蔽視頻,是最早生成視頻+音頻的模型之一!

更多信息如下''️

通過輸入視頻,它會生成可信的音頻,而無需任何文本提示!

僅此而已,原作者@alexcarliera

返回頂端