AI项目, 开源项目

Media2Face:通过语音合成3D面部画面

Media2Face能够根据声音来生成与语音同步的、表现力丰富的3D面部动画。

同时允许用户对生成的面部动画进行更细致的个性化调整,如情感调整,“快乐”或“悲伤”等。

它还能理解多种类型的输入信息(音频、文本、图像),并将这些信息作为生成面部动画的指引。

AI项目

Lumiere:一次性生成整个视频

Google Research团队开发的基于空间时间的文本到视频扩散模型。

它采用了创新的空间时间U-Net架构,能够一次性生成整个视频的时间长度,不同于其他模型那样逐帧合成视频。

确保了生成视频的连贯性和逼真度。

滚动至顶部