Morph-Studio:推出了文本转视频新模型
可生成 1080p 清晰度和持续时间3-7 秒的视频。
AudioSep可以从任何混合的音频信号中提取出特定的声音成分并分离出来。与传统的声音分离模型不同,AudioSep允许用户通过自然语言描述来指定他们想要分离的声音。
该模型生成的人体图像不仅逼真,而且具有高度的三维结构感,它能理解图像背后的三维结构。就像你不仅看到一个人,还能感知他站立的方式、面部的轮廓等。
更新了一个Prompt Travel 新功能。这个功能允许用户通过使用 ControlNet来进行文本提示(Prompt)驱动的图像生成和变换。
可以将(如图像、文本、声音等)等多模态的数据流可视化。目的是通过一系列工具和功能,使用户能够更直观和有效地查看、分析和理解这些来自不同源的数据流。