可生成 1080p 清晰度和持续时间3-7 秒的视频。
分类: AI项目
AudioSep:可以使用自然语言进行声音提取分离的模型
AudioSep可以从任何混合的音频信号中提取出特定的声音成分并分离出来。与传统的声音分离模型不同,AudioSep允许用户通过自然语言描述来指定他们想要分离的声音。
HyperHuman:超现实人像图像生成模型
该模型生成的人体图像不仅逼真,而且具有高度的三维结构感,它能理解图像背后的三维结构。就像你不仅看到一个人,还能感知他站立的方式、面部的轮廓等。
SD-WebUI-AnimateDiff(v1.9.0)
更新了一个Prompt Travel 新功能。这个功能允许用户通过使用 ControlNet来进行文本提示(Prompt)驱动的图像生成和变换。
SEED:一个先进的图像标记器
该项目由腾讯AILab-CVC团队开发,SEED的主要功能是将图像转换为一系列离散的视觉代码(visual codes)。
Rerun是一个用于处理和可视化多模态数据流的通用框架
可以将(如图像、文本、声音等)等多模态的数据流可视化。目的是通过一系列工具和功能,使用户能够更直观和有效地查看、分析和理解这些来自不同源的数据流。
MetaEmu
一个先进的图像生成模型,专门设计用于生成高度美观的图像。
Claude.ai更方便
直接复制粘贴用户原始声音到Claude,写上Prompt让AI去扮演产品经理去整理反馈类型和用户痛点
维苏威挑战
这是一个旨在解读赫库兰尼姆古卷轴的比赛。
DocsGPT:一个开源的基于GPT模型的文档助手
可和任意文档进行聊天,可本地部署。在处理文本数据方面具有很高的准确性和灵活性。
BG-Remover:AI背景去除工具,一次可处理500张图
一个为设计师提供的背景去除工具,你只需上传图片,AI就会自动处理剩下的部分,一键去除背景。该工具支持JPG、PNG、WebP格式的图片,并允许一次性上传多达500张图片。
DALL-E3是游戏开发者的梦想成真
在 ChatGPT 中使用 DALL-E 3 可以高效工作。