开源项目

AI项目, 多媒体处理, 开源项目

Amphion：是一个开源工具包，可实现语音、声音和歌唱功能。

Tarogo Cloud / 19 1 月, 2024

除了文字转语音功能，它还能可以将一首歌的声音换成另一个歌手的声音。还支持声音转换、歌声合成、文本到音频、文本到音乐等功能！

AI项目, 开源项目

苹果发布了一个多模态大模型

Tarogo Cloud / 16 1 月, 2024

苹果12月14日释放了一个名为Ferret的多模态大语言模型，该模型不仅可以准确识别图像并描述其内容。

同时它还能够识别和定位图像中的各种元素，无论你用怎样的方式描述图像内容，Ferret都能准确地在图像中找到并识别出来。

AI项目, 开源项目

AppAgent：让AI模仿人类在手机上操作APP

Tarogo Cloud / 14 1 月, 2024

AppAgent可以通过自主学习和模仿人类的点击和滑动手势，能够在手机上执行各种任务。

AI项目, 开源项目

ComfyUI-Portrait-Master肖像大师，简体中文版来啦！

Tarogo Cloud / 10 1 月, 2024

超详细参数设置！再也不用为不会写人像提示词发愁啦！重新优化为json列表更方便自定义和扩展！已包含标准工作流和turbo工作流

AI项目, OpenAI, 开源项目

OpenAI公布了超级对齐项目一项最新研究成果，探索了一种新方法：

Tarogo Cloud / 8 1 月, 2024

这项研究的目的是为了解决一个问题：未来，当 AI 变得比人类更聪明时，人类如何能够有效地控制这些 AI。

three wise monkey decor

AI项目, 开源项目

VividTalk：单张照片+一段音频即可让照片说话

Tarogo Cloud / 30 12 月, 2023

你只需要提供一张人物的静态照片和一段语音录音，VividTalk就能将它们结合起来，制作出一个看起来像是实际说话的人物的视频。

AI项目, 多媒体处理, 开源项目

MetaAI发布实时人工智能语言翻译模型：Seamless

Tarogo Cloud / 21 12 月, 2023

这个模型统一了之前的三个Seamless系列模型，可以实时翻译100多种语言，延迟不到2秒钟，说话者仍在讲话时就开始翻译。

two women looking at the code at laptop

商品介绍, 开源项目

GitHub文件加速网站列表

Tarogo Cloud / 18 12 月, 2023

开始收集代理GitHub下载的网站，以备不时之需。

AI项目, 开源项目

GPT-Crawler ：一个开源的知识库自动爬虫工具

Tarogo Cloud / 12 12 月, 2023

它能从一个或多个网址爬取网站内容，然后生成JSON文件格式。

AI项目, 开源项目

微软推出仅需文本内容即可转成真人视频的工具：Deepfakes Creator

Tarogo Cloud / 9 12 月, 2023

该工具允许用户通过文本输入生成逼真的会说话的真人视频。你只要上传想要化身模仿的人的照片，并写一个剧本。

AI项目, 开源项目

大语言模型的幻觉排行榜

Tarogo Cloud / 5 12 月, 2023

榜单比较了不同大语言模型在总结短文档时产生幻觉（hallucination）的表现

AI项目, 开源项目

Draw-a-UI ：让你像画画一样设计网页。

Tarogo Cloud / 1 12 月, 2023

你只需在草图软件里随手画出你想要的网页界面，如简单的按钮或文本框，基本线框图