作者： Tarogo Cloud - 第 33 页 - Tarogo Cloud Bloger & Shop

Google Gemini API Cookbook

288

13 4 月, 20248 4 月, 2024

AI项目, Alphabet

Google 官方Gemini API提供的指南和示例集合帮助开发者更好地理解和使用Gemini API，包括如何构建应用程序、编写提示以及利用API的不同特性。

Synclabs发布新版的唇型同步模型：Sync-1.6.0

380

12 4 月, 20248 4 月, 2024

AI项目

新版模型进行了唇形同步升级，能够产生平滑、准确的唇形，同时减少视频帧之间的闪烁现象 SyncLabs构建了基于给定音频条件生成视频的音视频模型。

VoiceCraft：官宣超过XTTS的语音模型

302

12 4 月, 20248 6 月, 2024

AI项目, 多媒体处理

支持克隆音频，支持通过修改原始音频的文本来编辑音频，演示效果非常好，看起来很有潜力。

Gatekeep：一个新型的文本转视频 AI，专注与教学

286

11 4 月, 202429 8 月, 2024

AI行业应用, AI项目

它可以通过文本提示将数学、物理问题转换成视频内容它会自动生成包括图表、图示、动画原理，还包含讲解内容的2分钟左右的视频。能非常直观的帮助你了解一些知识和原理。

FRESCO这个视频转绘项目

313

11 4 月, 202429 8 月, 2024

AI行业应用, AI项目

FRESCO这个视频转绘项目的代码已经发布，也在项目页面发布了更多的演示，看起来相当稳定。

Arc浏览器的Windows版本

276

10 4 月, 20246 4 月, 2024

工具软件

终于更新了同步功能，这下Windows版本可以当成主力使用了。现在还能设置Windows版本用云母还是亚克力材质的背景。

创建最佳Claude3提示的代理

337

10 4 月, 20246 4 月, 2024

AI项目, Claude

生成许多可能的提示在排名锦标赛中测试他们返回最好的一个

适用于任何分辨率特征的模型无关框架

315

9 4 月, 20246 4 月, 2024

AI项目

深层特征是计算机视觉研究的基石，它捕获图像语义并使社区即使在零样本或少样本情况下也能够解决下游任务。然而，这些功能通常缺乏空间分辨率来直接执行分割和深度预测等密集预测任务，因为模型会积极地池化大区域的信息。

可以直接通过文字描述让任何静态图动起来

300

9 4 月, 20246 4 月, 2024

AI项目

而且能做各种动作，跳舞什么的都是小case... 最牛P的是，他们的模型能能理解真实世界的物理运动原理，所以出来的视频很真实。不仅如此，它还能直接文字生成视频，进行各种角色混合和动作替换...

令人兴奋的新研究警报-𝐏𝐢𝐱𝟐𝐏𝐢𝐱-𝐓𝐮𝐫𝐛𝐨

333

8 4 月, 20245 4 月, 2024

AI项目

这些条件 GAN 能够采用文本到图像模型（例如 SD-Turbo），通过一步（A100 上为 0.11 秒，A6000 上为 0.29 秒）进行配对和不配对图像转换。尝试我们的代码和 @Gradio 演示。

Creatie这个AI-UI设计工具

372

8 4 月, 20245 4 月, 2024

AI项目

有点强啊，做的相当完整，基本上可以当做一个加上了 AI 功能的 FIgma。而且全部都是免费的，AI 能力也很强，选择区域输入需求直接就会展示对应备选的组件，你可以自己拼装和修改，还能使用自己的设计系统。

2024年的不容错过的课程

417

7 4 月, 20244 4 月, 2024

网上课程

使用Python介绍计算机科学和编程。 Python机器学习计算思维和数据科学导论。

Open-Sora开源了

296

7 4 月, 202420 4 月, 2024

AI项目, OpenAI

包括完整的文本到视频模型训练过程、数据处理、训练细节和模型检查点。该项目由@YangYou1991 团队开发这是 OpenAI Sora 在视频生成方面的开源替代方案。可以在仅仅3天的训练后生成2~5秒的512x512视频。

基于真实果蝇行为训练的人工智能模型

324

6 4 月, 20243 4 月, 2024

AI项目

通过结合解剖学精确的模型、物理模拟器和基于真实果蝇行为训练的人工智能模型 @HHMIJanelia 和 @GoogleDeepMind 的科学家创造了一种计算机化昆虫，它能够像真实果蝇一样，在复杂的轨迹上行走和飞行。

OpenRouter：大语言模型“路由器”

424

6 4 月, 20243 4 月, 2024

AI项目

Openrouter提供了一个统一的接口，通过这个接口，你可以直接访问和使用几十种AI模型你可以使用这个接口对各种模型进行测试和比价，选择最适合自己的，避免了东奔西跑

Maisa推出的一种新型技术框架：KPU

269

5 4 月, 20242 4 月, 2024

AI项目

通过将推理与数据处理分开，优化和提升了大语言模型处理复杂任务的能力。使用KPU后，在多个基准测试和推理任务中GPT-4 、Claude 3 Opus等模型等能力得到大幅提升，都超越了没有使用KPU的原模型本身！