作者: Tarogo Cloud - 第 42 頁 - Tarogo Cloud Bloger & Shop

AI项目

DragAPart，可以实现对输入图像内容的“拖动”

例如打开/关闭抽屉、开合电脑等。DragAPart 可以预测对象组件的交互，下图为我实测结果
这项研究的目标是迈向通用运动模型而非针对特定运动结构或对象类别的模型

15 4 月, 2024

AI项目 OpenAI

Alex Reben, 雕塑家艺术家，OpenAI 的驻地艺术家

Alexander Reben 这十年来致力于创作艺术作品，这些作品探讨了人工智能（AI）中人性的幽默与荒谬。
他通过手工将 AI 生成的图像转换成三维模型，并将这些模型具象化于现实世界中，创造出一系列雕塑作品。

14 4 月, 2024

AI项目 MicroSoft

SunoAI音乐新手指南

Suno创作音乐的小技巧：
如果你想参考某个现有歌曲的节奏，可以在这个网站查询歌曲的BPM和Key，作为提示词写进去。

14 4 月, 2024

AI项目

开源的服务：Linkwarden可以创建分类、标签

颜值还挺高，可以创建分类、标签，使用官方提供的浏览器扩展一键添加书签，最后还可以转换成图片、PDF、Readable 格式进行阅读或分享。

13 4 月, 2024

AI项目 Alphabet

Google Gemini API Cookbook

Google 官方Gemini API提供的指南和示例集合
帮助开发者更好地理解和使用Gemini API，包括如何构建应用程序、编写提示以及利用API的不同特性。

13 4 月, 2024

AI项目

Synclabs发布新版的唇型同步模型：Sync-1.6.0

新版模型进行了唇形同步升级，能够产生平滑、准确的唇形，同时减少视频帧之间的闪烁现象
SyncLabs构建了基于给定音频条件生成视频的音视频模型。

12 4 月, 2024

AI项目多媒体处理开源项目

VoiceCraft：官宣超过XTTS的语音模型

支持克隆音频，支持通过修改原始音频的文本来编辑音频，演示效果非常好，看起来很有潜力。

12 4 月, 2024

AI行业应用 AI项目多媒体处理

Gatekeep：一个新型的文本转视频 AI，专注与教学

它可以通过文本提示将数学、物理问题转换成视频内容
它会自动生成包括图表、图示、动画原理，还包含讲解内容的2分钟左右的视频。
能非常直观的帮助你了解一些知识和原理。

11 4 月, 2024

AI行业应用 AI项目多媒体处理

FRESCO这个视频转绘项目

FRESCO这个视频转绘项目的代码已经发布，也在项目页面发布了更多的演示，看起来相当稳定。

11 4 月, 2024

工具软件

Arc浏览器的Windows版本

终于更新了同步功能，这下Windows版本可以当成主力使用了。

现在还能设置Windows版本用云母还是亚克力材质的背景。

10 4 月, 2024

AI项目 Claude

创建最佳Claude3提示的代理

生成许多可能的提示
在排名锦标赛中测试他们
返回最好的一个

10 4 月, 2024

AI项目

适用于任何分辨率特征的模型无关框架

深层特征是计算机视觉研究的基石，它捕获图像语义并使社区即使在零样本或少样本情况下也能够解决下游任务。
然而，这些功能通常缺乏空间分辨率来直接执行分割和深度预测等密集预测任务，因为模型会积极地池化大区域的信息。

9 4 月, 2024

AI项目

可以直接通过文字描述让任何静态图动起来

而且能做各种动作，跳舞什么的都是小case…
最牛P的是，他们的模型能能理解真实世界的物理运动原理，所以出来的视频很真实。
不仅如此，它还能直接文字生成视频，进行各种角色混合和动作替换…

9 4 月, 2024

AI项目

令人兴奋的新研究警报-𝐏𝐢𝐱𝟐𝐏𝐢𝐱-𝐓𝐮𝐫𝐛𝐨

这些条件 GAN 能够采用文本到图像模型（例如 SD-Turbo），通过一步（A100 上为 0.11 秒，A6000 上为 0.29 秒）进行配对和不配对图像转换。尝试我们的代码和 @Gradio 演示。

8 4 月, 2024

AI项目

Creatie这个AI-UI设计工具

有点强啊，做的相当完整，基本上可以当做一个加上了 AI 功能的 FIgma。
而且全部都是免费的，AI 能力也很强，选择区域输入需求直接就会展示对应备选的组件，你可以自己拼装和修改，还能使用自己的设计系统。

8 4 月, 2024

网上课程

2024年的不容错过的课程

使用Python介绍计算机科学和编程。
Python机器学习
计算思维和数据科学导论。

7 4 月, 2024

Tarogo Cloud

DragAPart，可以实现对输入图像内容的“拖动”

Alex Reben, 雕塑家艺术家，OpenAI 的驻地艺术家

SunoAI音乐新手指南

开源的服务：Linkwarden可以创建分类、标签

Google Gemini API Cookbook

Synclabs发布新版的唇型同步模型：Sync-1.6.0

VoiceCraft：官宣超过XTTS的语音模型

Gatekeep：一个新型的文本转视频 AI，专注与教学

FRESCO这个视频转绘项目

Arc浏览器的Windows版本

创建最佳Claude3提示的代理

适用于任何分辨率特征的模型无关框架

可以直接通过文字描述让任何静态图动起来

令人兴奋的新研究警报-𝐏𝐢𝐱𝟐𝐏𝐢𝐱-𝐓𝐮𝐫𝐛𝐨

Creatie这个AI-UI设计工具

2024年的不容错过的课程

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email