作者: Tarogo Cloud

3D视觉-语言-动作生成世界模型

最近的视觉-语言-动作 (VLA) 模型依赖于 2D 输入,缺乏与更广泛的 3D 物理世界领域的集成。此外,他们通过学习直接映射来执行动作预测

Musepro这个iPad应用看起来是真的可用

与其他画笔快速生成图片的尴尬应用不同,Musepro这个iPad 应用看起来是真的可用。借助 iPad 搭配的 Apple Pencil以及内置的丰富笔刷,应该可以极大的提高画图效率。

DexCap开源版经济版的Optimus

成本大约 $3,600,可以用来记录真人手指的动作来训练机器人进行灵活的操作。 并且不是遥控操作,它有一对特制的手套,通过各种传感器捕捉手部运动的精确数据。与传统基于视觉的运动捕捉技术相比,这些手套不会因为视线遮挡而失效,更适合在日常活动中使用。

几个AI免费的在线课程

→ 与大学合作提供AI课程。 → 你可以获得来自知名学府的证书。 → 课程种类齐全,适合初学者到专家级学习。

Midjourney角色一致性功能发布

在你输入的指令后面加上 --cref URL,URL是你选择的角色图像的链接。 你还可以用 --cw 来调整参照的“强度”,范围从100到0。 默认的强度是100 (--cw 100),这时会参考人物的脸部、发型和衣着。 如果设置为强度0 (--cw...

Easy ScraperChrome扩展,可抓取任何网站的内容

Easy Scraper:一个在Chrome扩展,只需点击一下即可抓取任何网站的内容 支持导出CSV或JSON格式可以直接丢到ChatGPT里面进行简单分析,也可以作为GPTs的知识库。 这个工具目前完全免费,原因是开发者将在整个三月份参加沉默冥想闭关,没有时间添加付费计划。

AI开源项目:NavAIGuide-TS

这证明了 GPT-4V 作为通用移动 AI 代理的出色程度 - 无需任何微调或基础,仅通过与启用 JSON 模式的文本模型集成即可。 建议观看此演示,了解(可能)令人惊叹的因素以及使用 NavAIGuide 在 iOS 17 上的结果, NavAIGuide 是 LLMs 的移动和 Web...

退出移动版