DexCap开源版经济版的Optimus
成本大约 $3,600,可以用来记录真人手指的动作来训练机器人进行灵活的操作。
并且不是遥控操作,它有一对特制的手套,通过各种传感器捕捉手部运动的精确数据。与传统基于视觉的运动捕捉技术相比,这些手套不会因为视线遮挡而失效,更适合在日常活动中使用。
成本大约 $3,600,可以用来记录真人手指的动作来训练机器人进行灵活的操作。
并且不是遥控操作,它有一对特制的手套,通过各种传感器捕捉手部运动的精确数据。与传统基于视觉的运动捕捉技术相比,这些手套不会因为视线遮挡而失效,更适合在日常活动中使用。
通过提供一个将自然语言查询转化为 Selenium 代码的引擎,LaVague 可让用户或其他人工智能轻松实现自动化,轻松表达网络工作流程并在浏览器上执行。
Human to Humanoid (H2O)由卡内基梅隆大学的研究团队开发,它允许人们通过一个简单的RGB摄像头让机器人实时模仿人的全部动作。
在你输入的指令后面加上 –cref URL,URL是你选择的角色图像的链接。
你还可以用 –cw 来调整参照的“强度”,范围从100到0。
默认的强度是100 (–cw 100),这时会参考人物的脸部、发型和衣着。
如果设置为强度0 (–cw 0),那么系统只会关注脸部(这对于更换服饰或发型很有帮助)。
能够通过文字提示创造出适用于各种场景的声音和音效
如游戏中的射击和跳跃声音、动画中的雨声环境以及视频中的地铁到站声音等。
基于 Llama2,从头开始训练。
许可 – 开源。
优化在 CPU 上运行。 🔥
高度可控,可选择节奏、和弦进行、小节范围等等!
Easy Scraper:一个在Chrome扩展,只需点击一下即可抓取任何网站的内容
支持导出CSV或JSON格式可以直接丢到ChatGPT里面进行简单分析,也可以作为GPTs的知识库。
这个工具目前完全免费,原因是开发者将在整个三月份参加沉默冥想闭关,没有时间添加付费计划。
这证明了 GPT-4V 作为通用移动 AI 代理的出色程度 – 无需任何微调或基础,仅通过与启用 JSON 模式的文本模型集成即可。
建议观看此演示,了解(可能)令人惊叹的因素以及使用 NavAIGuide 在 iOS 17 上的结果,
NavAIGuide 是 LLMs 的移动和 Web 导航代理框架