作者: Tarogo Cloud - 第 46 頁 - Tarogo Cloud Bloger & Shop

YOLOv8：目标检测跟踪模型

YOLOv8能够在图像或视频帧中快速准确地识别和定位多个对象，还能跟踪它们的移动，并将其分类。
除了检测对象，YOLOv8还可以区分对象的确切轮廓，进行实例分割、估计人体的姿态、帮助识别和分析医学影像中的特定模式等多种计算机视觉任务。

13 3 月, 2024

UMI：斯坦福开发的一个机器人数据收集和策略学习框架

UMI可以将人类在复杂环境下的操作技能直接转移给机器人，无需人类编写详细的编程指令。
也就是通过人类亲自操作演示然后收集数据，直接转移到机器人身上，使得机器人能够快速学习新任务
UMI整合了精心设计的策略接口，包括推理时延匹配和相对轨迹动作表示，使得学习到的策略不受硬件限制，可跨多个机器人平台部署。

13 3 月, 2024

居家小招

卧室门总是发出嘎吱声，要怎么办呢？

在转轴缝隙里喷了几下，第二天效果非常明显，第三天转动更顺滑，估计渗透需要一定的时间。这种产品叫“防锈润滑剂”，

13 3 月, 2024

AI项目

Stability AI 的 Stable Video官网正式上线

支持上传图片和文字提示生成视频
从官网提供的演示视频来看，质量非常高，是Runway的强有力竞争者。
支持通过相机运动来控制视频的生成过程。

12 3 月, 2024

AI行业应用 AI项目多媒体处理

Google的一个新的视频模型：VideoPoet

它可以根据文字描述来生成视频。但它不是基于扩散模型，而本身就是个LLM，可以理解和处理多模态信息，并将它们融合到视频生成过程中。
不仅能生成视频，还能给视频加上风格化的效果，还可修复和扩展视频，甚至从视频中生成音频。
一条龙服务…
例如，VideoPoet 可以根据文本描述生成视频，或者将一张静态图片转换成动态视频。它还能理解和生成音频，甚至是编写用于视频处理的代码。

12 3 月, 2024

医药知识

服用失眠药“思诺思”要注意的几个事项

首先，思诺思，赛诺菲出品。全名酒石酸唑吡坦片，一般用来治那些偶尔睡不好，或者暂时性失眠的人。

12 3 月, 2024

医药知识

如何早期识别阿尔茨海默症

生活中的老年人经常有这样的经历，出门后总想不起来自己有没有锁门，有些东西每天都在用却想不起来它叫什么，甚至有时候会忘记了回家的路……小心，这些可能都是阿尔茨海默症（AD）的征兆，它就好比脑海中的“橡皮擦”，会将记忆一点点擦除，严重威胁老年人健康。

12 3 月, 2024

AI项目 OpenAI 开源项目

OpenAI推出的一音乐生成模型：Jukebox

OpenAI在2019年8月份就推出了他们的一音乐生成模型：Jukebox
Jukebox能够根据提供的歌词、艺术家和流派信息生成多种流派和艺术家风格的完整音乐和人声歌曲。

最牛P的是，3年前的质量就已经这样了…

而且据说Jukebox 2即将发布

11 3 月, 2024

AI项目

Groq 最近的硬件突破疯传

Groq（不是 Grok）使用 LPU 而不是 GPU，允许聊天机器人以几乎瞬时的响应时间运行 LLMs。
这开启了一个充满潜在人工智能和用户体验的全新世界。

11 3 月, 2024

AI项目开源项目

OOTDiffusion：一个高度可控的虚拟服装试穿开源工具

可以根据不同性别和体型自动调整，和模特非常贴合。也可以根据自己的需求和偏好调整试穿效果

OOTDiffusion支持半身模型和全身模型两种模式。

10 3 月, 2024

AI项目开源项目

AnyGPT：任意模态到任意多模态的大语言模型

通过连接大语言模型与多模态适配器和扩散解码器，AnyGPT实现了对各种模态输入的理解和能够在任意模态中生成输出的能力。
也就是可以处理任何组合的模态输入（如文本、图像、视频、音频），并生成任何模态的输出…
实现了真正的多模态通信能力。
这个项目之前叫NExT-GPT

10 3 月, 2024

AI项目开源项目

PixelPlayer：MIT研究团队开发的项目

能自动从视频中识别和分离出不同的声音源，并与画面位置匹配。
例如，它可以识别出视频中哪个人物正在说话或哪个乐器正在被演奏。
而且还能够分别提取和分离这些声音源的声音。
PixelPlayer能自我学习分析，无需人工标注数据。
这种能力为音视频编辑、多媒体内容制作、增强现实应用等领域提供了强大的工具，使得例如独立调整视频中不同声音源音量、去除或增强特定声音源等操作成为可能。

9 3 月, 2024

AI项目

利用Groq可以实现实时AI对话

将运行在 Groq 上的 Llama-70B 模型与 Whisper 模型结合，实现了几乎零延迟的性能。

如果在GPT 4或者未来更高版本GPT 5能实现这速度，想象空间很大，几乎秒级就能写一本书出来，AI实时通话都不是问题！

9 3 月, 2024

润土生活

加拿大建筑电工、工业电工及高级电工证书的区别

加拿大，电工作为Trade行业中的一员，一直以就业情况良好，工资收入较高而深受广大技术移民的青睐。想在安省从事电工行业，电工证书是一块最好的职业生涯敲门砖。
电工行业的证书分别有：建筑电工，工业电工，农村电工和高级电工证书。

9 3 月, 2024

润土生活

电工在加拿大非常受欢迎

电工在加拿大非常受欢迎，有些硕士博士觉得自己的工作岗位没有什么前途，都转向电工岗位，加拿大电工的收入：根据2020年加拿大电工协会统计，建筑电工平均年收入为10.6万加币，工业电工年收入为12.1万加币，建筑电工每小时约为35-40加币左右，工业电工每小时为45-50加币左右

9 3 月, 2024

AI项目开源项目

UFO：由微软开发的专注于Windows操作系统交互的UI代理

它可以通过理解用户的自然语言指令和屏幕的视觉内容，自动执行一系列复杂的任务。

比如“删除Word文档中的所有图片”或“在PowerPoint文稿中添加一个新幻灯片”。

它结合了GPT 4-V，能够理解和Windows应用程序的图形用户界面（GUI）并执行操作。

UFO能够在Windows应用程序中执行各种操作，如点击按钮、填写表单、浏览文件等，就好像一个人在使用鼠标和键盘操作电脑一样。

8 3 月, 2024

Tarogo Cloud

YOLOv8：目标检测跟踪模型

UMI：斯坦福开发的一个机器人数据收集和策略学习框架

卧室门总是发出嘎吱声，要怎么办呢？

Stability AI 的 Stable Video官网正式上线

Google的一个新的视频模型：VideoPoet

服用失眠药“思诺思”要注意的几个事项

如何早期识别阿尔茨海默症

OpenAI推出的一音乐生成模型：Jukebox

Groq 最近的硬件突破疯传

OOTDiffusion：一个高度可控的虚拟服装试穿开源工具

AnyGPT：任意模态到任意多模态的大语言模型

PixelPlayer：MIT研究团队开发的项目

利用Groq可以实现实时AI对话

加拿大建筑电工、工业电工及高级电工证书的区别

电工在加拿大非常受欢迎

UFO：由微软开发的专注于Windows操作系统交互的UI代理

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email