分类： AI行业应用 - 第 25 页 - Tarogo Cloud Bloger & Shop

AI项目, 多媒体处理, 开源项目

MetaVoice-1B：高度真实和自然的文本到语音（TTS）转换模型

Tarogo Cloud / 27 2 月, 2024

模型有1.2亿个参数，经过了10万小时的语音数据训练。

专注英语情感演讲
跨语言语音克隆
支持美国和英国声音的零样本克隆
支持长篇内容语音合成

AI项目, 机器人

机器人技术即将迎来它的ChatGPT时刻

Tarogo Cloud / 22 2 月, 2024

机器人初创公司@Figure_robot 发布了一段视频

他们家的Figure-01机器人现在可以自己煮咖啡了

这是一个使用了端到端的人工智能系统，仅通过观察人类制作咖啡的录像，10小时内学会了制作咖啡的技能。

AI项目, OpenAI, 机器人

OpenAI 和微软正在洽谈支持人形机器人公司Figure

Tarogo Cloud / 22 2 月, 2024

报道披露了 OpenAI 和微软与人形机器人公司 Figure 的融资谈判。
此轮融资对Figure的估值接近$2B。

AI项目, 医疗AI, 开源项目

MedSAM：通用医学影像分割模型

Tarogo Cloud / 16 2 月, 2024

MedSAM是一种医学影像分割工具，它能够自动识别和描绘医学影像中的重要区域，比如肿瘤或其他组织的病变。

通过学习大量医学影像和对应的掩模（即正确的分割结果），它能够处理各种不同的医学影像和复杂情况。

它可以帮助医生更快、更准确地诊断疾病。

AI项目, 医疗AI

AI医疗设备DermaSensor 刚刚获得FDA批准

Tarogo Cloud / 12 2 月, 2024

能够检测所有主要皮肤癌的AI医疗设备DermaSensor 刚刚获得FDA批准

该设备能检测三种最常见的皮肤癌：黑色素瘤、基底细胞癌和鳞状细胞癌。

在1000多名患者的研究中，DermaSensor在检测224例皮肤癌方面表现出高灵敏度，正确阳性率为96%

AI项目, 多媒体处理, 开源项目

WhisperSpeech：一个开源的文本到语音系统

Tarogo Cloud / 12 2 月, 2024

是通过对OpenAI的Whisper语音识别模型反向工程来实现的。

通过这种反转过程，WhisperSpeech能够接收文本输入，并利用修改后的Whisper模型生成听起来自然的语音输出。

输出的语音在发音准确性和自然度方面都非常的优秀。

AI项目, 医疗AI

Medivis SurgicalAR ：由AI驱动的增强现实手术平台

Tarogo Cloud / 11 2 月, 2024

增强现实（AR）：SurgicalAR 使用增强现实技术，通过全息图像为医生提供手术过程中的视觉辅助。这种技术能够将3D图像直观地展示在医生的视野中，使他们能够更精确地定位和了解病人的内部结构。
人工智能（AI）：SurgicalAR 结合了人工智能，特别是在图像处理和数据分析方面。AI能够帮助解析医学图像，提供更深入的诊断信息，并辅助医生制定更有效的手术计划。