MetaVoice-1B:高度真实和自然的文本到语音(TTS)转换模型
模型有1.2亿个参数,经过了10万小时的语音数据训练。
专注英语情感演讲
跨语言语音克隆
支持美国和英国声音的零样本克隆
支持长篇内容语音合成
模型有1.2亿个参数,经过了10万小时的语音数据训练。
专注英语情感演讲
跨语言语音克隆
支持美国和英国声音的零样本克隆
支持长篇内容语音合成
机器人初创公司@Figure_robot 发布了一段视频
他们家的Figure-01机器人现在可以自己煮咖啡了
这是一个使用了端到端的人工智能系统,仅通过观察人类制作咖啡的录像,10小时内学会了制作咖啡的技能。
报道披露了 OpenAI 和微软与人形机器人公司 Figure 的融资谈判。
此轮融资对Figure的估值接近$2B。
MedSAM是一种医学影像分割工具,它能够自动识别和描绘医学影像中的重要区域,比如肿瘤或其他组织的病变。
通过学习大量医学影像和对应的掩模(即正确的分割结果),它能够处理各种不同的医学影像和复杂情况。
它可以帮助医生更快、更准确地诊断疾病。
能够检测所有主要皮肤癌的AI医疗设备DermaSensor 刚刚获得FDA批准
该设备能检测三种最常见的皮肤癌:黑色素瘤、基底细胞癌和鳞状细胞癌。
在1000多名患者的研究中,DermaSensor在检测224例皮肤癌方面表现出高灵敏度,正确阳性率为96%
是通过对OpenAI的Whisper语音识别模型反向工程来实现的。
通过这种反转过程,WhisperSpeech能够接收文本输入,并利用修改后的Whisper模型生成听起来自然的语音输出。
输出的语音在发音准确性和自然度方面都非常的优秀。
增强现实(AR):SurgicalAR 使用增强现实技术,通过全息图像为医生提供手术过程中的视觉辅助。这种技术能够将3D图像直观地展示在医生的视野中,使他们能够更精确地定位和了解病人的内部结构。
人工智能(AI):SurgicalAR 结合了人工智能,特别是在图像处理和数据分析方面。AI能够帮助解析医学图像,提供更深入的诊断信息,并辅助医生制定更有效的手术计划。
Listen AS公司最新发布的MobileEars!
这是一款免费的iOS应用程序,通过它帮助轻度到中度听力损失患者在看电视或是在开会时听到较清晰的声音。
(注意:MobileEars类似于非处方的“个人声音放大装置”,不是助听器,也不能替代助听器。)
他们放出了一段机器人演示视频,可以实现波士顿动力液压人形机器人的后空翻功能;全长仅1分钟的视频包含了不少料:电驱人形机器人,直接吊起三名壮汉…
可以选择角色和设定,创建独特的AI生成故事。通过AI驱动的故事和个性化练习吸引学生阅读并提高阅读流畅度。
当你阅读时,语音转文本AI分析阅读流利性,检测学习者挑战的词汇,并记录阅读的准确性、速度和时间。
Circle to Search 就像是你手机上的一个魔法放大镜,你用它圈选屏幕上的东西,它就能告诉你更多相关信息,而且不用切换到别的应用。
一旦你圈选了某个物品,Google 会自动搜索相关信息,比如那副太阳镜的品牌或类似款式的购买选项。
Intuition Robotics的ElliQ机器人是一款由人工智能驱动的设备,可以识别和回应特定的人。
该机器人可以进行对话,公司还在探索其他基于人工智能的活动,如绘画和写诗,以“促进认知健康和创造力”。