卡内基梅隆大学和苏黎世联邦理工学院的研究人员正在帮助机器人变得敏捷、快速和安全。 新框架允许以近 7 英里/小时的速度在杂乱的空间中导航而不会发生碰撞。
分类: AI行业应用
MetaVoice-1B:高度真实和自然的文本到语音(TTS)转换模型
模型有1.2亿个参数,经过了10万小时的语音数据训练。 专注英语情感演讲 跨语言语音克隆 支持美国和英国声音的零样本克隆 支持长篇内容语音合成
机器人技术即将迎来它的ChatGPT时刻
机器人初创公司@Figure_robot 发布了一段视频 他们家的Figure-01机器人现在可以自己煮咖啡了 这是一个使用了端到端的人工智能系统,仅通过观察人类制作咖啡的录像,10小时内学会了制作咖啡的技能。
OpenAI 和微软正在洽谈支持人形机器人公司Figure
报道披露了 OpenAI 和微软与人形机器人公司 Figure 的融资谈判。 此轮融资对Figure的估值接近$2B。
MedSAM:通用医学影像分割模型
MedSAM是一种医学影像分割工具,它能够自动识别和描绘医学影像中的重要区域,比如肿瘤或其他组织的病变。 通过学习大量医学影像和对应的掩模(即正确的分割结果),它能够处理各种不同的医学影像和复杂情况。 它可以帮助医生更快、更准确地诊断疾病。
AI医疗设备DermaSensor 刚刚获得FDA批准
能够检测所有主要皮肤癌的AI医疗设备DermaSensor 刚刚获得FDA批准 该设备能检测三种最常见的皮肤癌:黑色素瘤、基底细胞癌和鳞状细胞癌。 在1000多名患者的研究中,DermaSensor在检测224例皮肤癌方面表现出高灵敏度,正确阳性率为96%
WhisperSpeech:一个开源的文本到语音系统
是通过对OpenAI的Whisper语音识别模型反向工程来实现的。 通过这种反转过程,WhisperSpeech能够接收文本输入,并利用修改后的Whisper模型生成听起来自然的语音输出。 输出的语音在发音准确性和自然度方面都非常的优秀。
Medivis SurgicalAR :由AI驱动的增强现实手术平台
增强现实(AR):SurgicalAR 使用增强现实技术,通过全息图像为医生提供手术过程中的视觉辅助。这种技术能够将3D图像直观地展示在医生的视野中,使他们能够更精确地定位和了解病人的内部结构。 人工智能(AI):SurgicalAR...
手机也可以当“助听器”使用
Listen AS公司最新发布的MobileEars! 这是一款免费的iOS应用程序,通过它帮助轻度到中度听力损失患者在看电视或是在开会时听到较清晰的声音。 (注意:MobileEars类似于非处方的“个人声音放大装置”,不是助听器,也不能替代助听器。)
一家今年刚成立的机器人创业公司:MagicLab
他们放出了一段机器人演示视频,可以实现波士顿动力液压人形机器人的后空翻功能;全长仅1分钟的视频包含了不少料:电驱人形机器人,直接吊起三名壮汉...
微软推出针对学生的AI阅读教练工具:Reading Coach
可以选择角色和设定,创建独特的AI生成故事。通过AI驱动的故事和个性化练习吸引学生阅读并提高阅读流畅度。 当你阅读时,语音转文本AI分析阅读流利性,检测学习者挑战的词汇,并记录阅读的准确性、速度和时间。
Google 推出 Circle to Search 划圈搜索
Circle to Search 就像是你手机上的一个魔法放大镜,你用它圈选屏幕上的东西,它就能告诉你更多相关信息,而且不用切换到别的应用。 一旦你圈选了某个物品,Google 会自动搜索相关信息,比如那副太阳镜的品牌或类似款式的购买选项。
ElliQ3老年护理机器人进行硬件升级
Intuition Robotics的ElliQ机器人是一款由人工智能驱动的设备,可以识别和回应特定的人。 该机器人可以进行对话,公司还在探索其他基于人工智能的活动,如绘画和写诗,以“促进认知健康和创造力”。
三星在 2024 年的CES上发布了Ballie
这个机器人伴侣可以执行命令、拨打电话,还能投影到地板、墙壁和天花板上。 大众汽车刚刚透露,它将把 ChatGPT Voice 引入新车型中。
Mobile ALOHA:一个可以模仿人类自主学习的机器人操作系统。
可以通过模仿学习(即观察人类操作然后模仿这些动作),仅通过50次任务演示,共同训练,它就能够自主完成日常生活中的各种任务。最重要的是:该机器人的软硬件全部都是开源的。
Flowpilot:只需一台二手手机,让老旧的燃油车也能实现自动驾驶
Flowpilot是一个开源的自动驾驶辅助系统。它可以运行在Android系统上。 你只需要在一台普通智能手机上运行Flowpilot,然后通过熊猫硬件连接车辆的OBD-II 端口,再把它和手机相连