Google 推出 Gemini Live
AI 助手的新语音聊天功能
在 Pixel 9 发布会上,Google 推出了 Gemini 的全新语音聊天模式,名为 Gemini Live,现已面向高级订阅用户开放。此功能允许用户与多个语音选项进行自然对话,并支持打断,无需点击按钮。用户可以暂停讨论并在稍后恢复,增强对话流程。
Gemini Live 目前正在 Android 设备上以英语推出,计划在未来几周内支持 iOS 和其他语言。此次更新还引入了十种新语音和上下文感知功能,允许用户询问屏幕或视频上显示的内容。其他即将推出的功能包括 Keep 和 YouTube Music 等应用程序的扩展。
谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了其AI语音助手 Gemini Live 。Gemini Live 对标的是 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,可以展开更连贯、更有情感表达力、更逼真的多轮对话。
Gemini Live 支持免提操作,允许一直在后台保持运行,Gemini Live 允许用户与 Gemini 进行类似于与真人的自由流动的对话。用户可以随时在对话中打断 Gemini 的回应,深入探讨特定话题,或是在不丢失上下文的情况下暂停对话,稍后再继续。这种体验使得与 AI 的互动更加直观和灵活,类似于与一位实时助手进行交流。
双子座实时:一个充满希望但略显尴尬的语音助手体验
新的语音助手 Gemini Live 在提供解决方案的速度方面表现出色,在最近的一次测试中,它在约 15 秒内就给出了答案,这比 Google Assistant 快得多。然而,用户报告说,由于其类人化的特性,与它互动时会感到有些尴尬。The Verge 的初始体验强调了打断助手时的挑战;它经常在没有提示的情况下继续说话。
例如,当被问及狗的娱乐想法时,Gemini Live 给出了冗长的回答,感觉更像是“说教”,导致用户感到沮丧。相比之下,另一位测试者发现它更容易参与,并且没有犹豫地就收到了创造性的建议,例如创建龙与地下城战役。
Gemini Live 目前可供在功能强大的 Android 设备上拥有 Gemini Advanced 订阅的用户使用;iOS 用户需要等待更长时间才能访问。随着产品的进一步推出,预计它将与其他数字助手进行比较,例如 OpenAI 的 ChatGPT 语音助手和苹果的 Siri。
Gemini Live 语音对话功能现已发布:
- 可随时打断
- 可实时解读视频
- 10+ 种语音可选
- 今日开始,拥有 Gemini Advanced 订阅的 Android 用户将开始灰度测试该功能,目前仅支持英语
- 未来几周内推出 iOS 版
如果想详细了解,可以点开视频下方的链接。
谢谢观看本视频。要是喜欢,请订阅、点赞。谢谢
原文:https://www.theverge.com/2024/8/13/24219553/google-gemini-live-voice-chat-mode
油管:https://youtu.be/T9p11J9LWUQ