Google 推出“Ask Photos” AI 助手
增强图片搜索功能
Google 正在推出其新的“Ask Photos”功能,目前正在美国部分用户中进行测试。这个由 AI 驱动的工具允许用户使用自然语言问题查询他们的照片库,例如“我们上次去优胜美地露营是在哪里?”或“我们在斯坦利酒店吃了什么?”该助手利用 Google 的 Gemini AI 模型提供相关回复和图片
增强图片搜索功能
Google 正在推出其新的“Ask Photos”功能,目前正在美国部分用户中进行测试。这个由 AI 驱动的工具允许用户使用自然语言问题查询他们的照片库,例如“我们上次去优胜美地露营是在哪里?”或“我们在斯坦利酒店吃了什么?”该助手利用 Google 的 Gemini AI 模型提供相关回复和图片
在學校和大學中,關於是否應該允許或禁止這些工具的爭論正在進行中。
現在,瑞典的研究人員調查了青少年的執行功能 (EF) 與他們使用生成式人工智慧聊天機器人以及他們對學校作業的感知有用性之間的關係。他們的研究結果發表在《人工智慧前沿》 。
谷歌正在通过其 Gemini AI 聊天机器人重新引入生成人物图像的功能。此前,由于对历史不准确的描绘的担忧,该功能在今年早些时候被暂停。该功能将在几天内以早期访问版本的形式提供给使用英语的 Gemini Advanced、Business 和 Enterprise 用户。此升级利用了 Imagen 3,这是谷歌最新的文本到图像生成器,能够从逼真的风景到纹理绘画创建各种视觉效果。
蘋果週四告訴開發者,蘋果將允許歐盟的 iPhone 和 iPad 用戶刪除 App Store 或其 Safari 瀏覽器。
蘋果長期以來一直大力保護應用程式商店,將其作為數位內容進入其流行行動裝置的唯一門戶。這項變化發生之際,由於歐盟具有里程碑意義的新數位規則,該公司放鬆了對歐盟設備的控制。
蘋果在開發者支援頁面上表示:“歐盟用戶將可以刪除 App Store、訊息、相機、照片和 Safari 應用程式。”
谷歌将AI驱动的搜索摘要扩展到六个新国家
谷歌现在在搜索页面顶部显示基于人工智能的便捷答案,这意味着用户可能永远不会点击进入那些为这些结果提供数据的网站。
但许多网站所有者表示,他们无法承受阻止谷歌人工智能总结他们的内容的后果。
谷歌发布了其新款Pixel9智能手机,包括起售价为 799 美元,比其前代产品贵了 100 美元。此次发布比往常更早,这是谷歌战略的一部分,旨在将其设备中整合先进的人工智能 (AI) 功能,并在苹果 9 月份发布 iPhone 之前与竞争对手展开竞争。新功能包括独有的截图搜索功能,以及可跨应用程序提供帮助的 Gemini 聊天机器人的叠加层。
OpenAI 推出了 SWE-bench Verified,这是对原始 SWE-bench 基准的改进子集,旨在更准确地评估 AI 模型解决现实世界软件问题的能力。这个新版本包含 500 个经过人工验证的样本,解决了任务清晰度和评估准确性方面的先前不足。
Google 推出了全新语音聊天模式,名为 Gemini Live,现已面向高级订阅用户开放。此功能允许用户与多个语音选项进行自然对话,并支持打断,无需点击按钮。用户可以暂停讨论并在稍后恢复,增强对话流程。
目前正在 Android 设备上以英语推出,计划在未来几周内支持 iOS 和其他语言。此次更新还引入了十种新语音和上下文感知功能,允许用户询问屏幕或视频上显示的内容。其他即将推出的功能包括 Keep 和 YouTube Music 等应用程序的扩展。
DeepMind的工程师团队开发了一款能够打业余水平乒乓球的机器人。该机器人的核心硬件基于ABB IRB 1100机械臂,这款机械臂以其高速度和高精度著称,广泛应用于工业场景。通过结合了先进的机器人技术和人工智能,能够执行快速且有策略的乒乓球动作。
通过观看物理模拟和人类比赛,使用小规模数据集进行训练,并通过迭代过程不断提升技能。机器人在与不同水平的人类选手对战时,轻松战胜了初学者,并在与中级选手的比赛中赢得了超过一半的比赛,但在面对高级选手时表现不佳。
苹果即将推出的 AI 功能,统称为 Apple Intelligence,可能每月花费用户 10 到 20 美元。
这紧随 iOS 18.1 beta 版的发布,该版本包含了这些功能的早期版本。苹果在服务货币化方面有着良好的记录,再加上 AI 开发的高成本,使得付费订阅模式成为可能。
目前,Apple Intelligence 提供的功能包括通知摘要、邮件中的智能回复和 Siri 升级。未来的功能包括使用 Image Playground 和 Genmoji 生成图像。
新功能包括:
智能摄像头字幕: Gemini 将为 Nest 摄像头画面生成描述性字幕,提供超越简单警报的上下文信息。
自然语言自动化: 用户可以使用 Google Home 应用中的自然语言提示创建复杂例程。
增强型 助理: 新的语音和改进的对话能力将使 助理听起来更自然,并更好地理解用户请求。
OpenAI 的团队已经开发出一种文本水印方法,并会在研究替代方案时继续考虑这种方法。
虽然它在抵御例如释义等局部篡改方面具有很高的准确性,甚至很有效,但对全局篡改的防御能力较弱;例如使用翻译系统,用另一个生成模型改写,或者要求模型在每个单词之间插入一个特殊字符,然后删除该字符,这使得不良行为者可以轻松规避。
以及可能对非英语人士等群体造成不成比例的影响。该公司正在讨论是否真正发布该工具。OpenAI 去年关闭了其之前的 AI 文本检测器,理由是“准确率低”。
微软披露,在截至 6 月的季度它的现金资本支出和设备支出高达 190 亿美元,相当于 5 年前的全年支出。这笔支出大部分和 AI 有关,其中半数被用于建造和租赁数据中心。Google 的情况类似,它在上半年大幅增加了 AI 基础设施的支出,预计年底将花费高达 490 亿美元。
但在 AI 上的投资至少在短期内是无法回本的,微软首席财务官 Amy Hood 表示,该公司预测这些投资可能需要 15 年或更长时间才能货币化。这一言论令分析师们感到担忧。
Google Lens 现已可用于 Chrome 桌面浏览器,用户可以通过快速拖动和搜索手势搜索浏览器屏幕上看到的内容。“标签比较”功能可让用户跨站点比较商品,网上购物时,来回切换标签页对比商品价格与评论很麻烦,该功能可在一处显示人工智能生成的多个标签页中的产品概览。