谷歌将Gemini 1.5 Pro安装到机器人上 实现记忆导航能力
Google DeepMind 他们把一个叫Gemini1.5Pro的系统装到了机器人身上。这可不是普通的升级,这玩意儿让机器人有了记忆导航的超能力。
想象一下,这个机器人在将近9000平方英尺的地盘上,能执行57种不同的任务,而且成功率达到了90%。这不是简单的任务,比如找到画画的地方,机器人不仅听懂了,还带你找到了一块大白板。这操作,简直比真人还靠谱。
Google DeepMind 他们把一个叫Gemini1.5Pro的系统装到了机器人身上。这可不是普通的升级,这玩意儿让机器人有了记忆导航的超能力。
想象一下,这个机器人在将近9000平方英尺的地盘上,能执行57种不同的任务,而且成功率达到了90%。这不是简单的任务,比如找到画画的地方,机器人不仅听懂了,还带你找到了一块大白板。这操作,简直比真人还靠谱。
整合到临床任务中的移动和可穿戴设备为个人健康监测提供了丰富、连续和纵向的数据来源。本文提出一个新模型,个人健康大型语言模型(PH-LLM),一个经过微调的Gemini版本,用于对数字时间序列个人健康数据的文本理解和推理,用于睡眠和健身应用。
本地和远端大模型混合使用的方案。
使用 chrome 本地模型的好处:
1、本地处理敏感数据;
2、流畅的用户体验;
3、对 AI 的访问权限更高;
4、离线使用 AI。
机器学习 (ML) 有潜力彻底改变医疗保健,从减少工作量和提高效率到发现新的生物标志物和疾病信号。为了负责任地利用这些好处,研究人员采用可解释性技术来了解机器学习模型如何进行预测。然而,当前基于显着性的方法突出了重要的图像区域,通常无法解释特定的视觉变化如何驱动机器学习决策。
say-what-you-see
可以帮你学会如何写 AI 画图提示词
除了教你技巧外还会有对应的练习,给你一张图片让你用学习的技巧写提示词复刻图片。
藏师傅第一等级全部 70 分以上通过,哈哈。
来测试一下你的 AI 画图提示词能力吧,又要干苦力给谷歌打标了
LearnLM-Tutor 是一个由 Google DeepMind 开发的生成式 AI 模型,专门用于教育领域,旨在提供一对一的对话辅导。
通过即时反馈、多轮对话、错误识别和积极学习促进等功能,模型不仅帮助学生解决具体问题,还培养他们的自主学习和批判性思维能力。结合定制化学习计划、多学科支持和进步追踪功能,LearnLM-Tutor 成为一个强大的教育工具,为学生的全面发展提供了有力支持。
谷歌在 Chrome 中集成了一项新功能,允许用户输入“@”来启动 Gemini。
新的人工智能工具几乎没有学习曲线
立即改进产品并利用现有分销
慢慢提高非人工智能用户的技能
支持图像视频等多种视觉语言任务
包括支持图像和短视频字幕、视觉问答、图像文本理解、物体检测文件图表解读、图像分割等任务。
PaliGemma 模型包含 30 亿(3B)个参数,结合了 SigLiP 视觉编码器和 Gemma 语言模型。
Android Studio提供了一站式解决方案,集成了代码编辑、编译、调试和测试的工具,减少了开发者在不同工具间切换的需要。
支持自动编写代码、语法高亮和代码重构
开源社区一直以来的梦想:DALLE3交互和提示词生成能力 + 无数SD模型出图能力,这不巧了嘛
百万上下文、多模态+多轮对话、打标/反推
能够预测所有生命分子结构和相互作用 AI 模型
该模型能够生成蛋白质、DNA 和其他分子的 3D 结构,并揭示它们如何组合在一起。
该模型还能够模拟影响细胞健康的化学变化,并检测可能导致疾病的异常。
AlphaFold 3 将为全球科学研究人员和机构免费开放。它的高精度和新一代架构可支持药物发现和生物学的突破性进展。
Google 威胁情报的用途示例:
识别和防御网络钓鱼攻击:
假设一家企业遭遇了钓鱼电子邮件攻击,员工可能收到包含恶意链接或附件的电子邮件。
Google Threat Intelligence可以利用其庞大的电子邮件监控网络,检测并阻止这些恶意邮件的传播。