分类: AI巨头

微软开源下一代RAG技术

检索增强生成(RAG)是一种基于用户查询搜索信息并提供结果作为生成AI答案的参考的技术。 该技术是大多数基于LLM的工具的重要部分,并且大多数RAG方法使用向量相似性作为搜索技术。 GraphRAG使用LLM生成的知识图,在对复杂信息进行文档分析时,大大提高了问答性能。

OpenAI宣布收购 Rockset

这是一家领先的实时分析数据库公司,提供世界级的数据索引和查询能力。 OpenAI称通过这次收购,OpenAI计划将Rockset的技术集成到其产品中,以增强其检索基础设施,使AI能够更好地利用和访问实时数据。

Florence-2:微软开源视觉基础模型

Florence-2 是 Microsoft 在 MIT 许可下开源的轻量级视觉语言模型。该模型在字幕、对象检测、接地和分割等任务中展示了强大的零样本和微调功能。 尽管尺寸很小,但它所取得的结果与大许多倍的模型(如 Kosmos-2)相当。该模型的优势不在于复杂的架构,而在于大规模的...

谷歌:个人健康大语言模型和智能体研究

整合到临床任务中的移动和可穿戴设备为个人健康监测提供了丰富、连续和纵向的数据来源。本文提出一个新模型,个人健康大型语言模型(PH-LLM),一个经过微调的Gemini版本,用于对数字时间序列个人健康数据的文本理解和推理,用于睡眠和健身应用。

Apple Intelligence 新功能

动画指示按钮被按下:如此光滑和简约! 地图重新设计:(@Apple,重新绘制你的地图) 新的控制中心很疯狂:

OpenAI 推出 ChatGPT Edu 为大学设计的专用版本

ChatGPT Edu,这是 ChatGPT 的一个版本,专为大学打造,旨在负责任地将 AI 部署到学生、教师、研究人员和校园运营中。ChatGPT Edu 由 GPT-4o 提供支持,可以跨文本和视觉进行推理,并使用数据分析等高级工具。

苹果发布个人人工智能集群

用 MLX 把你的 iPhone、iPad 还有 Mac 在本地连接起来组成一个大号 GPU 来用!Nvidia 在数据中心做超级 GPU,Apple 说我 Edge Devices 多,用这种廉价方式串联 GPU 也行

Copilot+ PC 的 Recall 预览功能更新

微软:新电脑上捕捉屏幕截图的Recall AI 功能将默认关闭 该功能每5秒截取一次用户屏幕并记录用户屏幕操作。 使用户能够像查询记忆一样回顾过去的操作。但这一功能引发了网络安全专家的担忧,他们认为黑客有可能获取用户信息。

Chrome 已经内置大模型(Gemini Nano)

本地和远端大模型混合使用的方案。 使用 chrome 本地模型的好处: 1、本地处理敏感数据; 2、流畅的用户体验; 3、对 AI 的访问权限更高; 4、离线使用 AI。

Google AI 医学影像模型

机器学习 (ML) 有潜力彻底改变医疗保健,从减少工作量和提高效率到发现新的生物标志物和疾病信号。为了负责任地利用这些好处,研究人员采用可解释性技术来了解机器学习模型如何进行预测。然而,当前基于显着性的方法突出了重要的图像区域,通常无法解释特定的视觉变化如何驱动机器学习决策。

谷歌家的好东西:艺术家

say-what-you-see 可以帮你学会如何写 AI 画图提示词 除了教你技巧外还会有对应的练习,给你一张图片让你用学习的技巧写提示词复刻图片。 藏师傅第一等级全部 70 分以上通过,哈哈。 来测试一下你的 AI 画图提示词能力吧,又要干苦力给谷歌打标了

LlamaFS:基于Llama 3的能自动帮你分类整理电脑里文件的工具

LlamaFS 是一个自组织文件管理器。它会根据文件的内容和众所周知的约定(例如时间)自动重命名和组织文件。它支持多种文件,甚至图像(通过 Moondream)和音频(通过 Whisper)。 LlamaFS 以两种“模式”运行 - 作为批处理作业(批处理模式)和交互式守护进程(监视模式)。