检索增强生成(RAG)是一种基于用户查询搜索信息并提供结果作为生成AI答案的参考的技术。 该技术是大多数基于LLM的工具的重要部分,并且大多数RAG方法使用向量相似性作为搜索技术。 GraphRAG使用LLM生成的知识图,在对复杂信息进行文档分析时,大大提高了问答性能。
分类: AI巨头
微软开源的一个文本编码器Glyph-ByT5-v2
升级到V 2版本 与之前专注于英文文本版本相比 Glyph-ByT5-v2能够支持10种不同语言的准确拼写,显著提升了多语言文本渲染的准确性和广泛性。
OpenAI宣布收购 Rockset
这是一家领先的实时分析数据库公司,提供世界级的数据索引和查询能力。 OpenAI称通过这次收购,OpenAI计划将Rockset的技术集成到其产品中,以增强其检索基础设施,使AI能够更好地利用和访问实时数据。
Florence-2:微软开源视觉基础模型
Florence-2 是 Microsoft 在 MIT 许可下开源的轻量级视觉语言模型。该模型在字幕、对象检测、接地和分割等任务中展示了强大的零样本和微调功能。 尽管尺寸很小,但它所取得的结果与大许多倍的模型(如 Kosmos-2)相当。该模型的优势不在于复杂的架构,而在于大规模的...
谷歌:个人健康大语言模型和智能体研究
整合到临床任务中的移动和可穿戴设备为个人健康监测提供了丰富、连续和纵向的数据来源。本文提出一个新模型,个人健康大型语言模型(PH-LLM),一个经过微调的Gemini版本,用于对数字时间序列个人健康数据的文本理解和推理,用于睡眠和健身应用。
Apple Intelligence 新功能
动画指示按钮被按下:如此光滑和简约! 地图重新设计:(@Apple,重新绘制你的地图) 新的控制中心很疯狂:
OpenAI 推出 ChatGPT Edu 为大学设计的专用版本
ChatGPT Edu,这是 ChatGPT 的一个版本,专为大学打造,旨在负责任地将 AI 部署到学生、教师、研究人员和校园运营中。ChatGPT Edu 由 GPT-4o 提供支持,可以跨文本和视觉进行推理,并使用数据分析等高级工具。
苹果发布个人人工智能集群
用 MLX 把你的 iPhone、iPad 还有 Mac 在本地连接起来组成一个大号 GPU 来用!Nvidia 在数据中心做超级 GPU,Apple 说我 Edge Devices 多,用这种廉价方式串联 GPU 也行
OpenAI 是否放弃了 GPT-5?幻灯片暗示其可能不再使用数字命名
OpenAI 在命名下一代人工智能模型时可能会放弃数字,至少最近在巴黎举行的一次演讲中是这么建议的。 在 VivaTech 会议上演示 ChatGPT Voice 期间,OpenAI 开发人员体验主管 Romain Huet 展示了一张幻灯片,揭示了未来几年人工智能模型的潜在增长,但...
Copilot+ PC 的 Recall 预览功能更新
微软:新电脑上捕捉屏幕截图的Recall AI 功能将默认关闭 该功能每5秒截取一次用户屏幕并记录用户屏幕操作。 使用户能够像查询记忆一样回顾过去的操作。但这一功能引发了网络安全专家的担忧,他们认为黑客有可能获取用户信息。
Chrome 已经内置大模型(Gemini Nano)
本地和远端大模型混合使用的方案。 使用 chrome 本地模型的好处: 1、本地处理敏感数据; 2、流畅的用户体验; 3、对 AI 的访问权限更高; 4、离线使用 AI。
Google AI 医学影像模型
机器学习 (ML) 有潜力彻底改变医疗保健,从减少工作量和提高效率到发现新的生物标志物和疾病信号。为了负责任地利用这些好处,研究人员采用可解释性技术来了解机器学习模型如何进行预测。然而,当前基于显着性的方法突出了重要的图像区域,通常无法解释特定的视觉变化如何驱动机器学习决策。
谷歌家的好东西:艺术家
say-what-you-see 可以帮你学会如何写 AI 画图提示词 除了教你技巧外还会有对应的练习,给你一张图片让你用学习的技巧写提示词复刻图片。 藏师傅第一等级全部 70 分以上通过,哈哈。 来测试一下你的 AI 画图提示词能力吧,又要干苦力给谷歌打标了
LearnLM-Tutor:DeepMind 开发 专门用于一对一的教学辅导的 AI 模型
LearnLM-Tutor 是一个由 Google DeepMind 开发的生成式 AI 模型,专门用于教育领域,旨在提供一对一的对话辅导。 ...
谷歌在Chrome中允许用户输入“@”来启动 Gemini
谷歌在 Chrome 中集成了一项新功能,允许用户输入“@”来启动 Gemini。 新的人工智能工具几乎没有学习曲线 立即改进产品并利用现有分销 慢慢提高非人工智能用户的技能
LlamaFS:基于Llama 3的能自动帮你分类整理电脑里文件的工具
LlamaFS 是一个自组织文件管理器。它会根据文件的内容和众所周知的约定(例如时间)自动重命名和组织文件。它支持多种文件,甚至图像(通过 Moondream)和音频(通过 Whisper)。 LlamaFS 以两种“模式”运行 - 作为批处理作业(批处理模式)和交互式守护进程(监视模式)。