分类： AI巨头 - 第 9 页 - Tarogo Cloud Bloger & Shop

AI项目, MicroSoft

微软官方出的 PowerToys

Tarogo Cloud / 1 6 月, 2024

很好用的小工具集合，还是开源的。
尤其是里面的 Text Extractor 用作 OCR 很方便。

当前 PowerToy 实用工具

AI新搜索, AI行业应用, AI项目, MicroSoft

微软必应的一项新专利详细介绍了“视觉搜索”

Tarogo Cloud / 31 5 月, 2024

微软在 Bing 图片搜索中已引入视觉搜索选项，通过识别图片中的内容，并扩展显示相关的图片资源，实现以图搜图功能。

微软计划将必应的图片搜索引入到聊天平台上，增强用户参与度并提供更全面的搜索结果。

AI项目, Meta, 医疗AI

基于LLAMA3构建的医疗领域的多模态模型

Tarogo Cloud / 26 5 月, 2024

@ICepfl 和 @YaleMed 的研究人员联手构建了 Meditron，这是一款适用于资源匮乏的医疗环境的 LLM 套件。借助 Llama 3，他们的新模型在 MedQA 和 MedMCQA 等基准测试中优于其参数类别中的大多数开放模型。

AI项目, Alphabet, 医疗AI

谷歌发布基于 Gemini 微调的医疗领域模型 Med-Gemini

Tarogo Cloud / 25 5 月, 2024

在临床推理、多模态理解和长文本处理方面都有很大的提升。

研究人员用了14个医疗基准测试Med-Gemini的能力。

结果发现,它在10个基准上都取得了最佳表现,远超之前最强的GPT-4模型。

Adobe, AI项目

Adobe Premiere Pro 发布重大更新

Tarogo Cloud / 24 5 月, 2024

引入 AI 视频编辑和第三方Sora等AI视频模型

Adobe Premiere Pro将在今年晚些时候推出第三方AI模型，让编辑人员可以选择最适合他们素材的模型，直接在软件中生成和编辑。

AI项目, Meta

Meta公布了其下一代训练和推理加速器（MTIA）的详细信息

Tarogo Cloud / 14 5 月, 2024

它还提供了更高的GEMM和SIMD顶点操作速度，以及更大的本地和片上内存容量和带宽。
此外，Meta还开发了一个大型机架系统，可容纳多达72个加速器，以及一个全新的软件堆栈，与PyTorch 2.0完全集成，支持高效的模型和内核代码生成。

AI项目, Alphabet

Google扩充Gemma开源家族

Tarogo Cloud / 11 5 月, 2024

CodeGemma：专注于代码完成和代码生成任务，具备出色的数学和逻辑推理能力
RecurrentGemma：是一个为研究实验优化的高效架构，利用循环神经网络和局部注意力来提高内存效率。

AI项目, OpenAI

OpenAI 发布了GPT-4-Turbo 正式版

Tarogo Cloud / 11 5 月, 2024

gpt-4-turbo 、 gpt-4 和 gpt-3.5-turbo 指向各自的最新模型版本。您可以通过发送请求后查看响应对象来验证这一点。响应将包括所使用的特定模型版本（例如 gpt-3.5-turbo-0613 ）。

AI项目, Alphabet

Google宣布Gemini-1.5-Pro开放API

Tarogo Cloud / 10 5 月, 2024

Gemini 1.5 Pro能够对上传到Google AI Studio中的视频进行图像（帧）和音频（语音）的同时推理，意味着这个模型具备了理解和处理视频内容的能力，不仅限于视频的视觉部分（如图像帧），也包括音频部分（如对话、背景音乐等）。

AI项目, Meta

Meta发布了最新的Llama3

Tarogo Cloud / 8 5 月, 2024

首次发布的是 Llama 3 系列中的两款参数分别为 8B 和 70B 的模型。
最大参数的 400+ B 的模型还在开发中，预计几个月内发布。

AI项目, Alphabet

Google DeepMind 展示深度混合：

Tarogo Cloud / 3 5 月, 2024

来自 Google DeepMind、麦吉尔大学和 Mila 的研究人员推出了一种突破性的方法，称为深度混合 (MoD)，它不同于传统的统一资源分配模型。 MoD 使 Transformer 能够动态分配计算资源，重点关注序列中最关键的标记。该方法代表了管理计算资源的范式转变，并有望显着提高效率和性能。

AI项目, Claude

Claude发布函数调用工具：Tool use

Tarogo Cloud / 2 5 月, 2024

允许模型与外部系统和数据进行交互

使用Tool use (function calling)功能，Claude不仅能够生成文本或回答问题，还能实际调用外部定义的函数或工具来执行特定操作，如获取当前的天气信息、执行数学计算等。