分类： AI项目 - 第 26 页 - Tarogo Cloud Bloger & Shop

Google宣布Gemini-1.5-Pro开放API

Tarogo Cloud / 10 5 月, 2024

Gemini 1.5 Pro能够对上传到Google AI Studio中的视频进行图像（帧）和音频（语音）的同时推理，意味着这个模型具备了理解和处理视频内容的能力，不仅限于视频的视觉部分（如图像帧），也包括音频部分（如对话、背景音乐等）。

AI项目, 医疗AI

巴西医生使用 Apple Vision Pro辅助手术

Tarogo Cloud / 10 5 月, 2024

巴西的骨科医生Bruno Gobbato最近使用Vision Pro成功进行了肩袖撕裂的手术。这种手术通常是由于肌腱组织的长期磨损和撕裂造成的。

AI项目, 机器人

由人工智能控制的战斗机已经与人类飞行员进行了空中“狗斗”

Tarogo Cloud / 9 5 月, 2024

2023年9月美国空军取得全球首次的突破，他们成功使用一架改装的F-16战斗机（X-62）与一架有人驾驶的F-16战机进行了空中对抗。

AI项目

日本Towa因AI芯片需求股价激增四倍

Tarogo Cloud / 9 5 月, 2024

随着 AI 的兴起，一家不太为人知的日本芯片设备公司 Towa 的股价惊人地飙升了 390%。SK Hynix 和三星等公司正依赖 Towa 的设备来生产高端内存芯片。Towa 还在研发新的工具，承诺将芯片成型成本削减一半。

AI项目, 开源项目

LiteLLM：统一100多种 LLM 的 API 输入输出操作的开源项目

Tarogo Cloud / 8 5 月, 2024

统一 Bedrock、Azure、OpenAI、Cohere、Anthropic、Ollama、Sagemaker、HuggingFace、Replicate 等 100 多种 LLM 的 API 输入输出、异常处理和负载均衡等操作的开源项目

AI项目, Meta

Meta发布了最新的Llama3

Tarogo Cloud / 8 5 月, 2024

首次发布的是 Llama 3 系列中的两款参数分别为 8B 和 70B 的模型。
最大参数的 400+ B 的模型还在开发中，预计几个月内发布。

AI项目, 机器人

波士顿动力公司刚刚展示了新一代纯电动Atlas机器人

Tarogo Cloud / 7 5 月, 2024

阿特拉斯一动不动地俯卧在互锁的健身垫上。唯一的配乐是电动机的呼呼声。确切地说，它并不安静，但与它祖先的液压冲击相比，这算不了什么。

AI项目, 开源项目

线性注意力序列并行（LASP）

Tarogo Cloud / 6 5 月, 2024

上海人工智能实验室和 TapTap 的研究人员提出了线性注意序列并行 (LASP) 技术，该技术优化了线性 Transformer 上的序列并行性。它采用点对点 (P2P) 通信在节点内或节点间的 GPU 之间进行有效的状态交换。 LASP 最大限度地利用了线性注意力中的右积核技巧。重要的是，它不依赖于注意力头分区，使其适用于多头、多查询和分组查询注意力。

AI项目, 开源项目

Vercel 上一键部署babyAGI

Tarogo Cloud / 6 5 月, 2024

Morphic 只用 OpenAI 与搜索服务 @tavilyai 的 API 就能整得像模像样，换成 Gemini 与 Google Search 的 API 也一样能行。感觉 Perplexity 给大家带了 AI 时代的问答式搜索体验后，这种模式就会被大家学去强化自己的功能了

AI项目

Chinese Tiny 第一个以中文为中心的完全开源大语言模型

Tarogo Cloud / 5 5 月, 2024

CT-LLM从头开始构建，与传统方法不同，它主要包含中文文本数据，利用了总量高达1200亿Token的庞大语料库，其中800亿是中文Token，300亿是英文Token，还有100亿是代码Token。

AI项目

清华大学研究人员提出 SPMamba

Tarogo Cloud / 5 5 月, 2024

清华大学BNRist计算机科学与技术系的研究人员介绍了SPMamba，这是一种植根于SSM原理的新颖架构。通过引入平衡效率和效果的创新模型，围绕语音分离的讨论得到了丰富。 SSM 体现了这种平衡。通过巧妙地整合 CNN 和 RNN 的优势，SSM 满足了对能够在不影响性能的情况下高效处理长序列的模型的迫切需求。

AI项目

北大发布一个新的图像生成框架VAR

Tarogo Cloud / 4 5 月, 2024

VAR首次使GPT风格的AR模型在图像生成上超越了Diffusion transformer。
同时展现出了与大语言模型观察到的类似Scaling laws的规律。
在ImageNet 256×256基准上,VAR将FID从18.65大幅提升到1.80,IS从80.4提升到356.4,推理速度提高了20倍