分類: AI巨头 - 第 9 頁 - Tarogo Cloud Bloger & Shop

Open-Sora开源了

包括完整的文本到视频模型训练过程、数据处理、训练细节和模型检查点。
该项目由@YangYou1991 团队开发这是 OpenAI Sora 在视频生成方面的开源替代方案。
可以在仅仅3天的训练后生成2~5秒的512×512视频。

7 4 月, 2024

AI项目 Claude

Claude 3 Haiku API发布

速度最快最有性价比的型号
每百万输入token0.25美元，每百万输出token1.25美元。

4 4 月, 2024

AI项目 Meta

MusicLang-基于 Llama 2 的音乐生成模型！

基于 Llama2，从头开始训练。
许可 – 开源。
优化在 CPU 上运行。 🔥
高度可控，可选择节奏、和弦进行、小节范围等等！

30 3 月, 2024

AI项目 Claude

Claude3最新已经上线AWS

Anthropic太牛了。Claude-3 发布的两件事：

领域专家基准。我对饱和的 MMLU 和 HumanEval 不那么感兴趣。Claude特别挑选了金融、医学和哲学作为专家领域并报告性能。我建议所有 LLM 模型卡都遵循这一点，这样不同的下游应用程序就会知道该期待什么。

拒绝率分析。LLMs’对无辜问题过于谨慎的回答正在成为一种流行病。Anthropic 通常处于极端安全的一端，但他们认识到了这个问题，并强调了他们在这方面的努力。好极了！

28 3 月, 2024

AI项目 OpenAI 开源项目

北京大学Yuangroup团队发起了一个 Open-Sora计划

旨在复现OpenAI 的Sora模型

Open-Sora计划通过视频VQ-VAE、Denoising Diffusion Transformer和条件编码器等技术组件，来实现Sora模型的功能。

24 3 月, 2024

AI项目 Meta

Chat-With-MLX：在Mac上轻松运行各种开源模型

并以RAG的方式聊天
是利用苹果MLX框架实现的一个高效、多语言支持进行检索增强生成（RAG）的聊天界面。

23 3 月, 2024

AI项目 Meta

ChatMusician: 能够理解和生成音乐的大语言模型

通过根据给定的文本提示、和弦序列、旋律线索、音乐主题或形式等条件。
ChatMusician能自动生成结构完整、风格多样的音乐作品。
包括单声部旋律、和声编配，乃至完整的乐曲结构设计。
同时它还能理解和分析音乐理论的各个方面。

20 3 月, 2024

AI项目 OpenAI

OpenAI有一个地方可以提前体验Sora的功能

OpenAI的技术报告里
有一个地方可以提前体验Sora的功能

18 3 月, 2024

AI项目 OpenAI 开源项目

OpenAI推出的一音乐生成模型：Jukebox

OpenAI在2019年8月份就推出了他们的一音乐生成模型：Jukebox
Jukebox能够根据提供的歌词、艺术家和流派信息生成多种流派和艺术家风格的完整音乐和人声歌曲。

最牛P的是，3年前的质量就已经这样了…

而且据说Jukebox 2即将发布

11 3 月, 2024

AI项目 Alphabet

Google发布了 Gemini-Pro-1.5

这是其 AI 模型的下一个版本，具有超过 1,000,000 个令牌上下文长度。
该模型现在可以一次性理解整本书、整部电影和播客系列。
这远远超过了所有其他竞争对手的聊天机器人上下文窗口。

6 3 月, 2024

AI项目 OpenAI

Sora视频：一只鲜花老虎飞升

OpenAI系统主管Connor Holmes @cmikeh2 发布
一只鲜花老虎飞升，又重新聚拢成老虎

6 3 月, 2024

AI项目 OpenAI

OpenAI 和 Elon Musk \[译\]

OpenAI 的使命是确保全人类能从人工通用智能 (AGI) 中受益，这不仅意味着我们要构建既安全又有益的 AGI，也意味着我们要努力创造广泛分布的利益。现在，我们将分享我们如何实现这个使命的理解，以及我们与 Elon 的关系的一些事实。我们打算驳回 Elon 的所有主张

6 3 月, 2024

AI项目 OpenAI

OpenAI Sora的新文本到视频模型

Sora 是一个数据驱动的物理引擎。它是对许多世界的模拟，无论是真实的还是幻想的。模拟器通过一些去噪和梯度数学来学习复杂的渲染、“直观”物理、长期推理和语义基础。

如果 Sora 使用虚幻引擎 5 对大量合成数据进行训练，我不会感到惊讶。它必须如此！

5 3 月, 2024

AI项目 MicroSoft 开源项目

OS-Copilot：能够与操作系统（OS）进行交互

完成一系列广泛且复杂的计算机任务的智能代理框架。
它能够自我学习和改进，处理各种操作系统级别的任务。
包括但不限于文件管理、数据处理、环境设置、多媒体操作、网页浏览、代码编写、第三方应用交互、自动化测试等。

该项目由上海AI实验室、华东师范大学、普林斯顿大学和香港大学的研究人员共同开发。

4 3 月, 2024

AI项目 OpenAI 多媒体处理

AzureOpenAIService宣布了一系列新功能

包括公开预览的Assistants API、新的文本到语音（TTS）功能、即将推出的GPT-4 Turbo和GPT-3.5 Turbo模型更新、新的嵌入模型以及微调API的更新。

与之前的聊天完成API相比，Assistants API能够记住之前的对话内容，创建持久化和无限长的线程。

Assistants API 是一项由 Azure OpenAI 提供的新服务，它旨在帮助开发者在他们的应用程序中更容易地创建高质量的人工智能助手体验。

3 3 月, 2024

AI项目 Alphabet

谷歌BARD更新为Gemini Ultra

注册时可以选择退出训练数据
Gemini Ultra 中 Imagen 2 生成的所有图像都应用了数字水印（但你看不到它）
Ultra 比 Gemini Pro 更能胜任复杂任务，例如编码、逻辑推理以及遵循更长/更详细的指令。

2 3 月, 2024

AI巨头

Open-Sora开源了

Claude 3 Haiku API发布

MusicLang-基于 Llama 2 的音乐生成模型！

Claude3最新已经上线AWS

北京大学Yuangroup团队发起了一个 Open-Sora计划

Chat-With-MLX：在Mac上轻松运行各种开源模型

ChatMusician: 能够理解和生成音乐的大语言模型

OpenAI有一个地方可以提前体验Sora的功能

OpenAI推出的一音乐生成模型：Jukebox

Google发布了 Gemini-Pro-1.5

Sora视频：一只鲜花老虎飞升

OpenAI 和 Elon Musk \[译\]

OpenAI Sora的新文本到视频模型

OS-Copilot：能够与操作系统（OS）进行交互

AzureOpenAIService宣布了一系列新功能

谷歌BARD更新为Gemini Ultra

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email