分類: AI项目 - 第 14 頁 - Tarogo Cloud Bloger & Shop

AI项目

Refuel LLM-2：专门为数据标注、清洗设计的开源语言模型

Refuel AI 最近推出了两个新版本的大语言模型 RefuelLLM-2 和 RefuelLLM-2-small。
RefuelLLM-2 和 RefuelLLM-2-small 是专门为数据标注、清洗和丰富任务而设计的语言模型。

用途： RefuelLLM-2 主要用于自动化数据标注、数据清洗和数据丰富，这些任务是处理和分析大规模数据集时的基础工作，尤其是在需要将非结构化数据转换为结构化格式的场景中。

22 7 月, 2024

微软开源的一个文本编码器Glyph-ByT5-v2

升级到V 2版本
与之前专注于英文文本版本相比
Glyph-ByT5-v2能够支持10种不同语言的准确拼写，显著提升了多语言文本渲染的准确性和广泛性。

21 7 月, 2024

AI项目

在对 500 万个自由职业工作的分析后发现这些工作岗位最可能被 AI 替代

分析了 Upwork 上 2022/11 到2024/02的职位数据，看哪些工作数量下降，哪些工作数量上升，哪些工作时薪下降，哪些 AI 技能的工作发布量增加最多。选择2022/11月作为起始点，是因为 ChatGPT 发布时间是 2022/11/30，而这视为生成式 AI 的起点。

20 7 月, 2024

AI巨头 AI项目 MicroSoft 开源项目

Florence-2：微软开源视觉基础模型

Florence-2 是 Microsoft 在 MIT 许可下开源的轻量级视觉语言模型。该模型在字幕、对象检测、接地和分割等任务中展示了强大的零样本和微调功能。

尽管尺寸很小，但它所取得的结果与大许多倍的模型（如 Kosmos-2）相当。该模型的优势不在于复杂的架构，而在于大规模的 FLD-5B 数据集，其中包含 1.26 亿张图像和 54 亿个综合视觉注释。

18 7 月, 2024

AI项目

kijai 开发的 Florence-2 ComfyUI 插件上线

支持从图片生成提示词和指定位置的蒙版。
从图片生成提示词支持三个详细等级，内容会越来越多，蒙版生成类似 SAM 输入区域的单词就行。
提示词推理比 WD14 快非常多，也比较准确。

17 7 月, 2024

AI项目多媒体处理开源项目

Diffutoon：将任何真实感视频直接渲染为高清动漫风格

提供了 Colab 笔记，直接运行就可以，不需要摆弄麻烦的 Comfyui 流程和一堆模型了。
Diffutoon 能够以动漫风格渲染出细节丰富、高分辨率和长时间的视频。它还可以通过一个附加模块根据提示编辑内容。

16 7 月, 2024

AI项目多媒体处理开源项目

Runway最新视频生成模型上线

Gen-3 Alpha是Runway的反击之作。Gen-3 Alpha的一大特点是生成的视频具有高精细度，它可以理解并生成复杂的场景和运动画面，还能胜任多种电影艺术手法。

14 7 月, 2024

AI行业应用 AI项目

未来的你，麻省理工学院让你与聪明、年长的自己聊天

麻省理工学院的研究人员（麻省理工学院简介）创建了一个聊天机器人感动于人工智能 (AI) 它模拟用户以前的“自我”并提供观察和建议。目标是鼓励人们今天更多地思考他们明天想成为的人。

13 7 月, 2024

AI项目

Yandex 推出 YaFSDP：

一款开源 AI 工具，有望通过将 GPU 使用率降低 20% 来彻底改变 LLM 训练
开发大型语言模型需要大量时间和 GPU 资源投资，这直接转化为高昂的成本。模型越大，这些挑战就越明显。

10 7 月, 2024

AI巨头 AI项目

Apple Intelligence 新功能

动画指示按钮被按下：如此光滑和简约！

地图重新设计：(@Apple，重新绘制你的地图）

新的控制中心很疯狂：

10 7 月, 2024

AI项目多媒体处理

Luma AI推出了视频生成器，名为 Dream Machine

Luma AI 刚刚推出了一款类似 Sora 的 AI 视频生成器，名为 Dream Machine。
但与 Sora 或 KLING 不同的是，它完全向公众开放。

7 7 月, 2024

AI项目开源项目

ToonCrafter：自动生成卡通动画的中间帧

ToonCrafter，这是一种超越传统基于通信的卡通视频插值的新方法，为生成插值铺平了道路。传统方法隐含地假设线性运动，并且没有像消遮挡这样的复杂现象，经常与卡通中常见的夸张的非线性和带有遮挡的大运动作斗争，导致插值结果难以置信甚至失败。

5 7 月, 2024

AI项目开源项目

开源项目Ghidra

该框架包括一套功能齐全的高端软件分析工具，使用户能够在包括 Windows、macOS 和 Linux 在内的各种平台上分析编译的代码。功能包括反汇编、汇编、反编译、绘图和脚本编写，以及数百种其他功能。
Ghidra 支持多种处理器指令集和可执行格式，并且可以在用户交互和自动化模式下运行。用户还可以使用 Java 或 Python 开发自己的 Ghidra 扩展组件和/或脚本。

4 7 月, 2024

AI项目开源项目

博主Min Choi的新艺术作品（二）

人工智能教育家minchoi。 X关于人工智能、解决方案和有趣的事情。展示如何以实用的方式为您和您的企业利用人工智能。

使用 Midjourney v6 以《Mad Max: Furiosa》的风格重新想象著名的艺术作品。

2 7 月, 2024

AI项目

介绍了第一个名为 Prompt2Sign 的多语言手语数据集，该数据集基于公共手语数据，包括美国手语 (ASL) 和其他七种语言。
数据集将大量视频转换为简化的、模型友好的格式，并针对 seq2seq 和 text2text 等翻译模型的训练进行了优化。在此新数据集的基础上，提出了 SignLLM，这是第一个多语言手语生成 (SLP) 模型，其中包括两种新颖的多语言 SLP 模式，允许根据输入文本或提示生成手语手势。

28 6 月, 2024

AI项目

Refuel LLM-2：专门为数据标注、清洗设计的开源语言模型

微软开源的一个文本编码器Glyph-ByT5-v2

在对 500 万个自由职业工作的分析后发现这些工作岗位最可能被 AI 替代

Florence-2：微软开源视觉基础模型

kijai 开发的 Florence-2 ComfyUI 插件上线

Diffutoon：将任何真实感视频直接渲染为高清动漫风格

Runway最新视频生成模型上线

未来的你，麻省理工学院让你与聪明、年长的自己聊天

Yandex 推出 YaFSDP：

Apple Intelligence 新功能

Luma AI推出了视频生成器，名为 Dream Machine

ToonCrafter：自动生成卡通动画的中间帧

开源项目Ghidra

Khoj：一个开源的个人化AI 助手

博主Min Choi的新艺术作品（二）

SignLLM：手语生产大型语言模型

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email