Tarogo Cloud

AI开源项目:AI Math Notes

AI Math Notes 是一个互动绘图应用程序,用户可以在画布上绘制数学方程。
绘制完方程后,应用程序会使用多模态大语言模型 (LLM) 计算结果,并在等号旁显示。
该应用程序使用 Python 编写,图形用户界面采用 Tkinter 库,图像处理使用 PIL 库。

苹果发布的Translation API

苹果新出的翻译 API,不需要联网,完全使用本机大语言模型。

使用翻译框架提供应用内翻译。您可以使用内置 UI,让系统代表您向用户提供翻译。或者您可以使用该框架来定制翻译体验。

要提供内置系统翻译体验,请将视图修饰符锚定到包含要翻译的文本的 SwiftUI 视图。当您希望显示内置系统翻译 UI 时,将 isPresented 设置为 true。将要翻译的文本传递给 text 参数。

Niceaunties的灵感集

@niceaunties

作者介绍:“Niceaunties”的灵感来自于阿姨文化中荒唐又可爱的行为。 TED 演讲者。奖学金 http://daily.xyz 艺术家。

NVIDIA发布用于训练大语言模型的开源合成数据生成管道

Nemotron-4 340B,一个优化用于NVIDIA NeMo和NVIDIA TensorRT-LLM的模型家族,包括最先进的指令模型和奖励模型,以及用于生成式AI训练的数据集。

NVIDIA今天宣布推出Nemotron-4 340B,这是一组开源模型,开发人员可以使用这些模型生成用于训练大语言模型(LLMs)的合成数据,以应用于医疗、金融、制造、零售等各个行业的商业应用。

NVIDIA 與開發商攜手合作,利用 NVIDIA ACE 數位化身雲端引擎

NVIDIA ACE(Avatar Cloud Engine)是一套可協助開發人員使用生成式AI將數位化身變為現實的技術。透過 ACE,非玩家角色 (NPC) 可以轉變為動態的互動式角色,能夠發起對話,或提供遊戲知識來幫助玩家完成任務。

在 CES 2024 上,我們宣布推出ACE 產品級微服務 ,提供頂尖數位化身開發人員NVIDIA Audio2Face (A2F) 和 NVIDIA Riva 自動語音辨識 (ASR)。

Refuel LLM-2:专门为数据标注、清洗设计的开源语言模型

Refuel AI 最近推出了两个新版本的大语言模型 RefuelLLM-2 和 RefuelLLM-2-small。
RefuelLLM-2 和 RefuelLLM-2-small 是专门为数据标注、清洗和丰富任务而设计的语言模型。

用途: RefuelLLM-2 主要用于自动化数据标注、数据清洗和数据丰富,这些任务是处理和分析大规模数据集时的基础工作,尤其是在需要将非结构化数据转换为结构化格式的场景中。

OpenAI宣布收购 Rockset

这是一家领先的实时分析数据库公司,提供世界级的数据索引和查询能力。

OpenAI称通过这次收购,OpenAI计划将Rockset的技术集成到其产品中,以增强其检索基础设施,使AI能够更好地利用和访问实时数据。

Florence-2:微软开源视觉基础模型

Florence-2 是 Microsoft 在 MIT 许可下开源的轻量级视觉语言模型。该模型在字幕、对象检测、接地和分割等任务中展示了强大的零样本和微调功能。

尽管尺寸很小,但它所取得的结果与大许多倍的模型(如 Kosmos-2)相当。该模型的优势不在于复杂的架构,而在于大规模的 FLD-5B 数据集,其中包含 1.26 亿张图像和 54 亿个综合视觉注释。

kijai 开发的 Florence-2 ComfyUI 插件上线

支持从图片生成提示词和指定位置的蒙版。
从图片生成提示词支持三个详细等级,内容会越来越多,蒙版生成类似 SAM 输入区域的单词就行。
提示词推理比 WD14 快非常多,也比较准确。