和EMO相比,该项目已开源😄 它能够通过输入语音,生成对应的人物嘴唇同步、表情变化和姿态变化的动画。 提高了语音与生成动画之间的对齐精度,使动画的嘴唇、表情和姿态与语音更匹配。 提供对角色表情、姿态和嘴唇运动的精确控制。 支持多种表情和姿态的自适应控制,增强动画的多样性和真实性。
作者: Tarogo Cloud
AI开源项目:AI Math Notes
AI Math Notes 是一个互动绘图应用程序,用户可以在画布上绘制数学方程。 绘制完方程后,应用程序会使用多模态大语言模型 (LLM) 计算结果,并在等号旁显示。 该应用程序使用 Python 编写,图形用户界面采用 Tkinter 库,图像处理使用 PIL 库。
苹果发布的Translation API
苹果新出的翻译 API,不需要联网,完全使用本机大语言模型。 使用翻译框架提供应用内翻译。您可以使用内置 UI,让系统代表您向用户提供翻译。或者您可以使用该框架来定制翻译体验。 要提供内置系统翻译体验,请将视图修饰符锚定到包含要翻译的文本的 SwiftUI 视图。当您希望显示内置系统翻译...
Niceaunties的灵感集
@niceaunties 作者介绍:“Niceaunties”的灵感来自于阿姨文化中荒唐又可爱的行为。 TED 演讲者。奖学金 艺术家。
NVIDIA发布用于训练大语言模型的开源合成数据生成管道
Nemotron-4 340B,一个优化用于NVIDIA NeMo和NVIDIA TensorRT-LLM的模型家族,包括最先进的指令模型和奖励模型,以及用于生成式AI训练的数据集。 NVIDIA今天宣布推出Nemotron-4...
NVIDIA 與開發商攜手合作,利用 NVIDIA ACE 數位化身雲端引擎
NVIDIA ACE(Avatar Cloud Engine)是一套可協助開發人員使用生成式AI將數位化身變為現實的技術。透過 ACE,非玩家角色 (NPC) 可以轉變為動態的互動式角色,能夠發起對話,或提供遊戲知識來幫助玩家完成任務。 在 CES 2024 上,我們宣布推出ACE...
Refuel LLM-2:专门为数据标注、清洗设计的开源语言模型
Refuel AI 最近推出了两个新版本的大语言模型 RefuelLLM-2 和 RefuelLLM-2-small。 RefuelLLM-2 和 RefuelLLM-2-small 是专门为数据标注、清洗和丰富任务而设计的语言模型。 用途: RefuelLLM-2...
微软开源的一个文本编码器Glyph-ByT5-v2
升级到V 2版本 与之前专注于英文文本版本相比 Glyph-ByT5-v2能够支持10种不同语言的准确拼写,显著提升了多语言文本渲染的准确性和广泛性。
在对 500 万个自由职业工作的分析后发现这些工作岗位最可能被 AI 替代
分析了 Upwork 上 2022/11 到2024/02的职位数据,看哪些工作数量下降,哪些工作数量上升,哪些工作时薪下降,哪些 AI 技能的工作发布量增加最多。选择2022/11月作为起始点,是因为 ChatGPT 发布时间是 2022/11/30,而这视为生成式 AI 的起点。
OpenAI宣布收购 Rockset
这是一家领先的实时分析数据库公司,提供世界级的数据索引和查询能力。 OpenAI称通过这次收购,OpenAI计划将Rockset的技术集成到其产品中,以增强其检索基础设施,使AI能够更好地利用和访问实时数据。
Florence-2:微软开源视觉基础模型
Florence-2 是 Microsoft 在 MIT 许可下开源的轻量级视觉语言模型。该模型在字幕、对象检测、接地和分割等任务中展示了强大的零样本和微调功能。 尽管尺寸很小,但它所取得的结果与大许多倍的模型(如 Kosmos-2)相当。该模型的优势不在于复杂的架构,而在于大规模的...
kijai 开发的 Florence-2 ComfyUI 插件上线
支持从图片生成提示词和指定位置的蒙版。 从图片生成提示词支持三个详细等级,内容会越来越多,蒙版生成类似 SAM 输入区域的单词就行。 提示词推理比 WD14 快非常多,也比较准确。
Diffutoon:将任何真实感视频直接渲染为高清动漫风格
提供了 Colab 笔记,直接运行就可以,不需要摆弄麻烦的 Comfyui 流程和一堆模型了。 Diffutoon 能够以动漫风格渲染出细节丰富、高分辨率和长时间的视频。它还可以通过一个附加模块根据提示编辑内容。
RTranslator :一款开源、免费离线的实时翻译应用
可实现多人、多语言的实时对话翻译 用户可以通过蓝牙耳机连接应用,将手机放进口袋,与他人进行实时语言转换的对话,应用会自动翻译并播报对方的语言。
Runway最新视频生成模型上线
Gen-3 Alpha是Runway的反击之作。Gen-3 Alpha的一大特点是生成的视频具有高精细度,它可以理解并生成复杂的场景和运动画面,还能胜任多种电影艺术手法。
未来的你,麻省理工学院让你与聪明、年长的自己聊天
麻省理工学院的研究人员(麻省理工学院简介)创建了一个 聊天机器人 感动于 人工智能 (AI) 它模拟用户以前的“自我”并提供观察和建议。 目标是鼓励人们今天更多地思考他们明天想成为的人。