IT/AI知识库: 跟踪最新的IT/AI类资讯

OpenAI创始人成立新公司,将推出“AI健康教练”

最新成立的Thrive AI Health得到了Huffington的精神健康公司Thrive Global和OpenAI创业基金的支持。该公司计划打造一个”AI健康教练”,为睡眠、饮食、健身、压力管理和人际关系等方面提供个性化建议。

前Fitbit高管DeCarlos Love被任命为CEO。战略投资者包括沃尔玛联合创始人Helen Walton的爱丽丝·沃尔顿基金会。爱丽丝·沃尔顿医学院是Thrive AI Health的首批医疗合作伙伴之一。

谷歌将Gemini 1.5 Pro安装到机器人上 实现记忆导航能力

Google DeepMind 他们把一个叫Gemini1.5Pro的系统装到了机器人身上。这可不是普通的升级,这玩意儿让机器人有了记忆导航的超能力。

想象一下,这个机器人在将近9000平方英尺的地盘上,能执行57种不同的任务,而且成功率达到了90%。这不是简单的任务,比如找到画画的地方,机器人不仅听懂了,还带你找到了一块大白板。这操作,简直比真人还靠谱。

微软开源下一代RAG技术

检索增强生成(RAG)是一种基于用户查询搜索信息并提供结果作为生成AI答案的参考的技术。
该技术是大多数基于LLM的工具的重要部分,并且大多数RAG方法使用向量相似性作为搜索技术。
GraphRAG使用LLM生成的知识图,在对复杂信息进行文档分析时,大大提高了问答性能。

Odyssey:提供影视级别的 AI 视频生成和编辑工具

高质量几何生成:生成精细的三维几何形状,用于构建逼真的场景和物体。
写实材质生成:创建高度真实的材质,使得生成的物体看起来更加生动和自然。
惊艳的光照效果:生成和控制光照效果,增强场景的视觉冲击力和氛围。
可控的运动生成:创建和调整动画和运动效果,使得场景和角色更加动态和逼真。

三星首款智能戒指Galaxy Ring发布

三星在巴黎举办Unpacked 2024发布会,除了发布Galaxy Z Fold6、Galaxy Z Flip6两款折叠屏手机外,三星还发布了首款智能戒指:Galaxy Ring

Galaxy Ring与普通戒指类似,共九种尺寸,可选钛黑、钛银、钛金三款配色,重量最轻2.3克,戴在手上基本无感。

BBC报道 :一个人使用ChatGPT 取代了60名员工

他们的工作逐渐被 ChatGPT 所取代,而他们的职责则变成了专门修改AI生成的文章,使其不那么机械化和公式化

公司引入了一个自动化系统:经理将文章标题输入在线表单,AI生成大纲,

一款语音工具:sherpa-onnx

一款语音识别、语音合成、说话人识别、说话人验证等集成了多种语音处理功能的工具:sherpa-onnx

支持:语音识别(ASR,支持流式和非流式)、语音合成(TTS)、说话人识别、说话人验证、语种识别、音频标注、声音活动检测(VAD,例如silero-vad)、关键词检测等

根据单张图像和音频输入生成唱歌和说话视频

和EMO相比,该项目已开源😄
它能够通过输入语音,生成对应的人物嘴唇同步、表情变化和姿态变化的动画。
提高了语音与生成动画之间的对齐精度,使动画的嘴唇、表情和姿态与语音更匹配。

提供对角色表情、姿态和嘴唇运动的精确控制。
支持多种表情和姿态的自适应控制,增强动画的多样性和真实性。

AI开源项目:AI Math Notes

AI Math Notes 是一个互动绘图应用程序,用户可以在画布上绘制数学方程。
绘制完方程后,应用程序会使用多模态大语言模型 (LLM) 计算结果,并在等号旁显示。
该应用程序使用 Python 编写,图形用户界面采用 Tkinter 库,图像处理使用 PIL 库。

苹果发布的Translation API

苹果新出的翻译 API,不需要联网,完全使用本机大语言模型。

使用翻译框架提供应用内翻译。您可以使用内置 UI,让系统代表您向用户提供翻译。或者您可以使用该框架来定制翻译体验。

要提供内置系统翻译体验,请将视图修饰符锚定到包含要翻译的文本的 SwiftUI 视图。当您希望显示内置系统翻译 UI 时,将 isPresented 设置为 true。将要翻译的文本传递给 text 参数。

Niceaunties的灵感集

@niceaunties

作者介绍:“Niceaunties”的灵感来自于阿姨文化中荒唐又可爱的行为。 TED 演讲者。奖学金 http://daily.xyz 艺术家。

NVIDIA发布用于训练大语言模型的开源合成数据生成管道

Nemotron-4 340B,一个优化用于NVIDIA NeMo和NVIDIA TensorRT-LLM的模型家族,包括最先进的指令模型和奖励模型,以及用于生成式AI训练的数据集。

NVIDIA今天宣布推出Nemotron-4 340B,这是一组开源模型,开发人员可以使用这些模型生成用于训练大语言模型(LLMs)的合成数据,以应用于医疗、金融、制造、零售等各个行业的商业应用。

NVIDIA 與開發商攜手合作,利用 NVIDIA ACE 數位化身雲端引擎

NVIDIA ACE(Avatar Cloud Engine)是一套可協助開發人員使用生成式AI將數位化身變為現實的技術。透過 ACE,非玩家角色 (NPC) 可以轉變為動態的互動式角色,能夠發起對話,或提供遊戲知識來幫助玩家完成任務。

在 CES 2024 上,我們宣布推出ACE 產品級微服務 ,提供頂尖數位化身開發人員NVIDIA Audio2Face (A2F) 和 NVIDIA Riva 自動語音辨識 (ASR)。