分类: AI行业应用

Odyssey:提供影视级别的 AI 视频生成和编辑工具

高质量几何生成:生成精细的三维几何形状,用于构建逼真的场景和物体。 写实材质生成:创建高度真实的材质,使得生成的物体看起来更加生动和自然。 惊艳的光照效果:生成和控制光照效果,增强场景的视觉冲击力和氛围。 可控的运动生成:创建和调整动画和运动效果,使得场景和角色更加动态和逼真。

Color Health 与OpenAI 合作 开发出Cancer Copilot

copilot旨在协助医生,而不是取代医生。他说:“我们称其为copilot,是因为它与工程助手的思维和模式非常相似。这并不是说copilot取代了(软件)工程师。” OpenAI和Color Health于去年开始研发本周一发布的copilot。

根据单张图像和音频输入生成唱歌和说话视频

和EMO相比,该项目已开源😄 它能够通过输入语音,生成对应的人物嘴唇同步、表情变化和姿态变化的动画。 提高了语音与生成动画之间的对齐精度,使动画的嘴唇、表情和姿态与语音更匹配。 提供对角色表情、姿态和嘴唇运动的精确控制。 支持多种表情和姿态的自适应控制,增强动画的多样性和真实性。

苹果发布的Translation API

苹果新出的翻译 API,不需要联网,完全使用本机大语言模型。 使用翻译框架提供应用内翻译。您可以使用内置 UI,让系统代表您向用户提供翻译。或者您可以使用该框架来定制翻译体验。 要提供内置系统翻译体验,请将视图修饰符锚定到包含要翻译的文本的 SwiftUI 视图。当您希望显示内置系统翻译...

谷歌:个人健康大语言模型和智能体研究

整合到临床任务中的移动和可穿戴设备为个人健康监测提供了丰富、连续和纵向的数据来源。本文提出一个新模型,个人健康大型语言模型(PH-LLM),一个经过微调的Gemini版本,用于对数字时间序列个人健康数据的文本理解和推理,用于睡眠和健身应用。

Google AI 医学影像模型

机器学习 (ML) 有潜力彻底改变医疗保健,从减少工作量和提高效率到发现新的生物标志物和疾病信号。为了负责任地利用这些好处,研究人员采用可解释性技术来了解机器学习模型如何进行预测。然而,当前基于显着性的方法突出了重要的图像区域,通常无法解释特定的视觉变化如何驱动机器学习决策。