分类: AI项目

Adobe 的新工具: Project Neo

通过3D技术,Project Neo能够为原本平面的2D图像添加立体效果。 能够快速的为图标、动画插图创建独特的3D形状。 通过简单的操作,你可以在几分钟内完成图标、插图设计,极大地提高了工作效率。 Project...

ZeST:从单个图像进行零次材料传输

ZeST(Zero-Shot Material Transfer)是一种基于零样本的方法 介绍 ZeST,这是一种零样本、免训练的方法,用于 (a) 图像到图像的材料传输。 (b) ZeST 可以轻松扩展以在单个图像中执行多种材质编辑

MagicTime 在线体验地址放出

它能够从文本描述中生成反映真实世界物理变化过程的时间延迟视频。 所谓“变形时间延迟视频“指的是展示某个对象或场景在较长时间跨度内发生的逐步变化的视频。

Google DeepMind 发布了 AlphaFold 3

能够预测所有生命分子结构和相互作用 AI 模型 该模型能够生成蛋白质、DNA 和其他分子的 3D 结构,并揭示它们如何组合在一起。 该模型还能够模拟影响细胞健康的化学变化,并检测可能导致疾病的异常。 AlphaFold 3...

微软开发出数据驱动的AI天气预测模型

能准确预报未来 30 天天气情况 该模型基于微软 Start 团队近日的最新研究成果,结合了 5 种不同的人工智能模型和 3 种深度学习架构,并利用 了过去数十年的天气数据进行训练,能够准确预测 30 天内的天气预报。

应用于客服场景的GPT

用于客户服务问答的知识图检索增强生成 展示了一个使用知识图谱构建、检索和问题回答的系统的整个工作流程,尤其是在技术支持和问题解决方面。

Google推出由 Gemini 驱动的网络安全产品

Google 威胁情报的用途示例: 识别和防御网络钓鱼攻击: 假设一家企业遭遇了钓鱼电子邮件攻击,员工可能收到包含恶意链接或附件的电子邮件。 Google Threat Intelligence可以利用其庞大的电子邮件监控网络,检测并阻止这些恶意邮件的传播。

Apple 推出 OpenELM

CoreNet 是一个深度神经网络工具包,允许研究人员和工程师为各种任务训练标准和新颖的小型和大型模型,包括基础模型(例如 CLIP 和 LLM)、对象分类、对象检测,和语义分割。 Apple 使用 CoreNet 进行的研究工作

OpenVoice V2版本发布

OpenVoice,这是一种多功能的即时语音克隆方法,只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。

Adobe发布了视频超分项目VideoGigaGAN

VideoGigaGAN,这是一种新的生成 VSR 模型,可以生成具有高频细节和时间一致性的视频。 VideoGigaGAN 基于大规模图像上采样器——GigaGAN。简单地通过添加时间模块将 GigaGAN 扩展到视频模型会产生严重的时间闪烁。...