分類: AI项目 - 第 17 頁 - Tarogo Cloud Bloger & Shop

AI项目

MagicTime 在线体验地址放出

它能够从文本描述中生成反映真实世界物理变化过程的时间延迟视频。
所谓“变形时间延迟视频“指的是展示某个对象或场景在较长时间跨度内发生的逐步变化的视频。

7 6 月, 2024

AI项目 Alphabet

Gemini1.5 Pro+StableDiffusion+ComfyUI=DALL·3

开源社区一直以来的梦想：DALLE3交互和提示词生成能力 + 无数SD模型出图能力，这不巧了嘛
百万上下文、多模态+多轮对话、打标/反推

7 6 月, 2024

AI项目 Alphabet 医疗AI

Google DeepMind 发布了 AlphaFold 3

能够预测所有生命分子结构和相互作用 AI 模型

该模型能够生成蛋白质、DNA 和其他分子的 3D 结构，并揭示它们如何组合在一起。

该模型还能够模拟影响细胞健康的化学变化，并检测可能导致疾病的异常。

AlphaFold 3 将为全球科学研究人员和机构免费开放。它的高精度和新一代架构可支持药物发现和生物学的突破性进展。

6 6 月, 2024

AI项目机器人

特斯拉放出了擎天柱机器人最新训练视频

最罕见的是特斯拉曝光了机器人的训练情况

似乎是完全靠视觉辅助和人类示范进行训练，也就是和特斯拉汽车一样的逻辑！

6 6 月, 2024

AI项目 MicroSoft

微软开发出数据驱动的AI天气预测模型

能准确预报未来 30 天天气情况

该模型基于微软 Start 团队近日的最新研究成果，结合了 5 种不同的人工智能模型和 3 种深度学习架构，并利用了过去数十年的天气数据进行训练，能够准确预测 30 天内的天气预报。

5 6 月, 2024

AI项目医疗AI

科学家通过机器学习模型，为脓毒症治疗“争分夺秒”

这项研究的结果表明，个性化的抗生素治疗时间建议模型可以帮助医生更好地决策，避免治疗延迟或过早给药带来的潜在危害，同时降低患者的死亡率和医疗成本。

5 6 月, 2024

AI项目

应用于客服场景的GPT

用于客户服务问答的知识图检索增强生成

展示了一个使用知识图谱构建、检索和问题回答的系统的整个工作流程，尤其是在技术支持和问题解决方面。

4 6 月, 2024

AI项目 Alphabet

Google推出由 Gemini 驱动的网络安全产品

Google 威胁情报的用途示例：

识别和防御网络钓鱼攻击：

假设一家企业遭遇了钓鱼电子邮件攻击，员工可能收到包含恶意链接或附件的电子邮件。

Google Threat Intelligence可以利用其庞大的电子邮件监控网络，检测并阻止这些恶意邮件的传播。

4 6 月, 2024

AI项目

Apple 推出 OpenELM

CoreNet 是一个深度神经网络工具包，允许研究人员和工程师为各种任务训练标准和新颖的小型和大型模型，包括基础模型（例如 CLIP 和 LLM）、对象分类、对象检测，和语义分割。

Apple 使用 CoreNet 进行的研究工作

3 6 月, 2024

AI项目多媒体处理开源项目

OpenVoice V2版本发布

OpenVoice，这是一种多功能的即时语音克隆方法，只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。除了复制参考说话者的音色之外，OpenVoice 还可以对语音风格进行精细控制，包括情感、口音、节奏、停顿和语调。

3 6 月, 2024

Adobe AI项目多媒体处理

Adobe发布了视频超分项目VideoGigaGAN

VideoGigaGAN，这是一种新的生成 VSR 模型，可以生成具有高频细节和时间一致性的视频。
VideoGigaGAN 基于大规模图像上采样器——GigaGAN。简单地通过添加时间模块将 GigaGAN 扩展到视频模型会产生严重的时间闪烁。
确定了几个关键问题，并提出了显着提高上采样视频的时间一致性的技术。