作者: Tarogo Cloud

微软开发出数据驱动的AI天气预测模型

能准确预报未来 30 天天气情况 该模型基于微软 Start 团队近日的最新研究成果,结合了 5 种不同的人工智能模型和 3 种深度学习架构,并利用 了过去数十年的天气数据进行训练,能够准确预测 30 天内的天气预报。

应用于客服场景的GPT

用于客户服务问答的知识图检索增强生成 展示了一个使用知识图谱构建、检索和问题回答的系统的整个工作流程,尤其是在技术支持和问题解决方面。

Google推出由 Gemini 驱动的网络安全产品

Google 威胁情报的用途示例: 识别和防御网络钓鱼攻击: 假设一家企业遭遇了钓鱼电子邮件攻击,员工可能收到包含恶意链接或附件的电子邮件。 Google Threat Intelligence可以利用其庞大的电子邮件监控网络,检测并阻止这些恶意邮件的传播。

Apple 推出 OpenELM

CoreNet 是一个深度神经网络工具包,允许研究人员和工程师为各种任务训练标准和新颖的小型和大型模型,包括基础模型(例如 CLIP 和 LLM)、对象分类、对象检测,和语义分割。 Apple 使用 CoreNet 进行的研究工作

OpenVoice V2版本发布

OpenVoice,这是一种多功能的即时语音克隆方法,只需要参考说话者的一个简短的音频剪辑即可复制他们的声音并生成多种语言的语音。除了复制参考说话者的音色之外,OpenVoice 还可以对语音风格进行精细控制,包括情感、口音、节奏、停顿和语调。

Adobe发布了视频超分项目VideoGigaGAN

VideoGigaGAN,这是一种新的生成 VSR 模型,可以生成具有高频细节和时间一致性的视频。 VideoGigaGAN 基于大规模图像上采样器——GigaGAN。简单地通过添加时间模块将 GigaGAN 扩展到视频模型会产生严重的时间闪烁。...

Cloudflare R2对比 AWS S3

对象存储有时也称为 Blob 存储,可以存储任意的大型非结构化文件。我们常用的有 AWS 的 S3、阿里云的 OSS、腾讯云的 COS、华为云的 OBS,都是对象存储,他们都可以为我们提供延迟一致、持久性高和容量无限的服务,免去了我们本地文件系统的共享、备份等痛点。

Synthesia推出虚拟数字人:Expressive-1

Synthesia 是一个基于人工智能的 AI 视频生成制作平台,利用深度学习算法来合成逼真的人脸表情和口型,从而让虚拟的人物能够根据用户输入的文字来说话。用户只需要在网页上输入文字,就可以生成一段专业、有说服力的视频。 Expressive-1能根据文本自动做出皱眉、微笑、皱眉头等表情。

Vidu:可生成16秒、1080P视频的模型

这款模型被视为国内首个达到Sora级别的视频模型。 Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。 Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。