作者: Tarogo Cloud - 第 36 頁 - Tarogo Cloud Bloger & Shop

Adobe发布了视频超分项目VideoGigaGAN

VideoGigaGAN，这是一种新的生成 VSR 模型，可以生成具有高频细节和时间一致性的视频。
VideoGigaGAN 基于大规模图像上采样器——GigaGAN。简单地通过添加时间模块将 GigaGAN 扩展到视频模型会产生严重的时间闪烁。
确定了几个关键问题，并提出了显着提高上采样视频的时间一致性的技术。

2 6 月, 2024

AI项目 MicroSoft

微软官方出的 PowerToys

很好用的小工具集合，还是开源的。
尤其是里面的 Text Extractor 用作 OCR 很方便。

当前 PowerToy 实用工具

1 6 月, 2024

AI项目 MicroSoft

GitHub 正式推出 GitHub Copilot Workspace 的技术预览版。

一切从任务开始：从一个 GitHub Issue、Pull Request 或仓库中打开 GitHub Copilot Workspace。（截图显示了 octoacademy 仓库中的一个 Issue。）

1 6 月, 2024

AI项目机器人

中国机器人公司LimX Dynamics

中国机器人公司LimX Dynamics展示了双足平衡和导航技术已经发展到了多么高的水平

专为人体模拟而设计的机器人开发商。公司产品主要专注于运动智能和腿式机器人的研发和制造，包括仿人双足和四足机器人及相关解决方案，应用在工业检测、物流配送、特种作业、家居服务等领域，为为客户提供高品质、创新的产品。

31 5 月, 2024

AI新搜索 AI行业应用 AI项目 MicroSoft

微软必应的一项新专利详细介绍了“视觉搜索”

微软在 Bing 图片搜索中已引入视觉搜索选项，通过识别图片中的内容，并扩展显示相关的图片资源，实现以图搜图功能。

微软计划将必应的图片搜索引入到聊天平台上，增强用户参与度并提供更全面的搜索结果。

31 5 月, 2024

网上课程

谷歌免费发布了一套 15 门课长达 300 小时的机器学习工程师课程。

涵盖了机器学习系统的设计、构建、投产、优化、运转和维护工作。

详细的学习内容有：
• 机器学习基础：涵盖机器学习的基本原理和方法。
• 特征工程：探讨如何有效地处理和转换数据，以提高模型性能。

30 5 月, 2024

AI项目

Synthesia推出虚拟数字人：Expressive-1

Synthesia 是一个基于人工智能的 AI 视频生成制作平台，利用深度学习算法来合成逼真的人脸表情和口型，从而让虚拟的人物能够根据用户输入的文字来说话。用户只需要在网页上输入文字，就可以生成一段专业、有说服力的视频。

Expressive-1能根据文本自动做出皱眉、微笑、皱眉头等表情。

30 5 月, 2024

AI项目工具软件

Hugging Face模型镜像站

AI快站的特点：
高速下载：提供的模型下载速度相对较快，减少等待时间
模型资源丰富：涵盖大部分常用开源模型，更新速度快
支持断点续传：提供下载器，大模型下载时遇到中断也不再是问题

29 5 月, 2024

AI项目多媒体处理

Vidu：可生成16秒、1080P视频的模型

这款模型被视为国内首个达到Sora级别的视频模型。

Vidu 不仅能模拟真实物理世界，还具备丰富的想象力，支持多镜头生成和高时空一致性。

Vidu 模型融合了 Diffusion 与 Transformer 技术，创新性地开发了 U-ViT 架构。

29 5 月, 2024

网上课程

可以在家工作的网站

Scribie
转录的在家工作机会。
将音频和视频转录为文字内容，并从各个公司获得高薪。

28 5 月, 2024

AI项目

通过人工智能教程获得超能力

构建 Perplexity 样式 LLM 答案引擎：前端到后端教程

这个仓库在过去的一周里一直在流行
关于从头开始构建答案引擎的精彩介绍！

28 5 月, 2024

AI项目开源项目

企图通过开源复现SORA的三个项目

Open-Sora
Colossal-AI 团队牵头的项目，目前发布了 1.1 模型，支持 2s~15s，144p 到 720p，任何宽高比文本到图像，文本到视频，图像到视频，视频到视频，无限时间生成的版本。

27 5 月, 2024

AI项目

亚马逊推出了 Amazon Q AI 助手

Amazon Q 不仅可以生成高度准确的代码，还可以进行测试、调试，并具有多步骤规划和推理功能，可以转换和实施根据开发人员请求生成的新代码。 Amazon Q 还通过连接到企业数据存储库以逻辑方式汇总数据、分析趋势，使员工能够更轻松地获得跨业务数据的问题的答案，例如公司政策、产品信息、业务成果、代码库、员工和许多其他主题，并参与有关数据的对话。

27 5 月, 2024

AI项目医疗AI

希波克拉底：用于推进医疗保健领域大型语言模型的开源机器学习框架

Koç 大学、Hacettepe 大学、Yıldız Technical University 和 Robert College 的研究人员推出了“Hippocrates”，这是一个专为 LLMs 医疗保健应用量身定制的开源框架。与依赖专有数据的先前模型不同，希波克拉底授予对其广泛资源的完全访问权限，从而促进医疗人工智能研究领域的更大创新和协作。该框架的突出之处在于将持续的预训练和强化学习与人类专家的反馈相结合，增强了模型在医疗环境中的实用性。

26 5 月, 2024

AI项目 Meta 医疗AI

基于LLAMA3构建的医疗领域的多模态模型

@ICepfl 和 @YaleMed 的研究人员联手构建了 Meditron，这是一款适用于资源匮乏的医疗环境的 LLM 套件。借助 Llama 3，他们的新模型在 MedQA 和 MedMCQA 等基准测试中优于其参数类别中的大多数开放模型。

26 5 月, 2024

AI项目 Alphabet 医疗AI

谷歌发布基于 Gemini 微调的医疗领域模型 Med-Gemini

在临床推理、多模态理解和长文本处理方面都有很大的提升。

研究人员用了14个医疗基准测试Med-Gemini的能力。

结果发现,它在10个基准上都取得了最佳表现,远超之前最强的GPT-4模型。

25 5 月, 2024

Tarogo Cloud

Adobe发布了视频超分项目VideoGigaGAN

微软官方出的 PowerToys

GitHub 正式推出 GitHub Copilot Workspace 的技术预览版。

中国机器人公司LimX Dynamics

微软必应的一项新专利详细介绍了“视觉搜索”

谷歌免费发布了一套 15 门课长达 300 小时的机器学习工程师课程。

Synthesia推出虚拟数字人：Expressive-1

Hugging Face模型镜像站

Vidu：可生成16秒、1080P视频的模型

可以在家工作的网站

通过人工智能教程获得超能力

企图通过开源复现SORA的三个项目

亚马逊推出了 Amazon Q AI 助手

希波克拉底：用于推进医疗保健领域大型语言模型的开源机器学习框架

基于LLAMA3构建的医疗领域的多模态模型

谷歌发布基于 Gemini 微调的医疗领域模型 Med-Gemini

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email