分类: 多媒体处理

Google Whisk:革新图像生成的全新工具

Google Whisk 是一款创新的图像生成工具,用户无需输入复杂的文本提示,只需上传参考图片,即可快速生成符合预期的图像。 该工具结合了 Gemini 和 Imagen 3 模型,提供直观且高效的创作体验,适用于多种创作需求。

让静态角色绘画实现流畅的动态效果

该项目是一个关于 数字人(Digital Human)和 Live2D 技术 的精选资源列表,包含相关的开源工具、学习资料、示例代码和社区讨论。Live2D 作为一种 2D 动画技术,能够让静态角色绘画实现流畅的动态效果,广泛应用于 虚拟主播(Vtuber)、游戏角色动画、AI...

PainterLeaf是一个免费的模型创建AI绘画网站

PainterLeaf 是一个开源的数字绘画应用,旨在为艺术家和创作者提供高效且直观的绘画工具。该项目支持多层次绘图,允许用户自定义画笔、调色板以及绘画工具,以适应不同的创作需求。PainterLeaf 还包含图像编辑功能,帮助用户调整图像的色彩、对比度和亮度等。

一个高容量的真实世界图像恢复开源项目

DreamClear 是一个开源项目,利用深度学习技术,特别是卷积神经网络(CNN),进行图像去噪和增强。通过训练深度神经网络,DreamClear 能有效去除图像中的噪声并恢复图像的清晰度,尤其适用于低光照或损坏的图像。该项目支持自定义模型训练和优化,适应不同的应用场景。DreamClear...

几个免费AI绘画工具网站浏览

YFT Pro Editor 是一个基于 Web 的 AI 设计和编辑工具,专注于生成和编辑高质量的图像。它适用于设计师、艺术家和创作者,提供多种 AI 辅助功能,如智能修图、样式转换和自动优化。该平台简化了设计流程,使用户能够快速创建视觉内容,而无需掌握复杂的设计软件。 CivitAI...

Riffusion FUZZ 音乐生成模型

使用扩散技术生成完整的三分钟以上歌曲 简介:FUZZ 是 Riffusion 推出的最新音乐生成模型,利用扩散模型生成音乐谱图,并转换为音轨可供下载。尽管目前中文语言能力有待提高,但 FUZZ 的功能与 Suno V2 相当,且承诺在 GPU 资源允许的情况下保持免费。...

一个专注于AI视频生成的社区平台:MiniMaxAI

网站功能:AI 视频生成 网站简介:一个专注于AI视频生成的社区平台,通过用户生成的视频、教程和博客,激发创作者的灵感。 可以利用MiniMax AI的强大功能,将文本和图像转换为动态视频,快速生成高质量的视觉内容。 大語言模型(LLMs )和多模型模型已成為改變遊戲規則的人

VITA开源版视频+语音模型

一个开源的多模态大语言模型,旨在实现实时的视觉和语音交互。 能够同时处理视频、图像、文本和音频数据,通过减少交互延迟、增强语音处理能力和改进多模态理解,达到了接近GPT-4o的水平。 顯著降低交互延遲。

退出移动版