標籤: AI图像 - 第 4 頁 - Tarogo Cloud Bloger & Shop

AI巨头 AI行业应用 AI项目多媒体处理开源项目

MagicQuill智能互动图像编辑系统

MagicQuill 是由蚂蚁技术研究院开发的智能交互式图像编辑系统，旨在实现高效、精确的图像编辑。项目结合了用户友好的界面和强大的 AI 功能，使用户可以通过最小的输入完成复杂的编辑任务

22 3 月, 2025

AI行业应用 AI项目多媒体处理开源项目

PhotoDoodle开源AI艺术编辑工具

PhotoDoodle 是由 ShowLab 开发的开源图像编辑工具，旨在通过人工智能技术为照片添加艺术化的涂鸦元素。用户只需输入简单的文本提示，如“为猫添加光环和翅膀”，即可在保持原始照片背景完整性的同时，生成与之自然融合的艺术元素

19 3 月, 2025

AI行业应用 AI项目开源项目文档AI

DeepChat：连接强大AI与个人世界的智能助手

DeepChat 是由 ThinkInAIXYZ 团队开发的开源智能助手项目，旨在将先进的人工智能技术融入用户的日常生活，提供高效、自然的聊天体验。

18 3 月, 2025

AI行业应用多媒体处理

基于深度学习的实时人像生成与编辑平台

AdvancedLivePortrait-WebUI 是一个基于深度学习的图像生成与编辑平台，用户通过直观的 Web 界面能够实时创建和调整个性化人像。项目结合图像处理、深度学习与前端技术，为用户提供了一个流畅且富有互动性的体验。

12 3 月, 2025

AI行业应用多媒体处理

FLUX图像AI模型生成器（无需注册）

FLUX 是由 Black Forest Labs 开发的先进文本到图像 AI 模型，旨在生成高质量的图像，包括发型设计等。

11 3 月, 2025

AI巨头 AI行业应用多媒体处理

WanX 2.1 – 阿里巴巴先进视频生成模型

WanX 2.1 是由阿里巴巴通义万相团队开发的前沿视频生成模型，代表了 AI 驱动视觉内容创作的重大突破。它不仅支持高质量的文本到视频和图像到视频生成，还在物理模拟、多语言支持和视觉一致性方面表现出色。通过其开源计划，WanX 2.1 将为全球开发者提供强大的工具，助力创意内容生产、教育培训、娱乐和营销等多个领域的应用创新。

10 3 月, 2025

AI巨头 AI行业应用 Alphabet 多媒体处理

Google Whisk：革新图像生成的全新工具

Google Whisk 是一款创新的图像生成工具，用户无需输入复杂的文本提示，只需上传参考图片，即可快速生成符合预期的图像。
该工具结合了 Gemini 和 Imagen 3 模型，提供直观且高效的创作体验，适用于多种创作需求。

9 3 月, 2025

AI行业应用 AI项目多媒体处理开源项目

PainterLeaf是一个免费的模型创建AI绘画网站

PainterLeaf 是一个开源的数字绘画应用，旨在为艺术家和创作者提供高效且直观的绘画工具。该项目支持多层次绘图，允许用户自定义画笔、调色板以及绘画工具，以适应不同的创作需求。PainterLeaf 还包含图像编辑功能，帮助用户调整图像的色彩、对比度和亮度等。

2 3 月, 2025

AI巨头 AI行业应用 AI项目 Nvdia 多媒体处理开源项目

Sana：高效的文本到图像生成框架，能够生成4K高清图像

Sana 是 NVIDIA 发布的一个开源项目，专为加速大规模深度学习模型训练而设计。通过 GPU 加速、分布式训练以及高效的数据处理，Sana 极大提升了计算机视觉、自然语言处理等任务的训练效率。项目提供模块化设计，支持多种神经网络架构，并可在多个 GPU 上高效运行，确保大规模数据集的高效训练与优化。

1 3 月, 2025

AI行业应用 AI项目多媒体处理开源项目

DreamClear 是一个开源项目，利用深度学习技术，特别是卷积神经网络（CNN），进行图像去噪和增强。通过训练深度神经网络，DreamClear 能有效去除图像中的噪声并恢复图像的清晰度，尤其适用于低光照或损坏的图像。该项目支持自定义模型训练和优化，适应不同的应用场景。DreamClear 提供了高效的图像处理工具，能够自动化图像去噪过程，并能增强图像细节，避免过度平滑。用户可以在自己的数据集上进行模型训练或直接应用预训练模型，广泛适用于图像处理、计算机视觉和人工智能领域。

28 2 月, 2025

AI行业应用 AI项目多媒体处理开源项目

几个免费AI绘画工具网站浏览

YFT Pro Editor 是一个基于 Web 的 AI 设计和编辑工具，专注于生成和编辑高质量的图像。它适用于设计师、艺术家和创作者，提供多种 AI 辅助功能，如智能修图、样式转换和自动优化。该平台简化了设计流程，使用户能够快速创建视觉内容，而无需掌握复杂的设计软件。
CivitAI 是一个专门为 AI 生成艺术（AI Art）社区打造的平台，支持用户分享和下载 Stable Diffusion 相关的模型、LoRA、文本提示（prompts）等。该网站汇聚了众多 AI 艺术爱好者，提供丰富的 AI 生成工具和资源，帮助用户优化和训练 AI 模型，提升图像生成的质量和风格。

27 2 月, 2025

AI行业应用多媒体处理

利用人工智能技术将图像转换为文本提示词的工具

Image to Prompt 是一个 AI 工具，可将图像转换为精准的文本提示词。用户可上传 JPEG、PNG 等格式的图片，系统会快速生成描述，可用于创意写作、广告营销、游戏开发等领域。网站提供示例图像，支持个性化描述选项，提升文本匹配度。转换过程简单，上传图像后点击转换，即可获取文本提示，并可复制使用。生成的提示词适用于 Flux1、Stable Diffusion、Midjourney 等 AI 平台。网站不存储用户上传的图片，确保隐私安全。该工具可提升创作效率，为各种创意项目提供灵感。

25 2 月, 2025

AI行业应用 AI项目多媒体处理开源项目

Web应用程序：支持文本到图像和图像到文本的转换

网站功能：AI 图像生成
网站名称：PainterLeaf
网站简介：一个免费的Web应用程序，支持文本到图像和图像到文本的转换。
支持多种模型，包括Flux.1和StableDiffusion 3.5，可以通过输入文本生成图像，或将本地图像转换为文本提示。

21 2 月, 2025

AI行业应用 AI资讯 AI项目多媒体处理

一个专注于AI视频生成的社区平台：MiniMaxAI

网站功能：AI 视频生成
网站简介：一个专注于AI视频生成的社区平台，通过用户生成的视频、教程和博客，激发创作者的灵感。
可以利用MiniMax AI的强大功能，将文本和图像转换为动态视频，快速生成高质量的视觉内容。
大語言模型（LLMs ）和多模型模型已成為改變遊戲規則的人

18 2 月, 2025

AI行业应用 AI项目多媒体处理开源项目

X-to-Voice：自动生成能说话的个人资料头像

ElevenLabs 发布了一个开源的小项目，X-to-Voice ，允许用户通过分析 Twitter 资料生成自定义的声音和头像。这个项目使用了 ElevenLabs 的新声音设计 API 和 Taedra 动态头像生成工具。
用户可以输入 Twitter 账号名称，系统将分析其资料数据生成特有的语音和动画头像。

17 2 月, 2025

AI行业应用 AI项目多媒体处理开源项目

VITA开源版视频+语音模型

一个开源的多模态大语言模型，旨在实现实时的视觉和语音交互。
能够同时处理视频、图像、文本和音频数据，通过减少交互延迟、增强语音处理能力和改进多模态理解，达到了接近GPT-4o的水平。
顯著降低交互延遲。

10 2 月, 2025

AI图像

MagicQuill智能互动图像编辑系统

PhotoDoodle开源AI艺术编辑工具

DeepChat：连接强大AI与个人世界的智能助手

基于深度学习的实时人像生成与编辑平台

FLUX图像AI模型生成器（无需注册）

WanX 2.1 – 阿里巴巴先进视频生成模型

Google Whisk：革新图像生成的全新工具

PainterLeaf是一个免费的模型创建AI绘画网站

Sana：高效的文本到图像生成框架，能够生成4K高清图像

一个高容量的真实世界图像恢复开源项目

几个免费AI绘画工具网站浏览

利用人工智能技术将图像转换为文本提示词的工具

Web应用程序：支持文本到图像和图像到文本的转换

一个专注于AI视频生成的社区平台：MiniMaxAI

X-to-Voice：自动生成能说话的个人资料头像

VITA开源版视频+语音模型

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email