PainterLeaf 是一个开源的数字绘画应用,旨在为艺术家和创作者提供高效且直观的绘画工具。该项目支持多层次绘图,允许用户自定义画笔、调色板以及绘画工具,以适应不同的创作需求。PainterLeaf 还包含图像编辑功能,帮助用户调整图像的色彩、对比度和亮度等。
分类: AI行业应用
Sana:高效的文本到图像生成框架,能够生成4K高清图像
Sana 是 NVIDIA 发布的一个开源项目,专为加速大规模深度学习模型训练而设计。通过 GPU 加速、分布式训练以及高效的数据处理,Sana 极大提升了计算机视觉、自然语言处理等任务的训练效率。项目提供模块化设计,支持多种神经网络架构,并可在多个 GPU...
一个高容量的真实世界图像恢复开源项目
DreamClear 是一个开源项目,利用深度学习技术,特别是卷积神经网络(CNN),进行图像去噪和增强。通过训练深度神经网络,DreamClear 能有效去除图像中的噪声并恢复图像的清晰度,尤其适用于低光照或损坏的图像。该项目支持自定义模型训练和优化,适应不同的应用场景。DreamClear...
几个免费AI绘画工具网站浏览
YFT Pro Editor 是一个基于 Web 的 AI 设计和编辑工具,专注于生成和编辑高质量的图像。它适用于设计师、艺术家和创作者,提供多种 AI 辅助功能,如智能修图、样式转换和自动优化。该平台简化了设计流程,使用户能够快速创建视觉内容,而无需掌握复杂的设计软件。 CivitAI...
利用人工智能技术将图像转换为文本提示词的工具
Image to Prompt 是一个 AI 工具,可将图像转换为精准的文本提示词。用户可上传 JPEG、PNG...
人形机器人设计的框架:ASAP
ASAP(Aligning Simulation and Real-world Physics),一个两阶段框架,用于解决人形机器人模拟与现实世界的动力学不匹配问题,以提升全身运动的敏捷性和协调性。 第一阶段:在模拟环境中使用人类运动数据训练运动跟踪策略。...
Web应用程序:支持文本到图像和图像到文本的转换
网站功能:AI 图像生成 网站名称:PainterLeaf 网站简介:一个免费的Web应用程序,支持文本到图像和图像到文本的转换。 支持多种模型,包括Flux.1和StableDiffusion 3.5,可以通过输入文本生成图像,或将本地图像转换为文本提示。
Riffusion FUZZ 音乐生成模型
使用扩散技术生成完整的三分钟以上歌曲 简介:FUZZ 是 Riffusion 推出的最新音乐生成模型,利用扩散模型生成音乐谱图,并转换为音轨可供下载。尽管目前中文语言能力有待提高,但 FUZZ 的功能与 Suno V2 相当,且承诺在 GPU 资源允许的情况下保持免费。...
一个专注于AI视频生成的社区平台:MiniMaxAI
网站功能:AI 视频生成 网站简介:一个专注于AI视频生成的社区平台,通过用户生成的视频、教程和博客,激发创作者的灵感。 可以利用MiniMax AI的强大功能,将文本和图像转换为动态视频,快速生成高质量的视觉内容。 大語言模型(LLMs )和多模型模型已成為改變遊戲規則的人
X-to-Voice:自动生成能说话的个人资料头像
ElevenLabs 发布了一个开源的小项目,X-to-Voice ,允许用户通过分析 Twitter 资料生成自定义的声音和头像。这个项目使用了 ElevenLabs 的新声音设计 API 和 Taedra 动态头像生成工具。 用户可以输入 Twitter...
一个完全本地运行的开源语音转文本 API
该项目基于 OpenAI 的 Whisper 模型,并利用 FastAPI 的异步特性对其进行高效包装,支持异步任务队列,文件处理,网络爬虫,以及更多自定义功能。 「Fast-Powerful-Whisper-AI-Services-API 」的愿景是打造一个强大且开箱即用的 Whisper...
Gemini Search 一个基于Gemini的AI搜索引擎
一個 Perplexity 風格的搜尋引擎,由 Google 的 Gemini 2.0 Flash 模型提供支持,並以搜尋為基礎。透過即時網路資源和引文獲得人工智慧驅動的問題答案。 Search 是 Perplexity 的 Gemini 版平替,基于
NoteGen:一个跨平台AI笔记APP
NoteGen 是一个跨平台的笔记 APP,目前支持 Mac、Windows、Linux 开源地址在视频下方的描述中 软件安装完毕后,请先在设置页面配置 API Key 后即可正常使用。 Mac 用户需要配置屏幕录制权限,才可以使用截图记录功能。 同步和图床功能(可选),需要创建 Github...
VITA开源版视频+语音模型
一个开源的多模态大语言模型,旨在实现实时的视觉和语音交互。 能够同时处理视频、图像、文本和音频数据,通过减少交互延迟、增强语音处理能力和改进多模态理解,达到了接近GPT-4o的水平。 顯著降低交互延遲。
3MinTop – AI 驱动的电子书阅读助手
一款 AI 阅读助手,旨在帮助用户在短时间内掌握书籍的核心内容,培养良好的阅读习惯。 本视频对这个来网站一个實操,体验一下这个电子书阅读助手 它提供每章 3 分钟的精华摘要、简洁明了的内容解析、智能生成思维导图、内置电子书阅读器、全文翻译、内容问答以及进度追踪等。 目前完全免费
Ebook2Audiobook开源项目
将电子书自动转换为有声书 支持语音克隆、多种语言 ebook2audiobookXTTS 是一个开源项目,旨在将电子书自动转换为有声书,并支持多种语言、语音克隆和章节信息的生成。该项目结合了 Calibre(电子书转换工具)和 Coqui...