Image to Prompt 是一个 AI 工具,可将图像转换为精准的文本提示词。用户可上传 JPEG、PNG...
作者: Tarogo Cloud
ChatGPT的几个工具
ChatGPT 搜索插件:增强 ChatGPT 的信息获取能力,提供实时搜索功能,让 AI 回答更准确、最新。适用于需要实时信息或深入研究的用户。 Telegram GPT Worker:将 ChatGPT 集成到...
GitHub的AI 开源项目精选-1
AI Collection:汇聚机器学习、深度学习、NLP 等资源,是一站式查找平台。 Top AI Tools:精选热门实用 AI 工具,涵盖图像识别、数据分析等领域。 Awesome AI Tools:精心挑选工具,含框架对比与各领域应用案例。 Awesome...
人形机器人设计的框架:ASAP
ASAP(Aligning Simulation and Real-world Physics),一个两阶段框架,用于解决人形机器人模拟与现实世界的动力学不匹配问题,以提升全身运动的敏捷性和协调性。 第一阶段:在模拟环境中使用人类运动数据训练运动跟踪策略。...
Web应用程序:支持文本到图像和图像到文本的转换
网站功能:AI 图像生成 网站名称:PainterLeaf 网站简介:一个免费的Web应用程序,支持文本到图像和图像到文本的转换。 支持多种模型,包括Flux.1和StableDiffusion 3.5,可以通过输入文本生成图像,或将本地图像转换为文本提示。
Riffusion FUZZ 音乐生成模型
使用扩散技术生成完整的三分钟以上歌曲 简介:FUZZ 是 Riffusion 推出的最新音乐生成模型,利用扩散模型生成音乐谱图,并转换为音轨可供下载。尽管目前中文语言能力有待提高,但 FUZZ 的功能与 Suno V2 相当,且承诺在 GPU 资源允许的情况下保持免费。...
RLLM 一款由 LLM 驱动的 RSS 阅读器
RLLM 一款由 LLM 驱动的 RSS 阅读器 软件平台:iOS 软件介绍:一款创新性的 RSS 阅读器,它借助大语言模型为用户提供智能阅读体验。 软件支持 RSS 1.0、2.0 和 Atom 订阅源,不仅允许用户阅读和收藏文章,还利用 LLM 实现文章自动摘要、洞察分析及每日阅读总结。
一个专注于AI视频生成的社区平台:MiniMaxAI
网站功能:AI 视频生成 网站简介:一个专注于AI视频生成的社区平台,通过用户生成的视频、教程和博客,激发创作者的灵感。 可以利用MiniMax AI的强大功能,将文本和图像转换为动态视频,快速生成高质量的视觉内容。 大語言模型(LLMs )和多模型模型已成為改變遊戲規則的人
X-to-Voice:自动生成能说话的个人资料头像
ElevenLabs 发布了一个开源的小项目,X-to-Voice ,允许用户通过分析 Twitter 资料生成自定义的声音和头像。这个项目使用了 ElevenLabs 的新声音设计 API 和 Taedra 动态头像生成工具。 用户可以输入 Twitter...
一个完全本地运行的开源语音转文本 API
该项目基于 OpenAI 的 Whisper 模型,并利用 FastAPI 的异步特性对其进行高效包装,支持异步任务队列,文件处理,网络爬虫,以及更多自定义功能。 「Fast-Powerful-Whisper-AI-Services-API 」的愿景是打造一个强大且开箱即用的 Whisper...
TabMark – 新标签页书签管理插件
TabMark 是一款功能强大且简洁的 Chrome 浏览器插件,它为你的浏览体验带来全新的便利。将新标签页打造成专属的书签管理中心,让你轻松访问常用网站,整理和归类书签,提升工作效率!
新版Claude 3.5 Sonnet将可进行电脑操作
Anthropic宣布了升级版 Claude 3.5 Sonnet,以及新模型Haiku。新版在各方面都比前代有显著提升,尤其是在编码方面,这一领域它本来就处于领先地位。 Claude API 还将支持电脑操作,并已进入公共测试阶段。
Gemini Search 一个基于Gemini的AI搜索引擎
一個 Perplexity 風格的搜尋引擎,由 Google 的 Gemini 2.0 Flash 模型提供支持,並以搜尋為基礎。透過即時網路資源和引文獲得人工智慧驅動的問題答案。 Search 是 Perplexity 的 Gemini 版平替,基于
让可穿戴设备无需电池也能工作
Power-over-Skin “皮肤供电”技术 ,让可穿戴设备无需电池也能工作 现代计算设备功能强大且小巧,可以轻松佩戴在身体上。然而,电池成为设计和用户体验的主要障碍,增加了设备的重量和体积,并且需要定期充电和移除设备。...
NoteGen:一个跨平台AI笔记APP
NoteGen 是一个跨平台的笔记 APP,目前支持 Mac、Windows、Linux 开源地址在视频下方的描述中 软件安装完毕后,请先在设置页面配置 API Key 后即可正常使用。 Mac 用户需要配置屏幕录制权限,才可以使用截图记录功能。 同步和图床功能(可选),需要创建 Github...
VITA开源版视频+语音模型
一个开源的多模态大语言模型,旨在实现实时的视觉和语音交互。 能够同时处理视频、图像、文本和音频数据,通过减少交互延迟、增强语音处理能力和改进多模态理解,达到了接近GPT-4o的水平。 顯著降低交互延遲。