標籤: github - 第 2 頁 - Tarogo Cloud Bloger & Shop

实时和本地语音到文字、翻译、说话人区分的开源项目

WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统，包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术，支持多种语言和说话人识别。

4 10 月, 2025

AI行业应用多媒体处理

Gyroflow：基于陀螺仪数据的视频稳定化应用程序

能够通过运动数据精确稳定视频。支持多种现代相机（如GoPro、Sony、Insta360等）内部记录的陀螺仪数据，也可以使用外部设备（如Betaflight黑匣子）提供的陀螺仪数据

2 10 月, 2025

AI新搜索 AI行业应用

为玩家设计的RAG的智能问答服务

玩游戏时有时候要查攻略，要么切换窗口去查、要么用手机，都不怎么方便。
有 2 个核心功能：
▫️一键呼出：按下Ctrl+Q，无需切屏即可查询攻略
▫️ AI游戏专家：基于Google Gemini + 本地知识库对游戏内容智能问答

1 10 月, 2025

AI行业应用多媒体处理

SnapForge强大且美观的开源图片处理平台

支持多核心并行处理，使复杂的批量图像任务变得更加简单和快速。包括格式转换、智能重命名、AI去背景、交互式去重等多种功能。

30 9 月, 2025

AI行业应用文档AI

让多模型都像OpenAI一样的工具

模拟 Gemini CLI Kiro 客户端请求，兼容 OpenAI API。可每日千次Gemini模型请求，免费使用Kiro 内置 Claude 模型。

29 9 月, 2025

AI行业应用 MCP

SQLBot基于大模型和RAG的智能问数系统

支持快速嵌入到第三方业务系统，也支持被 n8n、MaxKB、Dify、Coze 等 AI 应用开发平台集成调用，让各类应用快速拥有智能问数能力。

27 9 月, 2025

AI行业应用多媒体处理

MP3 Cutter一个免费的在线MP3剪辑工具

可以直接在浏览器中剪切、修剪和编辑音频文件，而无需上传文件。
只需将音频文件拖放到指定区域，选择剪辑点，

22 9 月, 2025

AI行业应用多媒体处理

Wan21一款开源的AI 视频生成模型

一个基于阿里巴巴开源模型的AI视频生成平台，可以通过简单的文本或图像输入，快速生成高质量的视频。

21 9 月, 2025

AI行业应用多媒体处理

GodSVG免费的开源矢量图形编辑器

可以直接查看和编辑SVG代码，而不会添加任何元数据。
GodSVG 是一个开源的矢量图形编辑器

20 9 月, 2025

Chrome插件应用类别

把网页保存为一个完整的 html 文件的插件

所有图片、CSS、JS 都内嵌进去，非常干净，保存结果在任何地方都能直接打开。
Chrome/Firefox 都有 → SingleFile 插件

19 9 月, 2025

AI行业应用多媒体处理

抓取动态渲染的网站，并返回完整 HTML

专为 website-scraper 主库设计，能够用于抓取动态渲染的网站（即通过 JavaScript 加载内容的网站），并返回完整 HTML。

18 9 月, 2025

AI行业应用文档AI

开源的 “自托管网页归档” 工具

一个开源的、自托管的网页归档解决方案，它可以帮助个人或者组织将网页内容保存下来，方便离线浏览并且确保数据长期可访问

16 9 月, 2025

AI行业应用多媒体处理

SenseVoice开源的语音理解基础模型

致力于提供多模态、多语言、高性能的语音理解能力
SenseVoice 是 FunAudioLLM 项目中负责“语音理解”的基础模型

15 9 月, 2025

AI行业应用文档AI

DeepRead AI 驱动的智能书籍知识图谱

DeepRead 通过 AI 将书籍转化为相互关联的知识网络，以可视化图谱的形式呈现内容结构，支持多维度探索和深度挖掘

14 9 月, 2025

AI行业应用 MCP

AnythingLLM专注于知识库问答的Chat项目

上传 PDF、网页、文档后自动生成知识库，并通过聊天对话查询。

13 9 月, 2025

AI行业应用文档AI

Meow App 一个简洁的笔记应用

MeowNocode 是一个开源的 memos 类高颜值便签应用。
支持画布模式、力图数据统计、模糊语法、每日回顾、AI对话等功能

12 9 月, 2025

github

实时和本地语音到文字、翻译、说话人区分的开源项目

Gyroflow：基于陀螺仪数据的视频稳定化应用程序

为玩家设计的RAG的智能问答服务

SnapForge强大且美观的开源图片处理平台

让多模型都像OpenAI一样的工具

SQLBot基于大模型和RAG的智能问数系统

MP3 Cutter一个免费的在线MP3剪辑工具

Wan21一款开源的AI 视频生成模型

GodSVG免费的开源矢量图形编辑器

把网页保存为一个完整的 html 文件的插件

抓取动态渲染的网站，并返回完整 HTML

开源的 “自托管网页归档” 工具

SenseVoice开源的语音理解基础模型

DeepRead AI 驱动的智能书籍知识图谱

AnythingLLM专注于知识库问答的Chat项目

Meow App 一个简洁的笔记应用

精选内容 · 赞助推荐

多语言翻译

分類

热门标签

Donate

Subscribe to Blog via Email