实时和本地语音到文字、翻译、说话人区分的开源项目
WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统,包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术,支持多种语言和说话人识别。
WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统,包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术,支持多种语言和说话人识别。
能够通过运动数据精确稳定视频。支持多种现代相机(如GoPro、Sony、Insta360等)内部记录的陀螺仪数据,也可以使用外部设备(如Betaflight黑匣子)提供的陀螺仪数据
玩游戏时有时候要查攻略,要么切换窗口去查、要么用手机,都不怎么方便。
有 2 个核心功能:
▫️一键呼出:按下Ctrl+Q,无需切屏即可查询攻略
▫️ AI游戏专家:基于Google Gemini + 本地知识库对游戏内容智能问答
模拟 Gemini CLI Kiro 客户端请求,兼容 OpenAI API。可每日千次Gemini模型请求, 免费使用Kiro 内置 Claude 模型。
支持快速嵌入到第三方业务系统,也支持被 n8n、MaxKB、Dify、Coze 等 AI 应用开发平台集成调用,让各类应用快速拥有智能问数能力。
所有图片、CSS、JS 都内嵌进去,非常干净,保存结果在任何地方都能直接打开。
Chrome/Firefox 都有 → SingleFile 插件
专为 website-scraper 主库设计,能够用于抓取动态渲染的网站(即通过 JavaScript 加载内容的网站),并返回完整 HTML。
致力于提供多模态、多语言、高性能的语音理解能力
SenseVoice 是 FunAudioLLM 项目中负责“语音理解”的基础模型