实时和本地语音到文字、翻译、说话人区分的开源项目
WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统,包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术,支持多种语言和说话人识别。
WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统,包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术,支持多种语言和说话人识别。
能够通过运动数据精确稳定视频。支持多种现代相机(如GoPro、Sony、Insta360等)内部记录的陀螺仪数据,也可以使用外部设备(如Betaflight黑匣子)提供的陀螺仪数据
玩游戏时有时候要查攻略,要么切换窗口去查、要么用手机,都不怎么方便。
有 2 个核心功能:
▫️一键呼出:按下Ctrl+Q,无需切屏即可查询攻略
▫️ AI游戏专家:基于Google Gemini + 本地知识库对游戏内容智能问答
模拟 Gemini CLI Kiro 客户端请求,兼容 OpenAI API。可每日千次Gemini模型请求, 免费使用Kiro 内置 Claude 模型。
支持快速嵌入到第三方业务系统,也支持被 n8n、MaxKB、Dify、Coze 等 AI 应用开发平台集成调用,让各类应用快速拥有智能问数能力。
减少页面初始加载时的视频资源请求,让视频只在用户 实际滚动到可见区域 时才加载,从而显著提升网站的速度和性能。
WP YouTube Lyte 的核心特点是 轻量、快速、兼容性强,特别适合你之前遇到的 Cloudflare 加速或缓存冲突问题。
一个基于GPT-4O技术的AI图像生成平台,可以通过上传参考图像或直接输入创意描述,IGenie能够理解复杂的艺术概念,并生成高质量的图像。
除了基本的表情符号查询功能,EmojiAll还提供了表情符号排行榜、情感分析、表情符号聊天、表情符号翻译和自定义表情符号制作等多种功能。
所有图片、CSS、JS 都内嵌进去,非常干净,保存结果在任何地方都能直接打开。
Chrome/Firefox 都有 → SingleFile 插件