多媒体处理
BlurImg:免费的在线图片模糊工具
可以快速模糊照片中的敏感信息,以保护隐私。支持多种图片格式(如 JPG、PNG 和 WebP),只需上传图片,选择模糊类型和强度,便可在几秒钟内获得模糊效果。
实时和本地语音到文字、翻译、说话人区分的开源项目
WhisperLiveKit 项目是一个集成了最新研究成果的实时语音转文本系统,包括 SimulStreaming、WhisperStreaming、Streaming Sortformer 和 Diart 等技术,支持多种语言和说话人识别。
Gyroflow:基于陀螺仪数据的视频稳定化应用程序
能够通过运动数据精确稳定视频。支持多种现代相机(如GoPro、Sony、Insta360等)内部记录的陀螺仪数据,也可以使用外部设备(如Betaflight黑匣子)提供的陀螺仪数据
GPT-4O来生成转换图像的在线工具
一个基于GPT-4O技术的AI图像生成平台,可以通过上传参考图像或直接输入创意描述,IGenie能够理解复杂的艺术概念,并生成高质量的图像。
多语言提供丰富的表情符号功能字典网站
除了基本的表情符号查询功能,EmojiAll还提供了表情符号排行榜、情感分析、表情符号聊天、表情符号翻译和自定义表情符号制作等多种功能。
抓取动态渲染的网站,并返回完整 HTML
专为 website-scraper 主库设计,能够用于抓取动态渲染的网站(即通过 JavaScript 加载内容的网站),并返回完整 HTML。
SenseVoice开源的语音理解基础模型
致力于提供多模态、多语言、高性能的语音理解能力
SenseVoice 是 FunAudioLLM 项目中负责“语音理解”的基础模型