Srt-AI-Voice开源的字幕配音工具

https://youtu.be/VD45AD6DAyc

Srt-AI-Voice-Assistant是利用多个AI-TTS为你的字幕或文本文件配音。 并提供包括字幕识别、翻译在内的多种便捷的辅助功能。

通过将 .srt 字幕文件与多个 AI 文字转语音(TTS)引擎结合,自动为字幕生成配音音轨,实现字幕/配音一体化处理

⭐ 项目简介与核心功能

🎙 核心定位

  • 字幕配音助手:主打通过字幕文件同步为音视频内容配音,尤其适合需逐句配音的场景,例如视频解说、鬼畜配音等

集成的主要功能包括:

  • ✅ 支持多种 AI‑TTS 引擎(如 BV2、CosyVoice2、GSV、AzureTTS),并允许用户自定义 API 接入
  • ✅ 支持多角色配音、批量模式、单句重新抽卡(即重新生成某句语音)等高级特性
  • ✅ 字幕文本的编辑与翻译能力,可以修改或翻译 SRT 后重新导入配音流程
  • ✅ 支持音视频文件转录生成字幕,以及字幕与音轨的同步输出

🛠 使用体验与安装流程

  • 支持图形化 WebUI 界面,在本地运行并支持局域网访问,用户无需写代码即可操作
  • 提供 Standalone 包(打包版本)与 GPT‑SoVITS 整合包(Hugging Face 提供),方便 Windows 或无法顺利安装依赖的用户使用
  • 安装流程通常是在 Python 环境下安装依赖(requirements.txt),然后运行脚本如 Srt‑AI‑Voice‑Assistant.py 进行启动;也可通过双击 .bat 快捷运行

🧩 功能流程大致如下

  1. 用户提供视频或已有 .srt 字幕文件;
  2. 项目将字幕句子逐条匹配时间轴;
  3. 调用选定的 AI‑TTS 引擎生成对应语音;
  4. 支持试听、编辑及重新生成某句;
  5. 合成最终音轨并与视频对应时间轴同步输出;
  6. 支持翻译、生成新字幕并导出配音后文件。

⚙️ 使用场景建议

  • ✅ 视频制作者想快速为字幕生成 AI 配音,尤其是多角色(角色配音识别);
  • ✅ 想批量处理多个 .srt 文件并输出语音;
  • ✅ 希望集成 AI 配音到自有流程中,可自定义接入 API;
  • ✅ 需要字幕翻译、编辑、一键重新配音的用户。

❤️ 总结

Srt‑AI‑Voice‑Assistant” 是一个功能丰富、配置灵活的字幕与配音整合工具,支持本地运行、Web UI 操作、多种 TTS 接入、多角色配音、字幕翻译与编辑,以及批量处理能力。如果你需要快速给字幕添加个性化配音,并希望可视化操作与自定义接入接口,这个项目非常适合。

Github:https://github.com/YYuX-1145/Srt-AI-Voice-Assistant

体验:https://srt-ai-voice-assistant-onlinedemo.work

油管:https://youtu.be/VD45AD6DAyc

退出移动版