Srt-AI-Voice开源的字幕配音工具

作者： Tarogo Cloud / 10 8 月, 2025

https://youtu.be/VD45AD6DAyc

Srt-AI-Voice-Assistant是利用多个AI-TTS为你的字幕或文本文件配音。并提供包括字幕识别、翻译在内的多种便捷的辅助功能。

通过将 .srt 字幕文件与多个 AI 文字转语音（TTS）引擎结合，自动为字幕生成配音音轨，实现字幕／配音一体化处理

⭐ 项目简介与核心功能

🎙 核心定位

字幕配音助手：主打通过字幕文件同步为音视频内容配音，尤其适合需逐句配音的场景，例如视频解说、鬼畜配音等

集成的主要功能包括：

✅ 支持多种 AI‑TTS 引擎（如 BV2、CosyVoice2、GSV、AzureTTS），并允许用户自定义 API 接入
✅ 支持多角色配音、批量模式、单句重新抽卡（即重新生成某句语音）等高级特性
✅ 字幕文本的编辑与翻译能力，可以修改或翻译 SRT 后重新导入配音流程
✅ 支持音视频文件转录生成字幕，以及字幕与音轨的同步输出

🛠 使用体验与安装流程

支持图形化 WebUI 界面，在本地运行并支持局域网访问，用户无需写代码即可操作
提供 Standalone 包（打包版本）与 GPT‑SoVITS 整合包（Hugging Face 提供），方便 Windows 或无法顺利安装依赖的用户使用
安装流程通常是在 Python 环境下安装依赖（requirements.txt），然后运行脚本如 Srt‑AI‑Voice‑Assistant.py 进行启动；也可通过双击 .bat 快捷运行

🧩 功能流程大致如下

用户提供视频或已有 .srt 字幕文件；
项目将字幕句子逐条匹配时间轴；
调用选定的 AI‑TTS 引擎生成对应语音；
支持试听、编辑及重新生成某句；
合成最终音轨并与视频对应时间轴同步输出；
支持翻译、生成新字幕并导出配音后文件。

⚙️ 使用场景建议

✅ 视频制作者想快速为字幕生成 AI 配音，尤其是多角色（角色配音识别）；
✅ 想批量处理多个 .srt 文件并输出语音；
✅ 希望集成 AI 配音到自有流程中，可自定义接入 API；
✅ 需要字幕翻译、编辑、一键重新配音的用户。

❤️ 总结

“Srt‑AI‑Voice‑Assistant” 是一个功能丰富、配置灵活的字幕与配音整合工具，支持本地运行、Web UI 操作、多种 TTS 接入、多角色配音、字幕翻译与编辑，以及批量处理能力。如果你需要快速给字幕添加个性化配音，并希望可视化操作与自定义接入接口，这个项目非常适合。

Github：https://github.com/YYuX-1145/Srt-AI-Voice-Assistant

体验：https://srt-ai-voice-assistant-onlinedemo.work

油管：https://youtu.be/VD45AD6DAyc

退出移动版