开源、跨平台且免费的字幕编辑软件

Tero Subtitler(由 URUWorks 维护):提供一个友好的多语言界面和全面的字幕编辑功能。
支持多种字幕格式,具备强大的编辑工具,包括时间轴波形可视化、自动备份、翻译记忆、音视频预览等功能,可以轻松进行字幕的创建、编辑和导出。
还集成了多种先进的技术,如自动转录、自动翻译和视频配音,极大地提升了字幕制作的效率和质量。

一、项目简介

从 README 可见,TeroSubtitler 是 “subtitle editing software”(字幕编辑软件),支持多平台(Windows / macOS / Linux)使用。 它定位于一个功能较为全面的字幕工具,而不仅仅是简单的字幕格式转换或时间轴编辑。

它是 URUWorks 的一个开源项目,遵循 MPL-2.0 许可证。

二、主要功能

从 README 和项目文档中可以看到它支持以下功能/特性:

功能类别具体内容
界面 & 可用性用户友好界面、多语言界面支持(即界面可被本地化)
编辑支持 SMPTE 模式和 Media 模式的字幕编辑(即不同的时间轴/时间码处理方式)
格式支持支持多种字幕格式的导入/导出
撤销/重做多级 undo/redo 操作
搜索 / 替换支持搜索和替换字幕文本
自动备份编辑过程中的自动保存、备份机制
模式 / 辅助有 Source 模式、Transcription 模式等(可能是显示原始字幕 / 转录 / 原稿等)
翻译辅助有“翻译记忆”(Translation Memory)的支持,方便重复句子或模板 reuse
视听预览可以在软件里预览视频/音频与字幕同步效果(“Audiovisual preview”)
时间线 / 波形有带波形可视化的时间线界面,便于看音频高低、对齐字幕时间点
工具 / 操作包括帧率 / 速率转换 (frame/video rate conversion)、格式化 (字体、对齐等)
质量控制 & 分析拼写检查、字幕校对、比较多个字幕版本等工具
自动化 / 校正自动检测错误、违例(比如超时、重叠等)并校正功能
特殊导出 / 生成将字幕导出为 MP3、生成硬嵌字幕视频 (hardcoded subtitles)、支持 Blu-ray SUP 格式、生成空白视频、甚至视频配音 / 语音合成(TTS)功能
自动转录 / 识别整合 whisper.cpp 或 Faster-Whisper 用于从音频自动生成字幕 / 转录
在线 / URL 支持借助 yt-dlp 支持从网络 URL 打开视频源
OCR 支持整合 Tesseract 引擎,用以从图像中识别文字(OCR)

此外,它使用 mpv 作为内部视频播放引擎,FFmpeg 用于音视频处理(转码、截帧等)。

三、技术架构 / 栈

从项目描述可以推断(也部分由 README 明示)其技术架构特点:

  • 语言 / 框架:项目的主要代码用 Pascal(Free Pascal / Lazarus)编写。README 提到 “Lazarus IDE” 作为编译环境。
  • 外部依赖 / 集成工具:
    • mpv:用作视频/音频播放与同步预览。
    • FFmpeg:用于底层音视频处理、转码等操作。
    • yt-dlp:用于支持通过 URL 打开视频(下载或流式支持)
    • whisper.cpp 或 Faster-Whisper:用于语音识别 / 音频转文字(自动转录)
    • Tesseract:OCR 引擎,用于从视频帧/图像中识别文字(可能用于硬字幕图像识别或画面中的文字提取)
    • 多个内部包(UW Common units、UW Subtitle API、UW Tero Controls 等)作为其核心模块。
    • UI 组件:使用 Lazarus 常用的组件集(例如 ATSynEdit、ATFlatControls、BGRABitmap、FPSpreadsheet 等)

因为用 Pascal / Lazarus,这意味着它是一个原生桌面应用,而不是基于 Electron、Qt、.NET 之类的跨平台框架。这样架构在 UI 响应、资源占用、启动速度上可能有优势/劣势取舍。

四、优点和局限

优点

  1. 功能全面 — 相对于简单字幕编辑器,TeroSubtitler 的功能覆盖从编辑、校验、转录、翻译、预览、格式转换、甚至生成硬字幕视频、配音等,是一个比较“全能”的工具。
  2. 开源 & 免费 — 遵循 MPL 2.0 许可,你可以查看、修改、扩展源代码,也便于社区参与。
  3. 跨平台支持 — 虽然用 Pascal 实现,但目标是支持主流桌面平台,用户不局限于某一平台。
  4. 集成现代工具 — 融入 whisper / TTS / OCR 等现代 AI / 工具提升自动化能力。
  5. 细节控制强 — 有质量控制、校正工具、多级撤销、搜索替换、时间线波形显示等,适合专业/半专业用户。

局限 / 风险 /挑战

  1. 学习曲线 — 功能丰富意味着界面、操作也可能比较复杂,新用户需要时间上手。
  2. Pascal / Lazarus 生态较小 — 相对于更流行的语言/框架,社区资源、第三方库、维护者可能少一些。
  3. 依赖多个外部工具 — mpv、FFmpeg、whisper, Tesseract 等都可能在不同系统上配置、兼容性上带来麻烦。
  4. 性能 & 资源消耗 — 如果处理长视频、复杂字幕、多轨音频、OCR/转录等,可能对 CPU / 内存有较大要求。
  5. 稳定性 / Bug 风险 — 开源项目、功能很多,也容易引入交互上的 bug、不兼容状况或平台差异问题。
  6. 对自动化的精度限制 — 自动转录和 OCR 等功能依赖外部模型/引擎,其识别错误、语言/口音/音质等因素可能导致误差。

五、使用场景

这个项目适用于以下几类人/场景:

  • 字幕制作/翻译工作者,希望在一个工具里完成编辑、翻译、校对、预览的流程。
  • 对字幕时间轴、格式、质量有精细要求的用户,不满足于简单的工具。
  • 具有一定技术能力(如能调试依赖、编译)或愿意尝试开源工具的用户。
  • 教育 / 研究 /开源社区用户,希望对字幕工具进行定制、扩展、二次开发。
  • 需要跨平台支持(Windows / macOS / Linux)的字幕工作流程。

Github:https://github.com/URUWorks/TeroSubtitler

油管:https://youtu.be/nez0edwUyTo