开源、跨平台且免费的字幕编辑软件

Watch this video on YouTube

Tero Subtitler（由 URUWorks 维护）：提供一个友好的多语言界面和全面的字幕编辑功能。
支持多种字幕格式，具备强大的编辑工具，包括时间轴波形可视化、自动备份、翻译记忆、音视频预览等功能，可以轻松进行字幕的创建、编辑和导出。
还集成了多种先进的技术，如自动转录、自动翻译和视频配音，极大地提升了字幕制作的效率和质量。

一、项目简介

从 README 可见，TeroSubtitler 是 “subtitle editing software”（字幕编辑软件），支持多平台（Windows / macOS / Linux）使用。它定位于一个功能较为全面的字幕工具，而不仅仅是简单的字幕格式转换或时间轴编辑。

它是 URUWorks 的一个开源项目，遵循 MPL-2.0 许可证。

二、主要功能

从 README 和项目文档中可以看到它支持以下功能／特性：

功能类别	具体内容
界面 & 可用性	用户友好界面、多语言界面支持（即界面可被本地化）
编辑	支持 SMPTE 模式和 Media 模式的字幕编辑（即不同的时间轴／时间码处理方式）
格式支持	支持多种字幕格式的导入／导出
撤销／重做	多级 undo/redo 操作
搜索 / 替换	支持搜索和替换字幕文本
自动备份	编辑过程中的自动保存、备份机制
模式 / 辅助	有 Source 模式、Transcription 模式等（可能是显示原始字幕 / 转录 / 原稿等）
翻译辅助	有“翻译记忆”（Translation Memory）的支持，方便重复句子或模板 reuse
视听预览	可以在软件里预览视频／音频与字幕同步效果（“Audiovisual preview”）
时间线 / 波形	有带波形可视化的时间线界面，便于看音频高低、对齐字幕时间点
工具 / 操作	包括帧率 / 速率转换 (frame/video rate conversion)、格式化 (字体、对齐等)
质量控制 & 分析	拼写检查、字幕校对、比较多个字幕版本等工具
自动化 / 校正	自动检测错误、违例（比如超时、重叠等）并校正功能
特殊导出 / 生成	将字幕导出为 MP3、生成硬嵌字幕视频 (hardcoded subtitles)、支持 Blu-ray SUP 格式、生成空白视频、甚至视频配音 / 语音合成（TTS）功能
自动转录 / 识别	整合 whisper.cpp 或 Faster-Whisper 用于从音频自动生成字幕 / 转录
在线 / URL 支持	借助 yt-dlp 支持从网络 URL 打开视频源
OCR 支持	整合 Tesseract 引擎，用以从图像中识别文字（OCR）

此外，它使用 mpv 作为内部视频播放引擎，FFmpeg 用于音视频处理（转码、截帧等）。

三、技术架构 / 栈

从项目描述可以推断（也部分由 README 明示）其技术架构特点：

语言 / 框架：项目的主要代码用 Pascal（Free Pascal / Lazarus）编写。README 提到 “Lazarus IDE” 作为编译环境。
外部依赖 / 集成工具：
- mpv：用作视频／音频播放与同步预览。
- FFmpeg：用于底层音视频处理、转码等操作。
- yt-dlp：用于支持通过 URL 打开视频（下载或流式支持）
- whisper.cpp 或 Faster-Whisper：用于语音识别 / 音频转文字（自动转录）
- Tesseract：OCR 引擎，用于从视频帧／图像中识别文字（可能用于硬字幕图像识别或画面中的文字提取）
- 多个内部包（UW Common units、UW Subtitle API、UW Tero Controls 等）作为其核心模块。
- UI 组件：使用 Lazarus 常用的组件集（例如 ATSynEdit、ATFlatControls、BGRABitmap、FPSpreadsheet 等）

因为用 Pascal / Lazarus，这意味着它是一个原生桌面应用，而不是基于 Electron、Qt、.NET 之类的跨平台框架。这样架构在 UI 响应、资源占用、启动速度上可能有优势／劣势取舍。

四、优点和局限

优点

功能全面 — 相对于简单字幕编辑器，TeroSubtitler 的功能覆盖从编辑、校验、转录、翻译、预览、格式转换、甚至生成硬字幕视频、配音等，是一个比较“全能”的工具。
开源 & 免费 — 遵循 MPL 2.0 许可，你可以查看、修改、扩展源代码，也便于社区参与。
跨平台支持 — 虽然用 Pascal 实现，但目标是支持主流桌面平台，用户不局限于某一平台。
集成现代工具 — 融入 whisper / TTS / OCR 等现代 AI / 工具提升自动化能力。
细节控制强 — 有质量控制、校正工具、多级撤销、搜索替换、时间线波形显示等，适合专业／半专业用户。

局限 / 风险 /挑战

学习曲线 — 功能丰富意味着界面、操作也可能比较复杂，新用户需要时间上手。
Pascal / Lazarus 生态较小 — 相对于更流行的语言／框架，社区资源、第三方库、维护者可能少一些。
依赖多个外部工具 — mpv、FFmpeg、whisper, Tesseract 等都可能在不同系统上配置、兼容性上带来麻烦。
性能 & 资源消耗 — 如果处理长视频、复杂字幕、多轨音频、OCR／转录等，可能对 CPU / 内存有较大要求。
稳定性 / Bug 风险 — 开源项目、功能很多，也容易引入交互上的 bug、不兼容状况或平台差异问题。
对自动化的精度限制 — 自动转录和 OCR 等功能依赖外部模型／引擎，其识别错误、语言／口音／音质等因素可能导致误差。

五、使用场景

这个项目适用于以下几类人／场景：

字幕制作／翻译工作者，希望在一个工具里完成编辑、翻译、校对、预览的流程。
对字幕时间轴、格式、质量有精细要求的用户，不满足于简单的工具。
具有一定技术能力（如能调试依赖、编译）或愿意尝试开源工具的用户。
教育 / 研究 /开源社区用户，希望对字幕工具进行定制、扩展、二次开发。
需要跨平台支持（Windows / macOS / Linux）的字幕工作流程。

Github：https://github.com/URUWorks/TeroSubtitler

油管：https://youtu.be/nez0edwUyTo

开源、跨平台且免费的字幕编辑软件

一、项目简介

二、主要功能

三、技术架构 / 栈

四、优点和局限

优点

局限 / 风险 /挑战

五、使用场景

iComMa：通过比较和匹配反转 3D 高斯泼溅进行相机姿势估计

RLLM：由 LLM 驱动的 RSS 阅读器

Canva 收购 Leonardo.ai，提升生成式 AI 能力

MicrosoftCopilot可以免费创建您的 PowerPoint。

多语言翻译

热门标签

分類

Donate

Subscribe to Blog via Email

一、项目简介

二、主要功能

三、技术架构 / 栈

四、优点和局限

优点

局限 / 风险 /挑战

五、使用场景

分享此文：

iComMa：通过比较和匹配反转 3D 高斯泼溅进行相机姿势估计

RLLM：由 LLM 驱动的 RSS 阅读器

Canva 收购 Leonardo.ai，提升生成式 AI 能力

MicrosoftCopilot可以免费创建您的 PowerPoint。

多语言翻译

热门标签

分類

Donate

Subscribe to Blog via Email