繁中

開源、跨平台、免費的字幕編輯軟體

Tero Subtitler(由URUWorks維護):提供用戶友好的多語言界面,具有全面的字幕編輯功能。
它支持多種字幕格式,具有強大的編輯工具,包括時間軸波形可視化、自動備份、翻譯記憶、音頻和視頻預覽等功能,可以輕鬆創建、編輯和輸出字幕。
它還集成了自動轉錄、自動翻譯、視頻配音等多種先進技術,大大提高了字幕製作的效率和質量。

1.項目居間

從REAUTE中可以看到,TeroSubtitler是一款支持多平台(Windows/macOS/Linux)使用的「字幕編輯軟體」。它被定位為更全面的字幕工具,而不僅僅是簡單的字幕格式轉換或時間軸編輯。

它是URUWorks的開源項目,遵循MPL-2.0許可證。

2.主要功能

它支持以下功能/特性,如REAUTE和項目文檔所示:

功能類別細節
界面可用性用戶友好的界面,多語言界面支持(即界面可以本地化)
編輯支持SMPED和媒體模式下的字幕編輯(即不同的時間軸/時間代碼處理)
格式支持支持多種字幕格式的導入/輸出
撤消/重做多級別撤銷/重複操作
搜索/替換支持搜索和替換字幕文本
自動備份編輯過程中的自動保存和備份機制
模式/輔助有源模式、轉錄模式等(可以顯示原始字幕/轉錄/原件等)
翻譯援助支持「翻譯記憶庫」,以促進句子或模板的重複使用
視聽預覽您可以在軟體中預覽視頻/音頻和字幕同步效果(「視聽預覽」)。
時間軸/波浪形有一個時間軸界面與波形可視化,這是方便查看音頻水平和對齊字幕時間點
工具/動作包括幀/視頻速率轉換、格式(字體、對齊等)
質量控制分析拼寫檢查、字幕校對、比較多個字幕版本等工具
自動化/糾正自動檢測錯誤、違規(例如,超時、重疊等)和正確的功能
特別出口/發電將字幕輸出到MP3、生成硬編碼字幕、支持藍光MIDI格式、生成空白視頻,甚至視頻配音/文本轉語音(TTC)功能
自動轉錄/識別 整合 whisper.cpp 或Faster-Whisper,用於從音頻自動生成字幕/轉錄
在線/網址支持 使用yt-dLP 支持,從網絡URL打開視頻源
OCR支持集成Tesseract引擎,用於圖像文本識別(OCR)

此外,它使用 MPV 作為內部視頻播放引擎和用於音頻和視頻處理(代碼轉換、幀捕獲等)的FFmpeg。

3.技術架構/堆棧

從項目描述中可以推斷(部分由REAUTE指示)其技術架構特徵:

  • 語言/框架:項目的主代碼是用 Pascal (Free帕斯卡/拉撒路)。REAUTE提到「Lazarus IDE」作為編譯環境。
  • 外部配置/集成工具:
    • MPV:用作視頻/音頻播放和同步預覽。
    • FFmpeg:用於底層音頻和視頻處理、代碼轉換和其他操作。
    • yt-dLP:用於支持通過URL打開視頻(下載或流媒體支持)
    •  whisper.cpp或 快速低語:用於語音識別/音頻到文本(自動轉錄)
    • Tesseract:OCR引擎,用於從視頻幀/圖像中識別文本(可能用於硬字幕圖像識別或從幀中提取文本)
    • 多個內部包(UW Common units、UW Subtitle API、UW Tero Control等)被用作其核心模塊。
    • UI組件:使用Lazarus常用的組件集(例如,ATSynEdit、ATFlatControl、BGRABitmap、FPSEARCH表等)

因為對於Pascal / Lazarus,這意味著它是一個原生桌面應用程式,而不是基於ECT、Qt、。NET.這樣,該架構在UI響應性、資源使用率和啟動速度方面可能具有優點/缺點。

4.優點和局限性

優點:

  1. 全面 功能-與簡單的字幕編輯器相比,TeroSubtitler是一款「更全面」的工具,功能涵蓋編輯、驗證、轉錄、翻譯、預覽、格式轉換,甚至生成硬字幕視頻和配音。
  2. 免費開源 在MPL 2.0許可下,您可以查看、修改、擴展原始碼,並使社區易於參與。
  3. 跨平台支持 - 雖然使用Pascal實施,但目標是支持主流桌面平台,而不僅僅限於一個平台。
  4. 集成現代工具 - 集成現代人工智慧/工具,例如whisper /TTC/ OCR,以增強自動化。
  5.  細節控制-質量控制、糾正工具、多級別撤銷、搜索替換、時間軸波形顯示等,適合專業/半專業用戶。

限制/風險/挑戰

  1. 學習曲線 - 配置豐富意味著界面和操作可能很複雜,新用戶需要時間才能開始。
  2. 帕斯卡/拉撒路生態系統較小 - 社區資源、第三方庫、維護者可能比更流行的語言/框架更少。
  3. 依賴多種外部工具 - mpv、FFmpeg、whisper、Tesseract等可能會在不同系統上的配置和兼容性方面造成問題。
  4. 績效資源消耗 - 如果您正在處理長視頻、複雜字幕、多軌音頻、OCR/轉錄等,它可能對處理器/內存有要求。
  5. 穩定性/錯誤風險 - 具有許多功能的開源項目很容易在交互中引入錯誤、不兼容或平台差異。
  6. 精度限制 對於自動化-自動轉錄和OCR等功能依賴於外部模型/引擎,這可能會因識別錯誤、語言/口音/聲音質量等因素而導致錯誤。

5.使用場景

該項目適合以下類型的人/場景:

  • 字幕製作/翻譯人員希望在一個工具中完成編輯、翻譯、校對和預覽的過程。
  • 對字幕時間線、格式和質量有嚴格要求的用戶不會對簡單的工具感到滿意。
  • 擁有某些技術技能(例如能夠調試依賴項、編譯)或願意嘗試開源工具的用戶。
  • 教育/研究/開源社區想要自定義、擴展和重新開發字幕工具的用戶。
  • 需要跨平台支持的字幕工作流程(Windows/macOS/Linux)。

Github:https://github.com/URUWorks/TeroSubtitler

管材:

返回頂端