繁中

專為語言學習設計的人工智慧媒體播放器

LLPlayer是一款專門為語言學習設計的媒體播放器。它具有雙字幕、人工智慧生成字幕、實時翻譯等獨特功能。它僅限Windows使用。

🎯核心功能

  1. 實時雙字幕顯示
    支持同時顯示兩種字幕:主字幕+副字幕(文本或圖像格式),位置、大小和樣式可自由調整
  2. 人工智慧自動字幕生成(ASB)
    基於OpenAI Whisper(支持whisper.cpp和faster-whisper引擎)。可以從本地或在線視頻實時生成字幕,無需預處理
  3. 實時翻譯
    集成Google、DeepL、Olama、LM Studio和OpenAI等翻譯引擎,還使用上下文理解支持「上下文敏感翻譯」
  4. OCR提取字幕
    實時識別視頻中的圖像字幕(例如燃燒字幕)並通過Tesseract或Microsoft OCR轉換文本
  5. 字幕側欄+詞典查詢
    內置側邊欄顯示所有字幕行,支持逐行搜索、跳轉、點擊單詞然後調用瀏覽器定製查詢詞典或翻譯服務
  6. 在線視頻支持
    集成yt-dLP直接打開YouTube、TED、B等在線視頻,即時生成和翻譯字幕
  7. 更多實用功能
    • 配置靈活的鍵盤快捷方式
    • 下載字幕(例如OpenSubtitle)
    • 啟用深色主題和頂部窗口
    • 自動將字幕文本複製到剪貼板上,以便與瀏覽器插件一起使用(例如,Yomitan,10ten)

📌技術架構和平台

  • 平台:Windows 10/11(x64),在C#+ WPF上開發。GPT-3.0開源許可證
  • AI引擎:Whisper for ASB;使用包括本地(Olama、LM Studio)或雲(Google、DeepL、OpenAI)在內的引擎進行翻譯
  • 硬體加速:支持CUDA GPU加速(推薦CUDA 12.8,適配RTX 50xx)

最新發展趨勢

  • 最新版本 v0.2.2(2025年5月24日發布),新功能包括增量字幕搜索、KoboldCpp/LiteLLM引擎支持、Qwen 3/DeepSeek等推理模型以及多種字幕外觀自定義選項
  • 該項目仍處於測試階段,還不完全穩定,功能也在不斷更新(問題跟蹤器中提出了許多新功能,例如https發音、自動暫停循環、LLM單詞解釋等)。

社區反饋

Reddit的用戶對此評價很高:

「我創建了一個集成OpenAI Whisper的開源視頻播放器.字幕可以從本地和在線視頻的播放位置同步生成.支持100種語言的音頻」([reddit.com][2])

另一位用戶說道:

「甜心,我一直在等待帶AI字幕的SLC。」([reddit.com][2])

這些評論反映了社區對其「AI自動字幕+翻譯」的期待和認可。

作者在YouTube上的視頻

通過以下視頻您可以直觀地看到功能演示:

GitHub:https://github.com/umlx5h/LLPlayer
輸油管:

返回頂端