专为语言学习而设计的AI媒体播放器

LLPlayer 是一款专为语言学习而设计的媒体播放器,具备双字幕、AI 生成字幕、实时翻译等独特功能,Windows 专属。

🎯 核心功能

  1. 实时双字幕显示
    支持同时显示两种字幕:主字幕 + 副字幕(文本或图像格式),位置、大小、样式均可自由调节
  2. AI 自动生成字幕(ASR)
    基于 OpenAI Whisper(支持 whisper.cpp 和 faster-whisper 引擎)。可以实时从本地或网络视频中生成字幕,无需预处理
  3. 实时翻译
    集成 Google、DeepL、Ollama、LM Studio、OpenAI 等翻译引擎,还支持使用上下文理解进行“情境敏感翻译”
  4. OCR 提取字幕
    通过 Tesseract 或 Microsoft OCR 实时识别视频中的图像字幕(如烧录字幕)并转换文字
  5. 字幕侧边栏 + 词典查询
    内建侧边栏显示所有字幕行,支持逐行搜索、跳转、点击单词后调用浏览器自定义查询词典或翻译服务
  6. 在线视频支持
    集成 yt-dlp,直接打开 YouTube、TED、B 站等在线视频,即时生成并翻译字幕
  7. 更多实用功能
    • 配置灵活的键盘快捷键
    • 下载字幕(如 OpenSubtitles)
    • 启用暗色主题和窗口置顶
    • 自动在剪贴板复制字幕文本,以结合浏览器插件使用(如 Yomitan、10ten)

📌 技术架构与平台

  • 平台:Windows 10/11(x64),开发于 C# + WPF。GPL‑3.0 开源许可证
  • AI 引擎:Whisper for ASR;翻译方面使用包括本地(Ollama、LM Studio)或云端(Google、DeepL、OpenAI)的引擎
  • 硬件加速:支持 CUDA GPU 加速(建议 CUDA 12.8,适配 RTX 50xx)

🧩 最新开发动态

  • 最新版本为 v0.2.2(2025 年 5 月 24 日发布),新增功能包括增量字幕搜索、KoboldCpp/LiteLLM 引擎支持、Qwen3/DeepSeek 等推理模型、多种字幕外观定制选项等
  • 项目仍处于 beta 阶段,不完全稳定,功能持续更新中(issue tracker 中已有不少新功能提议,如 TTS 发音、自动暂停循环、LLM 解释单词等)。

🗣️ 社区反馈

来自 Reddit 的用户对其高度评价:

“I have created an open source video player that integrates OpenAI Whisper… Subtitles can be generated from the playback position of both local and online videos asynchronously… supports audio in 100 languages” ([reddit.com][2])

另一位用户说:

“Sweet, I’ve been waiting for VLC with AI‑subtitles.” ([reddit.com][2])

这些评论体现出社区对其“AI 自动字幕 + 翻译”的期待与认可。

🎥 作者在油管的视频

可以通过下面视频直观看到功能演示:

LLPlayer AI‑Powered Media Player with Real‑Time Subtitles (demo)

GitHub:https://github.com/umlx5h/LLPlayer
油管:https://youtu.be/vU27ZLxltsE

滚动至顶部