繁中

視頻轉字幕工具,一鍵生成高質量SRT字幕

項目名稱:VideoTextPro
項目功能:文本轉換工具
項目描述:一款針對抖音直播視頻錄製優化的文本轉換工具。它主要用於處理實時回放和錄製視頻的文本提取和字幕生成。它支持多種視頻和音頻格式,包括FLV,MP4,AVI等。
它具有高效的批量處理能力,可以自動掃描錄製和廣播文件夾,智能跳過處理後的文件,並支持多種字幕格式(例如SRT、ASS、XT)。

項目居間

該項目名為 視頻到文本轉換,旨在將視頻文件中的音頻內容轉錄為文本,即自動生成字幕。支持多語言語音識別,並使用時間軸生成字幕(.srt 文件)。

項目職能

  • 支持將視頻中的音頻提取並識別為文本;
  • 生成標準 .srt 字幕文件,方便視頻播放器加載;
  • 可以識別多種語言;
  • 支持批量處理多個視頻文件。

安裝步驟

  1. 克隆項目

    git克隆https://github.com/ldlkuz/video-to-text-conversion.git
    CD視頻到文本的轉換
  2. 創建虛擬環境並安裝依賴項

    蟒蛇3-m venv venv
    源venv/bin/activate
    pip安裝-r要求.文本

④ˇ Usage

  1. 放置您的視頻文件(例如 .mp4)放入 視頻/ 在文件夾中。

  2. 運行主腳本

    Python main.py

    執行後,它將:

    • 遍歷 視頻/ 文件夾中的所有視頻;
    • 提取每個視頻的音頻;
    • 使用Whisper進行語音轉錄;
    • 將結果保存為 .srt 格式化字幕文件,輸出到 字幕/ 文件夾.

項目結構

  • main.py:主程式,處理視頻文件、調用Whisper並生成字幕。
  • 視頻/:放置要處理的視頻文件。
  • 字幕/:輸出生成的字幕文件。
  • requirements.txt:所需Python庫列表(主要包括 開放耳語, 電影, ffmpeg-Python 等等)。

支持的語言

Whisper模型原生支持多種語言,而不限於英語。您可以修改代碼以指定識別語言。

注意事項

  • 您需要安裝FFmpeg(用於處理視頻和音頻)並確保可以在命令行上調用它 ffmpeg;
  • 如果系統中沒有圖形卡,該型號默認使用中央處理器,可能會導致速度較慢;
  • 如果您需要更高的精度,可以使用Whisper的大型模型(您需要修改自己的代碼才能加載相應的模型)。

項目地址:點擊打開(https://github.com/ldlkuz/video-to-text-conversion)

輸油管:

返回頂端