項目名稱:VideoTextPro
項目功能:文本轉換工具
項目描述:一款針對抖音直播視頻錄製優化的文本轉換工具。它主要用於處理實時回放和錄製視頻的文本提取和字幕生成。它支持多種視頻和音頻格式,包括FLV,MP4,AVI等。
它具有高效的批量處理能力,可以自動掃描錄製和廣播文件夾,智能跳過處理後的文件,並支持多種字幕格式(例如SRT、ASS、XT)。
項目居間
該項目名為 視頻到文本轉換,旨在將視頻文件中的音頻內容轉錄為文本,即自動生成字幕。支持多語言語音識別,並使用時間軸生成字幕(.srt 文件)。
項目職能
- 支持將視頻中的音頻提取並識別為文本;
- 生成標準
.srt字幕文件,方便視頻播放器加載; - 可以識別多種語言;
- 支持批量處理多個視頻文件。
安裝步驟
-
克隆項目
git克隆https://github.com/ldlkuz/video-to-text-conversion.git CD視頻到文本的轉換 -
創建虛擬環境並安裝依賴項
蟒蛇3-m venv venv 源venv/bin/activate pip安裝-r要求.文本
④ˇ Usage
-
放置您的視頻文件(例如
.mp4)放入視頻/在文件夾中。 -
運行主腳本
Python main.py執行後,它將:
- 遍歷
視頻/文件夾中的所有視頻; - 提取每個視頻的音頻;
- 使用Whisper進行語音轉錄;
- 將結果保存為
.srt格式化字幕文件,輸出到字幕/文件夾.
- 遍歷
項目結構
main.py:主程式,處理視頻文件、調用Whisper並生成字幕。視頻/:放置要處理的視頻文件。字幕/:輸出生成的字幕文件。requirements.txt:所需Python庫列表(主要包括開放耳語,電影,ffmpeg-Python等等)。
支持的語言
Whisper模型原生支持多種語言,而不限於英語。您可以修改代碼以指定識別語言。
注意事項
- 您需要安裝FFmpeg(用於處理視頻和音頻)並確保可以在命令行上調用它
ffmpeg; - 如果系統中沒有圖形卡,該型號默認使用中央處理器,可能會導致速度較慢;
- 如果您需要更高的精度,可以使用Whisper的大型模型(您需要修改自己的代碼才能加載相應的模型)。
項目地址:點擊打開(https://github.com/ldlkuz/video-to-text-conversion)
輸油管: