視頻轉字幕工具，一鍵生成高質量SRT字幕

項目名稱：VideoTextPro
項目功能：文本轉換工具
項目描述：一款針對抖音直播視頻錄製優化的文本轉換工具。它主要用於處理實時回放和錄製視頻的文本提取和字幕生成。它支持多種視頻和音頻格式，包括FLV，MP4，AVI等。
它具有高效的批量處理能力，可以自動掃描錄製和廣播文件夾，智能跳過處理後的文件，並支持多種字幕格式（例如SRT、ASS、XT）。

項目居間

該項目名為 視頻到文本轉換，旨在將視頻文件中的音頻內容轉錄為文本，即自動生成字幕。支持多語言語音識別，並使用時間軸生成字幕（.srt 文件）。

項目職能

支持將視頻中的音頻提取並識別為文本;
生成標準 .srt 字幕文件，方便視頻播放器加載;
可以識別多種語言;
支持批量處理多個視頻文件。

安裝步驟

克隆項目

git克隆https://github.com/ldlkuz/video-to-text-conversion.git
CD視頻到文本的轉換

創建虛擬環境並安裝依賴項

蟒蛇3-m venv venv
源venv/bin/activate
pip安裝-r要求.文本

④ˇ Usage

放置您的視頻文件（例如 .mp4）放入 視頻/ 在文件夾中。
運行主腳本
```
Python main.py
```
執行後，它將：
- 遍歷 視頻/ 文件夾中的所有視頻;
- 提取每個視頻的音頻;
- 使用Whisper進行語音轉錄;
- 將結果保存為 .srt 格式化字幕文件，輸出到 字幕/ 文件夾.

項目結構

main.py：主程式，處理視頻文件、調用Whisper並生成字幕。
視頻/：放置要處理的視頻文件。
字幕/：輸出生成的字幕文件。
requirements.txt：所需Python庫列表（主要包括 開放耳語, 電影, ffmpeg-Python 等等）。

支持的語言

Whisper模型原生支持多種語言，而不限於英語。您可以修改代碼以指定識別語言。

注意事項

您需要安裝FFmpeg（用於處理視頻和音頻）並確保可以在命令行上調用它 ffmpeg;
如果系統中沒有圖形卡，該型號默認使用中央處理器，可能會導致速度較慢;
如果您需要更高的精度，可以使用Whisper的大型模型（您需要修改自己的代碼才能加載相應的模型）。

項目地址：點擊打開（https://github.com/ldlkuz/video-to-text-conversion)

輸油管：