繁中

VSR:利用人工智慧算法準確識別視頻中字幕的一鍵刪除

視頻字幕刪除(VSR)是一款基於人工智慧技術的軟體,可從視頻中刪除硬字幕。主要實現以下功能:

  • 無損解析度從視頻中刪除硬字幕並生成刪除字幕的文件
  • 通過超級AI算法模型填充刪除字幕文本的區域(非相鄰像素填充和馬賽克刪除)
  • 支持自定義字幕位置,僅刪除定義位置(輸入位置)的字幕
  • 支持從完整視頻中自動刪除所有文本(不傳遞到位置)
  • 支持多選擇圖片批量刪除水印文本

使用說明:

如果您有任何使用問題,請分組討論,
直接下載壓縮包,解壓並運行。如果無法運行,請按照下面的教程嘗試安裝原始碼並在conda環境中運行。

Windows圖形處理器版本v1.1.0(圖形處理器):

百度在線磁碟:gpu_v1.1.0.zip提取代碼:vsr1
Google雲端硬碟:vsr_windows_gpu_v1.1.0.zip

僅適用於使用Nvidia顯卡的用戶(不提供AMD顯卡)

常見問題

如果提取速度慢怎麼辦

在後台/config.py中修改參數可以大大提高刪除速度

Mode = InpaintMode.STTN #設置為STTN算法
STTN_SKIP_DETECTION = True #跳過字幕檢測。跳過後可能會導致需要刪除的字幕丟失或不需要刪除的視頻幀意外受傷

如果視頻刪除效果不好怎麼辦

修改backend/config.py中的參數並嘗試不同的刪除算法。算法居間

InpaintMode.STTN算法:直播視頻效果好,速度快,可以跳過字幕檢測
InpaintMode.LAMA算法:對圖片效果最好,對動畫視頻效果也不錯。速度是平均的。不能跳過字幕檢測
修補模式。PROPAINTER算法:它消耗大量視頻內存,速度慢,對非常劇烈運動的視頻效果很好

使用STTN算法

Mode = InpaintMode.STTN #設置為STTN算法
相鄰幀,調整會增加內存消耗,效果會更好
STTN_NEIGHBOR_FRAIDE = 10
參考幀長度,調整會增加內存消耗,效果會更好
STTN_參考_LENGTH = 10
設置STTN算法同時處理的最大幀數。設置越高,速度越慢,但效果越好
確保STTN_MAX_ADD_NUM大於STTN_NEIGHBOR_FRAIDE和STTN_REFERETION_LENGTH
STTN_MAX_ADD_NUM = 30

使用LAMA算法

Mode = InpaintMode.LAMA #設置為STTN算法
LAMA_SUPER_Fast = False #保證效果
如果您對模型的字幕效果不滿意,可以在設計文件夾中檢查訓練方法,使用backend/tools/train中的代碼進行訓練,然後用舊模型替換訓練後的模型

CondaHTTP錯誤
將項目中的.condarc放入用戶目錄(C:/Tools/您的用戶名)中,如果該文件已存在於用戶目錄中,則覆蓋它

7 z文件解壓錯誤
解決方案:將7-Zip解壓器升級到最新版本

4090無法運行cuda 11.7
解決方案:切換到cuda 11.8

如果您想了解更多信息,可以單擊視頻下方的連結。
感謝您觀看此視頻。如果您喜歡,請訂閱並點讚。謝謝

下載地址:https://download.pytorch.org/whl/cu118
GitHub:https://github.com/YaoFANGUK/video-subtitle-remover

視頻:

返回頂端