VSR:利用AI算法精确识别 一键去除视频中的字幕
Video-subtitle-remover (VSR) 是一款基于AI技术,将视频中的硬字幕去除的软件。 主要实现了以下功能:
- 无损分辨率将视频中的硬字幕去除,生成去除字幕后的文件
- 通过超强AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除)
- 支持自定义字幕位置,仅去除定义位置中的字幕(传入位置)
- 支持全视频自动去除所有文本(不传入位置)
- 支持多选图片批量去除水印文本
使用说明:
有使用问题请加群讨论,
直接下载压缩包解压运行,如果不能运行再按照下面的教程,尝试源码安装conda环境运行
Windows GPU版本v1.1.0(GPU):
百度网盘: vsr_windows_gpu_v1.1.0.zip 提取码:vsr1
Google Drive: vsr_windows_gpu_v1.1.0.zip
仅供具有Nvidia显卡的用户使用(AMD的显卡不行)
常见问题
提取速度慢怎么办
修改backend/config.py中的参数,可以大幅度提高去除速度
MODE = InpaintMode.STTN # 设置为STTN算法
STTN_SKIP_DETECTION = True # 跳过字幕检测,跳过后可能会导致要去除的字幕遗漏或者误伤不需要去除字幕的视频帧
视频去除效果不好怎么办
修改backend/config.py中的参数,尝试不同的去除算法,算法介绍
InpaintMode.STTN 算法:对于真人视频效果较好,速度快,可以跳过字幕检测
InpaintMode.LAMA 算法:对于图片效果最好,对动画类视频效果好,速度一般,不可以跳过字幕检测
InpaintMode.PROPAINTER 算法: 需要消耗大量显存,速度较慢,对运动非常剧烈的视频效果较好
使用STTN算法
MODE = InpaintMode.STTN # 设置为STTN算法
相邻帧数, 调大会增加显存占用,效果变好
STTN_NEIGHBOR_STRIDE = 10
参考帧长度, 调大会增加显存占用,效果变好
STTN_REFERENCE_LENGTH = 10
设置STTN算法最大同时处理的帧数量,设置越大速度越慢,但效果越好
要保证STTN_MAX_LOAD_NUM大于STTN_NEIGHBOR_STRIDE和STTN_REFERENCE_LENGTH
STTN_MAX_LOAD_NUM = 30
使用LAMA算法
MODE = InpaintMode.LAMA # 设置为STTN算法
LAMA_SUPER_FAST = False # 保证效果
如果对模型去字幕的效果不满意,可以查看design文件夹里面的训练方法,利用backend/tools/train里面的代码进行训练,然后将训练的模型替换旧模型即可
CondaHTTPError
将项目中的.condarc放在用户目录下(C:/Users/<你的用户名>),如果用户目录已经存在该文件则覆盖
7z文件解压错误
解决方案:升级7-zip解压程序到最新版本
4090使用cuda 11.7跑不起来
解决方案:改用cuda 11.8
如果想详细了解,可以点开视频下方的链接。
谢谢观看本视频。要是喜欢,请订阅、点赞。谢谢
下载地址:https://download.pytorch.org/whl/cu118
GitHub:https://github.com/YaoFANGUK/video-subtitle-remover