「输入一个主题,AI 帮你想创意、出素材、排版加字,几秒钟出一张 1280×720 的 YouTube 缩略图。」
在内容创作者的世界里,封面图往往决定了视频的第一印象。
但每一次设计都要反复调色、选字、抠图?这件事可以交给 AI 来做。
这篇文章带你快速了解一个开源的自动封面生成器 —— yt_thumbnail_creator。
它是什么
yt_thumbnail_creator 是一个基于 Python 的开源项目,
通过 LLM(大语言模型) + Stable Diffusion 协作,自动生成有创意的 YouTube 封面图。
- LLM 负责:构思主题、生成提示词
- Stable Diffusion 负责:绘制图像素材
- 程序自动:去除背景、添加文字、合成出最终缩略图
整个流程几乎不需要人工干预,一条命令即可完成。
核心功能
- 智能创意:输入一个主题,自动生成视觉关键词与提示词
- 高质量素材:用 Stable Diffusion 生成对应图像
- 自动抠图:借助
rembg去除背景 - 文字排版:将标题文字添加到合适位置
- 一键导出:输出 1280×720 的标准封面尺寸
代码结构清晰,所有配置都集中在 yt_thumb_gen.py 中,修改极为方便。
依赖与安装
项目环境依赖:
Python 3.7+
pip install gradio_client Pillow rembg colorama
安装步骤:
git clone https://github.com/Likhithsai2580/yt_thumbnail_creator.git
cd yt_thumbnail_creator
pip install -r requirements.txt
然后在项目中准备一个自定义的 LLM 实现文件:
llm/llama.py
该文件可以是你自己的 API 调用方式(如 OpenAI 或其他本地模型)。
使用方法
执行命令:
python yt_thumb_gen.py --topic "How to Learn Calculus Fast"
运行后程序会自动:
- 调用 LLM 生成提示词;
- 生成图片素材;
- 抠图并合成;
- 加上标题文字;
- 导出最终的缩略图到
THUMBNAIL_PATH。
输出尺寸默认为 1280×720,也可以在脚本中修改。
项目结构简览
yt_thumbnail_creator/
│
├── llm/ # 自定义语言模型调用逻辑
├── static/ # 存放素材文件
├── yt_thumb_gen.py # 主程序,包含生成逻辑
└── requirements.txt # 环境依赖
关键函数:
generate_assets(topic):生成主题素材remove_bg_from_asset():自动去除背景add_text_to_thumbnail():添加标题文字
可配置项
脚本中可以直接调整:
| 配置项 | 说明 |
|---|---|
THUMBNAIL_PATH | 输出目录 |
FONT_SIZE | 字体大小 |
ASSET_DIR_PATH | 素材存放路径 |
THUMBNAIL_SIZE | 默认输出尺寸(1280×720) |
示例展示
输入:
python yt_thumb_gen.py --topic "Stop Procrastinating in 7 Days"
输出结果:
- 背景为与“自律、时间”相关的视觉;
- 主体人物自动抠图并置于中心;
- 大标题“STOP PROCRASTINATING” 自动居中加阴影;
- 导出为可直接上传的封面文件。
常见问题
Q1: 提示找不到 llm/llama.py
→ 需要自定义该文件,封装你自己的 LLM 调用。
Q2: 抠图失败 / rembg 报错
→ 尝试安装 onnxruntime 或更新 rembg 版本。
Q3: 图片没保存
→ 检查 THUMBNAIL_PATH 路径是否存在或有写入权限。
开源许可
本项目基于 MIT License 开源,
你可以自由修改、二次开发或集成到自己的自动化工具中。
特别感谢 Stable Diffusion、rembg、Gradio 等开源项目的支持。
我的思考
这个项目的思路并不复杂,但非常实用。
它把创意生成、图像生成、图像处理三步整合到一个工作流里。
对内容创作者来说,它解决的不是“生成图像”的问题,
而是从灵感到成品之间的“摩擦力”。
未来如果能再加入模板系统、字体自适应和多版本 A/B 导出,
它将成为一个完整的 “封面自动工厂”。
Github:https://github.com/Likhithsai2580/yt_thumbnail_creator