「輸入一個主題,人工智慧將幫助您提出想法、生成材料、打字和添加單詞,並在幾秒鐘內生成1280 x 720的YouTube縮略圖。"
在內容創作者的世界中,封面圖像通常決定視頻的第一印象。
但每個設計都必須反覆著色、選擇和剪裁?這可以由人工智慧完成。
本文將快速概述開源自動封面生成器- yt_thumbnail_creator.
怎麼了
yt_thumbnail_creator 是一個基於Python的開源項目,
通過以下方式自動生成創意YouTube封面圖片 LLM(大型語言模型)+穩定擴散 協作
- LLM負責:概念化主題和生成提示
- 穩定擴散負責:繪製圖像材料
- 該程式是自動的:刪除背景、添加文本併合成最終的縮略圖
整個過程幾乎不需要人工干預,只需一個命令即可完成。
核心特點:
- 聰明的創造力:輸入主題並自動生成視覺關鍵詞和提示
- 高質量的鏡頭:使用穩定擴散生成相應的圖像
- 自動剪切:在幫助下刪除背景
倫伯格刪除背景 - 文本布局:將標題文本添加到適當的位置
- 一鍵輸出:輸出標準封面尺寸1280 x 720
代碼結構清晰,所有配置 yt_thumb_gen.py 是集中的,並且非常容易修改。
附屬機構和裝置
項目環境依賴性:
Python 3.7+
pip install gradio_client Pillow rembg colorama
安裝步驟:
git克隆https://github.com/Likhithsai2580/yt_thumbnail_creator.git
CD yt_thought_creator
pip安裝-r要求.文本
然後準備一個定製 LLM實施文件 在您的項目中:
llm/llama.py
該文件可以是您自己的API調用(例如OpenAI或其他本地模型)。
如何用途:
執行命令:
Python yt_thumb_gen.py --主題「如何快速學習微積分」
運行後,程式會自動:
- 啟動LLM以生成提示;
- 生成形象素材;
- 剪切和合成;
- 添加標題文本;
- 將最終縮略圖輸出到
拇指甲路徑.
輸出大小默認為 1280×720 也可以在腳本中修改。
項目結構概述
yt_thought_creator/
│
- -llm/ # 自定義語言模型調整版
- -靜態/ #保存文件
- -yt_thumb_gen.py # 主程式,包含生成剪輯
- -要求.文本 # 環境相依
主要功能:
generate_assets(主題):生成主題材料remove_bg_from_asset():自動刪除背景add_text_to_thought():添加標題文本
可配置
您可以直接在腳本中調整:
| 配置項目 | 描述 |
|---|---|
拇指甲路徑 | 輸出目錄 |
font_SIZE | 字體大小 |
資產__路徑 | 材料儲存路徑 |
拇指釘_尺寸 | 默認輸出大小(1280 x 720) |
實例表明
輸入:
Python yt_thumb_gen.py --主題「7天內停止拖延」
產出:
- 背景是與「自律與時間」相關的願景;
- 主角被自動剪掉並放置在中心;
- 標題「STOP CLARASTINATING」自動居中並呈陰影;
- 作為封面文件輸出,可以直接上傳。
常見問題
Q1: 未找到提示 llm/llama.py
- 您需要自定義文件來封裝您自己的LLM調用。
Q2: 未能剪切/rembg錯誤
→嘗試安裝 onnxruntime 或更新 倫伯格 版本。
Q3: 圖片尚未保存
→檢查 拇指甲路徑 路徑是否存在或具有寫權限。
開源許可證
該項目基於 MIT許可證 開源,
您可以自由修改、重新開發或集成到自己的自動化工具中。
特別感謝Stable Distribution、rembg、Greadio等開源項目的支持。
我的想法
這個項目的想法並不複雜,但非常實用。
它將想法生成、圖像生成和圖像處理三個步驟集成到單一工作流程中。
對於內容創作者來說,它並不能解決「生成圖像」的問題,
是 靈感與成品之間的「摩擦」.
將來如果可以添加模板系統、字體改編和多版本A/B輸出,
它將成為一個完整的「掩護汽車工廠」。
Github:https://github.com/Likhithsai2580/yt_thumbnail_creator
管材: