星號:14.1K+ AI驅動的電子書到有聲讀物工具,具有語音克隆功能,支持1100多種語言的電子書2audiobook是Drewguardasson開發的一個開源項目,專注於自動轉換非DRM電子書(EPub/MOBI等)轉化為高質量的有聲讀物。它集成了先進的TTC模型,支持章節拆分、元數據嵌入、語音克隆和多語言輸出,並提供Gradio Web UI、CLI和Docker部署選項。
1.& nbsp;準備環境
相關軟體
- Python 3.10+
- Git
- FFmpeg (需要音頻處理)
- 口徑 (解析EPub/PDF結構)
Windows如何安裝
- Python:https://www.python.org/downloads/
- Git:https://git-scm.com/downloads
- FFmpeg(懶惰方式):下載壓縮包,解壓並添加
/binPATH的目錄
https://www.gyan.dev/ffmpeg/builds/ - 口徑:https://calibre-ebook.com/download
確保命令行執行:
Python --版本
ffmpeg -版本
2.& nbsp;克隆項目代碼
git克隆https://github.com/DrewThomasson/ebook2audiobook
CD電子書2有聲讀物
3.& nbsp;安裝依賴項
該項目採用 詩歌 管理依賴項,所以先安裝它:
點安裝詩歌
然後安裝項目依賴項:
詩歌安裝
完成後,進入虛擬環境:
詩殼
4.& nbsp;準備您想要轉換的電子書
支持的收件箱:
- EPub(最佳)
- MOBI
- TXT
推薦: 中文電子書使用EPub效果最穩定.
5.& nbsp;最簡單的轉換命令(中文版)。
直接將電子書變成MP3
python main.py
--輸入「你的電子書.epub」
--輸出「輸出目錄」
--語言「zh」
--tts-engine「coqui」
--輸出格式「mp3」
解釋最關鍵的參數:
| 參數 | 意義 |
|---|---|
--輸入 | 輸入電子書路徑 |
--輸出 | 輸出目錄 |
--語言「zh」 | 中國 |
--tts-engine「coqui」 | Coqui XTTSv2(中文,穩定) |
--輸出格式 | mp3 /m4 b/ flac |
6.& nbsp;如果您想使用更像「有聲讀物流媒體」的語音(推薦)。
這組命令效果更好(中文更自然):
python main.py
--輸入「你的電子書.epub」
--輸出「輸出目錄」
--語言「zh」
--tts-engine「吠叫」
--語音「v2/zh_speaker_6」
--輸出格式「m4 b」
為什麼吠叫?
- Bark在中文中的發音比Coqui更自然
- 配有多箇中文用戶(更接近有聲讀物的感覺)
7.& nbsp;高級:自定義您的聲音(聲音克隆)。
準備您的語音樣本(約20-30秒)
例如:
samples/myvoice.wav
然後運行:
python main.py
--input「電子書.epub」
--input「輸出「
--語言「zh」
--tts-engine「xtts」
--voice「samples/myvoice.wav」
系統將克隆您提供的語音來閱讀整本書。
中國克隆效應更多地取決於您提供的樣本的質量。
建議大聲記錄正常朗讀,自然語速即可。
8.& nbsp;輸出為專業有聲讀物格式M4 B(支持的章節)。
--輸出格式「m4 b」
--章節「真實」
示例:
python www.example.com
- -輸入「Book.epub」
- -輸出「out」
- -語言「zh」
- -tts-engine「coqui」
- -輸出格式「m4 b」
- -真實的章節
9.& nbsp;最無故障:Docker運行速度快(沒有Python)。
如果你的電腦上有Docker:
docker run -v「$PWD:/data」
電子書2有聲讀物
--輸入「/data/book.epub」
--輸出「/數據/輸出」
--語言「zh」
10.& nbsp;注意事項(中國用戶遇到的最常見陷阱)。
- PDF提取效果不佳
→建議在運行前使用Calibre轉換為EPUB。 - 中文斷句問題
→ Bark / Coqui可以自動處理,無需手動標記。 - 輸出太慢
→圖形處理器=快
→中央處理器=速度慢但可用
→文本很長時要有耐心。 - 如果您報告錯誤,則找不到ffmpeg
- 放入FFmpeg的/bin在路徑中。