電子書2有聲讀物：中文入門快速指南

星號：14.1K+ AI驅動的電子書到有聲讀物工具，具有語音克隆功能，支持1100多種語言的電子書2audiobook是Drewguardasson開發的一個開源項目，專注於自動轉換非DRM電子書（EPub/MOBI等）轉化為高質量的有聲讀物。它集成了先進的TTC模型，支持章節拆分、元數據嵌入、語音克隆和多語言輸出，並提供Gradio Web UI、CLI和Docker部署選項。

1.& nbsp;準備環境

Windows如何安裝

Python：https://www.python.org/downloads/
Git：https://git-scm.com/downloads
FFmpeg（懶惰方式）：下載壓縮包，解壓並添加 /bin PATH的目錄
https://www.gyan.dev/ffmpeg/builds/
口徑：https://calibre-ebook.com/download

確保命令行執行：

Python --版本
ffmpeg -版本

2.& nbsp;克隆項目代碼

git克隆https://github.com/DrewThomasson/ebook2audiobook
CD電子書2有聲讀物

3.& nbsp;安裝依賴項

該項目採用 詩歌 管理依賴項，所以先安裝它：

點安裝詩歌

然後安裝項目依賴項：

詩歌安裝

完成後，進入虛擬環境：

詩殼

4.& nbsp;準備您想要轉換的電子書

支持的收件箱：

EPub（最佳）
PDF
MOBI
TXT

推薦： 中文電子書使用EPub效果最穩定.

5.& nbsp;最簡單的轉換命令（中文版）。

直接將電子書變成MP3

python main.py 
 --輸入「你的電子書.epub」 
 --輸出「輸出目錄」 
 --語言「zh」 
 --tts-engine「coqui」 
 --輸出格式「mp3」

解釋最關鍵的參數：

參數	意義
`--輸入`	輸入電子書路徑
`--輸出`	輸出目錄
`--語言「zh」`	中國
`--tts-engine「coqui」`	Coqui XTTSv2（中文，穩定）
`--輸出格式`	mp3 /m4 b/ flac

6.& nbsp;如果您想使用更像「有聲讀物流媒體」的語音（推薦）。

這組命令效果更好（中文更自然）：

python main.py 
 --輸入「你的電子書.epub」 
 --輸出「輸出目錄」 
 --語言「zh」 
 --tts-engine「吠叫」 
 --語音「v2/zh_speaker_6」 
 --輸出格式「m4 b」

為什麼吠叫？

Bark在中文中的發音比Coqui更自然
配有多箇中文用戶（更接近有聲讀物的感覺）

7.& nbsp;高級：自定義您的聲音（聲音克隆）。

準備您的語音樣本（約20-30秒）
例如：

samples/myvoice.wav

然後運行：

python main.py 
 --input「電子書.epub」 
 --input「輸出「 
 --語言「zh」 
 --tts-engine「xtts」 
 --voice「samples/myvoice.wav」

系統將克隆您提供的語音來閱讀整本書。

中國克隆效應更多地取決於您提供的樣本的質量。
建議大聲記錄正常朗讀，自然語速即可。

8.& nbsp;輸出為專業有聲讀物格式M4 B（支持的章節）。

--輸出格式「m4 b」
--章節「真實」

示例：

python www.example.com 
 - -輸入「Book.epub」 
 - -輸出「out」 
 - -語言「zh」 
 - -tts-engine「coqui」 
 - -輸出格式「m4 b」 
 - -真實的章節

9.& nbsp;最無故障：Docker運行速度快（沒有Python）。

如果你的電腦上有Docker：

docker run -v「$PWD：/data」 
 電子書2有聲讀物 
 --輸入「/data/book.epub」 
 --輸出「/數據/輸出」 
 --語言「zh」

10.& nbsp;注意事項（中國用戶遇到的最常見陷阱）。

PDF提取效果不佳
→建議在運行前使用Calibre轉換為EPUB。
中文斷句問題
→ Bark / Coqui可以自動處理，無需手動標記。
輸出太慢
→圖形處理器=快
→中央處理器=速度慢但可用
→文本很長時要有耐心。
如果您報告錯誤，則找不到ffmpeg
- 放入FFmpeg的 /bin 在路徑中。

GitHub：https://github.com/DrewThomasson/ebook2audiobook
管材：