繁中

電子書2有聲讀物:中文入門快速指南

星號:14.1K+ AI驅動的電子書到有聲讀物工具,具有語音克隆功能,支持1100多種語言的電子書2audiobook是Drewguardasson開發的一個開源項目,專注於自動轉換非DRM電子書(EPub/MOBI等)轉化為高質量的有聲讀物。它集成了先進的TTC模型,支持章節拆分、元數據嵌入、語音克隆和多語言輸出,並提供Gradio Web UI、CLI和Docker部署選項。

1.& nbsp;準備環境

相關軟體

  1. Python 3.10+
  2. Git
  3. FFmpeg (需要音頻處理)
  4. 口徑 (解析EPub/PDF結構)

Windows如何安裝

確保命令行執行:

Python --版本
ffmpeg -版本

2.& nbsp;克隆項目代碼

git克隆https://github.com/DrewThomasson/ebook2audiobook
CD電子書2有聲讀物

3.& nbsp;安裝依賴項

該項目採用 詩歌 管理依賴項,所以先安裝它:

點安裝詩歌

然後安裝項目依賴項:

詩歌安裝

完成後,進入虛擬環境:

詩殼

4.& nbsp;準備您想要轉換的電子書

支持的收件箱:

  • EPub(最佳)
  • PDF
  • MOBI
  • TXT

推薦: 中文電子書使用EPub效果最穩定.

5.& nbsp;最簡單的轉換命令(中文版)。

直接將電子書變成MP3

python main.py 
 --輸入「你的電子書.epub」 
 --輸出「輸出目錄」 
 --語言「zh」 
 --tts-engine「coqui」 
 --輸出格式「mp3」

解釋最關鍵的參數:

參數意義
--輸入輸入電子書路徑
--輸出輸出目錄
--語言「zh」中國
--tts-engine「coqui」Coqui XTTSv2(中文,穩定)
--輸出格式mp3 /m4 b/ flac

6.& nbsp;如果您想使用更像「有聲讀物流媒體」的語音(推薦)。

這組命令效果更好(中文更自然):

python main.py 
 --輸入「你的電子書.epub」 
 --輸出「輸出目錄」 
 --語言「zh」 
 --tts-engine「吠叫」 
 --語音「v2/zh_speaker_6」 
 --輸出格式「m4 b」

為什麼吠叫?

  • Bark在中文中的發音比Coqui更自然
  • 配有多箇中文用戶(更接近有聲讀物的感覺)

7.& nbsp;高級:自定義您的聲音(聲音克隆)。

準備您的語音樣本(約20-30秒)
例如:

samples/myvoice.wav

然後運行:

python main.py 
 --input「電子書.epub」 
 --input「輸出「 
 --語言「zh」 
 --tts-engine「xtts」 
 --voice「samples/myvoice.wav」

系統將克隆您提供的語音來閱讀整本書。

中國克隆效應更多地取決於您提供的樣本的質量。
建議大聲記錄正常朗讀,自然語速即可。

8.& nbsp;輸出為專業有聲讀物格式M4 B(支持的章節)。

--輸出格式「m4 b」
--章節「真實」

示例:

python www.example.com 
 - -輸入「Book.epub」 
 - -輸出「out」 
 - -語言「zh」 
 - -tts-engine「coqui」 
 - -輸出格式「m4 b」 
 - -真實的章節

9.& nbsp;最無故障:Docker運行速度快(沒有Python)。

如果你的電腦上有Docker:

docker run -v「$PWD:/data」 
 電子書2有聲讀物 
 --輸入「/data/book.epub」 
 --輸出「/數據/輸出」 
 --語言「zh」

10.& nbsp;注意事項(中國用戶遇到的最常見陷阱)。

  1. PDF提取效果不佳
    →建議在運行前使用Calibre轉換為EPUB。
  2. 中文斷句問題
    → Bark / Coqui可以自動處理,無需手動標記。
  3. 輸出太慢
    →圖形處理器=快
    →中央處理器=速度慢但可用
    →文本很長時要有耐心。
  4. 如果您報告錯誤,則找不到ffmpeg
    - 放入FFmpeg的 /bin 在路徑中。

GitHub:https://github.com/DrewThomasson/ebook2audiobook
管材:

返回頂端