繁中

Emilia,一個開源、多語言、高質量語音數據集

六種語言超過100,000小時

中大(深圳)聯合中國科學院聲學研究所、上海人工智慧實驗室等機構,發布了超過10萬小時的6種語言多元化語音生成數據集- Emilia!

Emilia是一個開源、多語言外國語音數據集,專為大規模語音生成研究而設計。它包含超過101,000小時的高質量語音數據和六種語言的相應文本轉錄,涵蓋多種演講風格和內容類型,例如脫口秀、採訪、辯論、體育評論和有聲讀物。

需求群體:

「Emilia數據集針對需要進行大規模語音生成研究的學者和研究人員,尤其是那些專注於多語言文本到語音和語音識別技術的學者和研究人員。"

示例使用場景:

用於開發多語言文本到語音系統
用作訓練數據集,提高語音識別算法的準確性
在教育領域,用於語言學習和發音教學

產品特點:

以六種語言提供超過101,000小時的高質量語音數據
包含中文、英語、日語、韓語、德語和法語的語音和文本記錄
源自網際網路上多元化的視頻平台和播客,內容類型豐富
使用Emilia-Pipe開源預處理管道支持數據預處理
允許研究人員下載原始音頻文件並重建數據集
Emilia-Pipe支持定製語音數據預處理,以滿足特定研究需求

如果您想了解更多信息,可以單擊視頻下方的連結。
感謝您觀看此視頻。如果您喜歡,請訂閱並點讚。謝謝

ArXiv: https://arxiv.org/abs/2407.05361
GitHub: https://github.com/open-mmlab/Amphion/tree/main/preprocessors/Emilia
主頁: https://emilia-dataset.github.io/Emilia-Demo-Page/
擁抱臉: https://huggingface.co/datasets/amphion/Emilia

輸油管:

返回頂端