OpenAI推出語音生成模型：Voice Engine

基於文本輸入和15秒的音頻樣本，可以生成聽起來自然的語音，接近原始說話者的聲音。
Voice Engine最初開發於2022年底，現已向包括Heygen在內的幾家公司提供測試版使用。

主要功能

1.聽起來自然的語音生成：使用單個15秒的音頻樣本，Voice Engine可以創建既感性又真實的語音，顯著提高合成語音的自然性和真實性。
2.支持多種用途：從教育援助、內容翻譯、提高偏遠地區服務質量，到支持非言語人群和幫助患者恢復聲音，Voice Engine應用場景廣泛，跨越多個行業。
3.語言和口音保留：語音引擎在翻譯內容時可以保留原說話者的當地口音，使翻譯後的語音不僅能夠流利，而且保持原語音的特徵。
4.多語言支持：可以生成多種語言的語音輸出，以適應全球化的需求。對於需要將內容本地化到不同語言市場的公司和內容創作者來說，該功能尤其重要。

詳情：https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

視頻：