基於文本輸入和15秒的音頻樣本,可以生成聽起來自然的語音,接近原始說話者的聲音。
Voice Engine最初開發於2022年底,現已向包括Heygen在內的幾家公司提供測試版使用。
主要功能
1.聽起來自然的語音生成:使用單個15秒的音頻樣本,Voice Engine可以創建既感性又真實的語音,顯著提高合成語音的自然性和真實性。
2.支持多種用途:從教育援助、內容翻譯、提高偏遠地區服務質量,到支持非言語人群和幫助患者恢復聲音,Voice Engine應用場景廣泛,跨越多個行業。
3.語言和口音保留:語音引擎在翻譯內容時可以保留原說話者的當地口音,使翻譯後的語音不僅能夠流利,而且保持原語音的特徵。
4.多語言支持:可以生成多種語言的語音輸出,以適應全球化的需求。對於需要將內容本地化到不同語言市場的公司和內容創作者來說,該功能尤其重要。
詳情:https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices
視頻: