該工具稱為Azure AI Speech的文本轉語音化身
該工具允許用戶通過文本輸入生成真實逼真的真人談話視頻。您只需上傳一張您想模仿的人的照片並編寫劇本即可。
支持多種語言和實時問答互動。
主要功能:
1.真實的化身視頻生成:用戶可以上傳照片和腳本,該工具創建逼真的角色化身視頻來模擬角色語音。
2.多語言支持和實時聊天機器人:Avatars支持多種語言,並可以使用AI模型(例如GPT)實時響應無腳本的問題。
3.個性化語音功能:提供一分鐘語音樣本,快速複製用戶語音,用於定製語音助手和內容配音。
4.法律和道德保障:禁止使用預先錄製的語音,需要用戶明確同意,並通過註冊使用特定用例。
5.水印技術:它會自動向個人語音添加水印,以幫助識別AI合成語音,並且您需要同意微軟的水印檢測服務。
6.高效的視頻內容創建:簡化傳統視頻製作流程,適合創建培訓視頻、產品居間等。
7.增強的數字交互體驗:它可用於構建對話代理、虛擬助理和聊天機器人,提供自然的交互式對話。
8.內容生成工作流程:包括文本分析、TTC音頻合成和TTC化身視頻合成,以生成與語音同步的嘴唇動畫。
9.預構建和自定義化身選項:可供使用的預構建化身和可定製化身,後者通過用戶上傳的視頻錄製進行訓練。
10. UI工具和API訪問支持:Azure AI Speech Studio中提供UI工具和API訪問。
11.應用場景廣泛:適合創建各種有吸引力的視頻和互動應用,提高溝通和信息溝通效率。
視頻演示的代碼資源:
GitHub:https://github.com/Azure/gen-cv/tree/main/avatar/video