微軟推出了一款僅將文本內容轉換為真人視頻的工具：Deepfakes Creator

該工具稱為Azure AI Speech的文本轉語音化身

該工具允許用戶通過文本輸入生成真實逼真的真人談話視頻。您只需上傳一張您想模仿的人的照片並編寫劇本即可。

支持多種語言和實時問答互動。

主要功能：

1.真實的化身視頻生成：用戶可以上傳照片和腳本，該工具創建逼真的角色化身視頻來模擬角色語音。
2.多語言支持和實時聊天機器人：Avatars支持多種語言，並可以使用AI模型（例如GPT）實時響應無腳本的問題。
3.個性化語音功能：提供一分鐘語音樣本，快速複製用戶語音，用於定製語音助手和內容配音。
4.法律和道德保障：禁止使用預先錄製的語音，需要用戶明確同意，並通過註冊使用特定用例。
5.水印技術：它會自動向個人語音添加水印，以幫助識別AI合成語音，並且您需要同意微軟的水印檢測服務。
6.高效的視頻內容創建：簡化傳統視頻製作流程，適合創建培訓視頻、產品居間等。
7.增強的數字交互體驗：它可用於構建對話代理、虛擬助理和聊天機器人，提供自然的交互式對話。
8.內容生成工作流程：包括文本分析、TTC音頻合成和TTC化身視頻合成，以生成與語音同步的嘴唇動畫。
9.預構建和自定義化身選項：可供使用的預構建化身和可定製化身，後者通過用戶上傳的視頻錄製進行訓練。
10. UI工具和API訪問支持：Azure AI Speech Studio中提供UI工具和API訪問。
11.應用場景廣泛：適合創建各種有吸引力的視頻和互動應用，提高溝通和信息溝通效率。

詳情和API應用： https://techcommunity.microsoft.com/t5/ai-azure-ai-services-blog/azure-ai-speech-announces-public-preview-of-text-to-speech/ba-p/3981448

視頻演示的代碼資源：

GitHub：https://github.com/Azure/gen-cv/tree/main/avatar/video