DETECT-2B：音頻深度鍛造檢測工具

只需200毫秒即可檢測30多種語言的音頻

Detect-2B使用一系列預先訓練的子模型和微調技術，專門用於檢查音頻片段並確定它們是否由人工智慧生成。

「在我們最初的Detect模型的基礎上，Detect-2B在模型架構、訓練數據和整體性能方面做出了顯著改進。該模型在真實和虛假音頻片段的大型數據集上進行了評估，並表現出令人印象深刻的性能。」西姆布爾在官方博客文章中說道。

根據Resemble的說法，Detect-2B的子模型由具有關鍵層插入自適應模塊的凍結音頻表示模型組成。這些改編模塊專注於識別真實音頻和假音頻之間的細微差別--即錄音過程中無意中留下的聲音痕跡。大多數人工智慧生成的音頻片段聽起來「太完美了。「Detect-2B能夠預測音頻中的人工智慧組件，而不必在每次聽到新剪輯時重新訓練模型。這些子模型還在大型數據集上進行了全面訓練。

Detect-2B將總結其預測分數，並將其與「精心調整的閾值」進行比較，以確定錄音的真實性。Resemble表示，他們獨特的設計使Detect-2B能夠快速訓練，並且在部署時不需要大量計算能力。

識別深度偽造變得特別重要

隨著2024年美國總統大選的臨近，識別人工智慧生成的聲音或視頻變得越來越重要。人工智慧的聲音可能會增加誤導選民和傳播錯誤信息的風險。無論是偽造政客的聲音、在歌曲中冒充名人，還是簡單地使用人工智慧來陳述某事，對人工智慧深度造假的擔憂都削弱了公眾對品牌的信任。

Detect-2B等工具可以在很大程度上幫助識別和證明這些深度偽造的內容進入公眾視野之前的偽造行為。當然，Resemble並不是唯一一家致力於測試人工智慧克隆的公司。例如，McAfee在一月份啟動了Project Mockingbird項目，以檢測人工智慧音頻。Meta正在開發一種向人工智慧生成的音頻添加水印的方法。

「但我們的工作遠未結束。隨著生成性人工智慧能力的不斷增強，我們的檢測能力也必須同時提高。我們規劃了幾個令人興奮的研究方向來進一步優化Detect-2B，重點關注代表性學習、高級模型架構和數據擴展等領域。」西姆布爾說。

如果您想了解更多信息，可以單擊視頻下方的連結。
感謝您觀看此視頻。如果您喜歡，請訂閱並點讚。謝謝

原文：https://venturebeat.com/ai/resemble-ais-next-generation-ai-audio-detection-model-detect-2b-is-94-accurate/

輸油管：