繁中

精準控制角色外表和姿勢的開源AI試衣模型

AI擬合模型:Leffa

項目功能:AI試衣模型
項目簡介:一個開源人工智慧試衣模型,可以準確控制角色的外觀和姿勢。

(翻譯自原文)
可控角色圖像生成旨在生成以參考圖像為條件的角色圖像,從而允許精確控制角色的外觀或姿勢。然而,雖然現有方法實現了高的整體圖像質量,但它們通常會扭曲參考圖像的細粒度紋理細節。我們將這些失真歸因於對參考圖像中相應區域的關注不足。為了解決這個問題,我們提出了注意力學習比特流(Leffa),它在訓練期間顯式地指導注意力層中正確參考鍵的目的查詢。具體來說,它是通過基於擴散的基線內注意力圖上方的規則化損失來實現的。我們廣泛的實驗表明,Leffa在控制外觀(虛擬試穿)和姿勢(姿勢轉換)方面實現了最先進的性能,顯著減少了細粒度細節失真,同時保持了高圖像質量。此外,我們表明我們的損失與模型無關,可以用於改進其他擴散模型的性能。

我們提出了Leffa,這是一個用於生成可控人物圖像的統一框架,允許精確操縱外觀(即虛擬試穿)和姿勢(即姿勢轉移)。Leffa生成的圖像質量高,保留了精細的細節,紋理失真最小。請放大以更好地查看。

您可以瀏覽更多:
原文:https://arxiv.org/abs/2412.08486
Html格式:https://arxiv.org/html/2412.08486v2

輸油管:

返回頂端