精準控制角色外表和姿勢的開源AI試衣模型

AI擬合模型：Leffa

項目功能：AI試衣模型
項目簡介：一個開源人工智慧試衣模型，可以準確控制角色的外觀和姿勢。

（翻譯自原文）
可控角色圖像生成旨在生成以參考圖像為條件的角色圖像，從而允許精確控制角色的外觀或姿勢。然而，雖然現有方法實現了高的整體圖像質量，但它們通常會扭曲參考圖像的細粒度紋理細節。我們將這些失真歸因於對參考圖像中相應區域的關注不足。為了解決這個問題，我們提出了注意力學習比特流（Leffa），它在訓練期間顯式地指導注意力層中正確參考鍵的目的查詢。具體來說，它是通過基於擴散的基線內注意力圖上方的規則化損失來實現的。我們廣泛的實驗表明，Leffa在控制外觀（虛擬試穿）和姿勢（姿勢轉換）方面實現了最先進的性能，顯著減少了細粒度細節失真，同時保持了高圖像質量。此外，我們表明我們的損失與模型無關，可以用於改進其他擴散模型的性能。

我們提出了Leffa，這是一個用於生成可控人物圖像的統一框架，允許精確操縱外觀（即虛擬試穿）和姿勢（即姿勢轉移）。Leffa生成的圖像質量高，保留了精細的細節，紋理失真最小。請放大以更好地查看。

您可以瀏覽更多：
原文：https://arxiv.org/abs/2412.08486
Html格式：https://arxiv.org/html/2412.08486v2

輸油管：