一款开源的AI试衣模型,能够精确操控人物的外观和姿势
AI试衣模型:Leffa
项目功能:AI试衣模型
项目简介:一款开源的AI试衣模型,能够精确操控人物的外观和姿势。
(一下翻译自原文)
可控人物影像產生旨在產生以參考影像為條件的人物影像,從而允許精確控制人物的外觀或姿勢。然而,現有方法儘管實現了較高的整體影像質量,但通常會扭曲參考影像的細粒度紋理細節。我們將這些扭曲歸因於對參考影像中相應區域的關注不夠。為了解決這個問題,我們提出了注意力學習流場( Leffa ),它明確地引導目標查詢在訓練期間注意注意力層中的正確參考鍵。具體來說,它是透過基於擴散的基線內的注意力圖之上的正則化損失來實現的。我們大量的實驗表明, Leffa在控制外觀(虛擬試穿)和姿勢(姿勢轉移)方面實現了最先進的性能,顯著減少了細粒度細節失真,同時保持了高圖像品質。此外,我們表明我們的損失與模型無關,可用於提高其他擴散模型的性能。
我們提出了Leffa ,這是一個用於生成可控人物圖像的統一框架,可以精確操縱外觀(即虛擬試穿)和姿勢(即姿勢轉移)。 Leffa生成的圖像具有高品質,保留了精細的細節,並且紋理失真最小。請放大以便更好地觀看。
更多可以浏览:
原文:https://arxiv.org/abs/2412.08486
Html格式:https://arxiv.org/html/2412.08486v2