繁中

人形機器人設計框架:儘快

英偉達和卡內基梅隆大學推出了專門為人形機器人設計的框架:儘快

它可以幫助機器人在模擬環境中學習動作後在現實世界中準確執行這些動作,使以前難以實現的高度靈活的動作成為可能!

該框架使用兩階段過程,允許機器人在模擬環境中進行預訓練,然後將這些訓練策略應用於現實世界,並通過進一步調整實現更靈活的全身運動。

仿生機器人具有無與倫比的多功能性,可以執行類似人類的全身技能。然而,由於模擬與現實世界之間的動態不匹配,實現敏捷和協調的全身運動仍然是一個重大挑戰。現有方法,例如系統識別(SYsid)和域隨機化方法(DR)方法,通常依賴於勞動密集型參數調整或犧牲靈活性的策略,從而導致過於保守。在本文中,我們儘快提出(對齊模擬和真實物理),這是一個兩階段框架,旨在解決動態不匹配問題並實現敏捷的人形全身技能。

在第一階段,我們使用重新定位的人體運動數據來訓練運動跟蹤策略。在第二階段,我們在現實世界中部署政策並收集現實世界數據來訓練Delta行動模型以補償動態不匹配。然後,預訓練的策略會儘快與Delta Action模型的微調,並集成到模擬器中,以有效地與現實世界的動態保持一致。我們在三種轉移場景中儘快評估了ISAACGYM到Isaacsim、Isaacgym到Genesis和Isaacgym以及現實世界的G1 Humoleoid Huoid Robot。與Sysid、DR和Delta Dynamics學習基準相比,我們的方法顯著提高了各種動態運動的敏捷性和全身協調性,從而減少了跟蹤誤差。

以前難以實現的高度敏捷運動儘快實現,展示了Delta運動學習在連接模擬和現實世界動態方面的潛力。這些結果表明,可以開發出有前途的SIM卡,讓更具表現力和敏捷性的類人生物進入真正的方向。

ASAP框架內有四個步驟:

運動跟蹤預訓練和實際軌跡收集:
通過對人形運動的人類視頻重新定位,我們預先訓練了多種運動跟蹤策略,以推斷現實世界中的軌跡。
灌溉行動模型培訓
基於真實世界的發射數據,我們通過最小化仿真狀態S_t和真實世界狀態S^R_t之間的差異來訓練Delta動作模型;
政策微調
我們凍結了增量運動模型,將其納入模擬器以與現實世界的物理學保持一致,然後微調了預先訓練的運動跟蹤策略;
現實世界部署

最後,我們在沒有Delta行動模型的情況下直接在現實世界中部署微調策略。

地址:https://agile.human2humanoid.com/
論文:https://arxiv.org/pdf/2502.01143

輸油管:

返回頂端