作者:
EPika (精靈皮卡丘)
2025-02-05 20:39:24標題:輝達CMU新研究!機器人跳APT舞驚豔全網 「人形機器人」奧運會2030年可期
原文內容:
機器人版的柯比布萊恩 (Kobe Bryant)、詹皇(LeBron James)、C 羅 Cristiano
Ronaldo 真的來了,而這一切全拜卡內基美隆大學(CMU) 和輝達(NVDA-US) 所提出的一個
real2sim2real 模型 Aligning Simulation and Real Physics(ASAP),ASAP 能讓人形
機器人掌握非常流暢且動感的全身控制動作,就連跳時下最紅的 APT 也相當流暢。
中國智能資訊社交平台《新智元》報導,市場可以期待在 2030 年看到人形機器人奧運會
盛宴,CMU 與輝達提出的 ASAP 專案包含預訓練和後訓練兩大階段。在第一個階段中,透
過重定向的人體數據,在模擬環境中預訓練運動追蹤策略,第二階段將這些策略部署到現
實世界,並收集真實數據來訓練一個「殘差」動作模型,用來彌補模型與真實世界物理動
態之間的差距。
然後,ASAP 把這個 delta 動作模型整合到模擬器中,對預訓練策略進行微調,讓它和現
實世界的動力學更匹配。具體步驟分為四步,分別是運動跟蹤預訓練與真實軌跡收集、差
異動作模型訓練、策略微調以及真實世界部署。
研究人員在三個遷移場景中評估了 ASAP 的效果。從 IsaacGym 到 IsaacSim、從
IsaacGym 到 Genesis,以及從 IsaacGym 到真實世界,使用的機器人則是中國廠商宇樹
的 G1 人形機器人。
最後,研究者藉助 delta 動作模型對預訓練的策略進行微調,使其能夠更好地適應真實
世界的物理環境,從而實現更穩定、敏捷的運動控制。
sim2real 一直是實現空間與具身智慧的主要路徑之一,被廣泛應用在機器人模擬評估當
中,而 real2sim2real 直接打破了繁瑣的動作微調的難題,彌合 sim2real 的差距,讓
機器人能夠模仿各種類人的動作。
輝達資深研究科學家 Jim Fan 興奮地表示,透過 RL 讓人形機器人成功模仿 C 羅、詹皇
和科比!
報導指出,CMU 跟輝達的研究有四大貢獻。第一個是提出 ASAP 框架,運用強化學習和真
實世界的數據來訓練 delta 動作模型,有效縮小了模擬與現實之間的差距。其次,成功
在真實環境部署全身控制策略,實現了不少以前人形機器人難以做到的動作。
第三大貢獻則是 ASAP 能有效減少動力學不匹配問題,讓機器人做出高度敏捷的動作,同
時顯著降低運動跟蹤誤差。最後,研究者開發並開源了一個多模擬器訓練與評估代碼庫,
以促進不同模擬器之間的平滑遷移,並加快後續研究。
這篇槽點太多了 不知道從何說起...