①英偉達開發的AI代理Eureka引入大模型參與訓練,可以教會機器人複雜的運動控製技能,Meta Habitat 3.0模擬器可教授機器人如何與物理世界進行交互; ②英偉達深耕運動控製,Meta注重交互能力,這兩大能力正是機器人進入千家萬戶的前提。
如今,科技巨頭主動肩負起機器人研發的重任,正你追我趕奔赴下一場科技盛宴。當地時間10月20日,$英偉達(NVDA.US)$、$Meta Platforms(META.US)$各自發布了重磅機器人訓練工具。
英偉達開發的AI代理Eureka可以教會機器人複雜的運動控製技能,比如轉筆、打開抽屜和櫃子、拋球和接球、操作剪刀。英偉達稱這一突破將重新定義機器學習。
Meta則推出了Habitat 3.0模擬器,可教授機器人如何與物理世界進行交互,Meta將其稱爲“社交智能機器人研發路上的里程碑”。
究竟是什麼樣的工具?新成果的意義何在?
▌英偉達Eureka——大模型參與訓練機器人
Eureka的全稱是Evolution-driven Universal Reward Kit for Agent,本質是一種由大模型驅動的算法生成工具。藉助GPT-4寫代碼的能力,Eureka擁有了出色的獎勵函數設計能力,可以自主編寫獎勵算法來訓練機器人。
Eureka的關鍵所在,是通過上下文來實現了人類水平的獎勵算法設計。簡單來說,就是用GPT-4的零樣本生成、代碼編寫以及上下文改進功能,對獎勵執行策略進行優化,由此通過強化學習來進行復雜的技能。
英偉達稱,在29種不同的開源強化學習(RL)環境中,Eureka獎勵設計的性能達到了人類水平,這些環境包括10種不同的機器人形態(四足機器人、四旋翼機器人、雙足機器人、機械手以及幾種靈巧手)。在沒有任何特定任務提示或獎勵模板的情況下,Eureka生成的獎勵程序在超過80%的任務上優於專家編寫的獎勵程序。這使得機器人的平均性能提高了50%以上。
機器人通過Eureka學會了轉筆、打開櫃子、拋接球(注:這些機械手指上下翻飛的場景,暫時僅限於虛擬環境)
人形機器人通過Eureka學習跑步步態
英偉達這項研究由其與賓夕法尼亞大學、加州理工學院、德州大學奧斯汀分校的研究人員合作完成。目前該項目完全開源。
在機器人領域,有一個“莫拉維克悖論”——人類所獨有的高階智慧能力只需要非常少的計算能力,但無意識的技能和直覺(如辨識人臉、舉起鉛筆、在房間內走動、回答問題等能力)卻需要極大的運算能力,即越簡單的事情越難,越難的事情越簡單。
這也是爲什麼人類早已創造出打敗世界頂級棋手的AlphaGo,卻仍不能讓機器人擁有像兩三歲小孩一樣的感知力和行動力。
英偉達的最新成果展示了大模型在機器人精細化控製方面的作用,在英偉達的推動下,更智能的機器學習方式有望被迅速引入工業和消費應用領域。
▌Meta Habitat——人機交互直指具身智能
Meta的Habitat同樣爲訓練機器人而生。據介紹,Habitat 3.0是第一個支持在多樣化、逼真的室內環境中,就人機交互任務進行大規模訓練的模擬器。
具體來看,Habitat 3.0可以利用紅外捕捉系統精心構建一個虛擬環境,如辦公空間、住宅和倉庫等,其中物體的形狀和大小完全複製現實世界,該工具還可在外貌和姿勢上對人類進行真實的模擬,支持從簡單(如行走和揮手)到複雜(如與物體交互)等各種類型的動作,還可模擬多種真實的社交場景。
虛擬環境中的人形化身既可由學習到的策略控製,也可由真人通過鍵盤、鼠標以及VR頭顯等進行控製。網上已經有人期待在Meta Quest VR中體驗Habitat 3.0了。
Meta的目的很明確——通過Habitat 3.0,讓AI智能體在真實世界和人類互動。
值得注意的是,與真實世界進行交互正是實現具身智能的基礎,正如Meta的AI研究部門(FAIR)所說,Habitat 3.0等新產品的發佈代表了他們在具身智能方面的進步。
FAIR表示,Habitat 3.0將把機器人AI代理的學習時間從幾個月甚至幾年縮短到幾天。它還能在安全的模擬環境中更快速地測試新模型,不會有任何風險。
在推出Habitat 3.0的同時,Meta還宣佈發佈Habitat合成場景數據集(Habitat Synthetic Scenes Dataset),這是一個由藝術家撰寫的三維數據集,可用於訓練人工智能導航代理;同時還發布了Home Robot,這是一個機器人助手軟硬件平台,可在模擬和真實環境中使用。
英偉達深耕運動控製,Meta注重交互能力,這兩大能力正是機器人進入千家萬戶的前提。
華爲“天才少年”稚暉君離開華爲後奔赴機器人創業,他曾在其機器人產品首秀上引用一個網絡段子:我們想讓AI做的事,是做飯、打掃房間、洗衣服、扔垃圾,然而它們實際在做的事,是聊天、繪畫、寫作、作曲、打遊戲……
工業機器人已經愈發普及的當下,如何讓機器人成爲普通家庭的助手、日常生活中的夥伴,已經成爲新的科技熱點。
一個包攬家務活、零碎事的家用機器人,距離我們還有多遠呢?
編輯/Somer