天天看點

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

作者:第一賽馬網
ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

在一個有秩序的領域,大模型也還要再等一等。

作者丨賴文昕

編輯丨陳彩娴

過去一周(5.13-5.17),國際頂級機器人學術會議 ICRA(IEEE International Conference on Robotics and Automation)在日本橫濱舉辦吸引了全球機器人領域的研究者、企業及學生,共同探讨機器人領域最新的科學進展和産業成果。

今年 ICRA 大會的主題設定為「CONNECT+」。

大會最終截稿日期是 2023 年的 10 月 21 日,收到 3937 篇論文,與去年的 3125 篇相比,送出的論文數量漲了約 25.88%;經過一個月稽核,最終接收 1765 篇論文,論文接收率為 45%,比去年略漲 2%,論文主題覆寫了如雙足機器人、人體檢測和跟蹤、人機互動、機器人學習、安全和監控機器人系統、3D重建、無人機系統、人工智能、農業自動化、行為樹和大資料分析等等領域。

除論文數量的顯著增加外,本屆 ICRA 還有 119 家企業參與展會,吸引了美國亞馬遜、波士頓動力,德國庫卡,日本本田研究所,以及中國宇樹科技、非夕科技、逐際動力、艾歐智能、求之科技、方舟無限等等一衆機器人團隊的參會。

換言之,ICRA 2024 不僅展現了學術界的深度交流,更象征着全球工業領域機器人團隊之間的一場巅峰對決。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

在 ICRA 2024 的展會現場,參會者可以看到這樣的奇觀:

機器狗、輪式機器人、雙足機器人等等一衆「機器生命」在會場「自由走動」,參會者們聚集在它們身邊,俨然一場賽博朋克版的迪士尼花車巡遊。

展會中大部分企業都選擇展示 live demo,且與往屆相比,demo 品質越來越高。

比如,逐際動力這款雙足機器人 P1,把在森林裡怎麼打都不倒的經典場景,在 ICRA 2024 現場再次重制。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

「若幹年前機器人會議上的機器人都隻能打個招呼或者站着不動,這次出現的機器狗都能動、還能踹,說明魯棒性非常高。」清華大學交叉資訊學院助理教授、具身智能實驗室主任及星海圖的聯創許華哲告訴 AI 科技評論。

此外,人形機器人也成為 ICRA 的亮點,如中國企業宇樹科技在大會期間釋出的 9.9 萬人形機器人引起了國内外參會者的熱烈讨論。不難看出,人形機器人成為機器人領域的一個新興方向,尤其在大模型風潮下與具身智能一同崛起。

一個趨勢正在發生:ICRA 上關于機器人的内容已經從以傳統的控制為主,到關注機器人的學習、操作等。國内外的機器人研究領域都在關注同一個問題:如何讓機器人更智能?

但與此同時,AI 科技評論也關注到,雖然大模型落地端側(如手機、機器人)是過去一年 AGI 讨論中的重要主題之一,ICRA 2024 大會現場的「大模型蹤影」卻寥寥無幾。一方面,這是因為機器人的行業特點,「有自己的節奏」;另一方面,ICRA 聚焦在學術探讨上,大模型在論文演講中的比重遠遠超過展區成果展示。

1

中國機器人企業正在崛起

邁入2024年後,人形機器人領域頻頻傳出重大進展:

特斯拉釋出了更新版的擎天柱機器人行走視訊,其行走的穩定性和自信心态均有顯著提高,尤其在轉彎時的表現也相當出色;

人形機器人初創公司 FigureAI 宣布獲得了包括亞馬遜創始人貝索斯、英偉達、微軟以及 OpenAI 在内的投資,總額達6.75億美元;

英偉達于3月19日舉辦的2024年度GTC大會上,展出25款人形和機械臂機器人。

在 ICRA 2024 的機器人方陣中,最炫酷吸睛的絕對是與人類最相似的人形機器人。

值得關注的是,這次參會的雙足人形機器人企業主要是中國公司。

最受矚目的産品之一是宇樹科技的 G1 人形機器人。G1 以最低9.9萬元的售價,在機器人業内扔下一枚超高成本效益的炸彈。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

與之相比,特斯拉的擎天柱機器人給出的目标價位為2.5萬美元,折合人民币約18萬元。

傅立葉智能帶來的通用人形機器人 GR-1 高165厘米,重55公斤,最高行走速度為每小時5公裡。使用電動執行器的 GR-1 本體擁有40個自由度,可承受近50公斤的重量。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

樂聚機器人推出的「誇父(KUAVO)」人形機器人則是一款全尺寸高動态雙足仿人形機器人,最大行走速度可達5km/h,跳躍高度可達20cm。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

「國内公司在硬體方面整體上優于國外,成本效益較高,這是得益于國内的供應鍊優勢。」方舟無限創始人張鑫亮向 AI 科技評論分析中國企業崛起的原因。另外,中國公司還展出了很多機器人零部件和整體解決方案。

那為什麼人形機器人會成為 ICRA 2024 的一大焦點呢?

實際上,電機和機械結構設計已發展多年,硬體早已不是問題。但在沒有大模型和 AI 的年代,機器人隻能進行簡單的動作但無法做出智能決策,要應用傳統視覺技術,一個機械臂就足夠了。

是以,過去人形機器人可能沒有太大的意義,僅僅是硬體産品并沒有實際應用。

随着 AI 技術的發展,機器人的能力上限不斷被突破。科研和商業探索的深入,也加速了人形機器人時代的到來,使得開發這一形态的産品變得有意義。

「大模型讓機器人可以不隻是簡單動一動,而是有希望做一些智能決策,(以人形)收拾桌面或參與工廠工作。」張鑫亮說。

不難發現,人形機器人是 ICRA 2024 當時無愧的焦點,但從實用性角度出發,其實際場景應用及商業落地,卻一直備受争議。

「展會上的人形機器人硬體沒問題,能動能走,但在智能化層面來講,離真的智能化機器人很遠。」地平線機器人事業部生态負責人胡春旭告訴 AI 科技評論。

特别是對于雙足人形機器人而言,腿上每個關節都需要電機,機身需承受高負載,這使得整體成本變得十分昂貴。

另外,雙足行走的控制算法開發難度大,需要大量時間進行疊代。即使上半身的控制算法已經完成,腿部的控制算法也無法簡單地遷移過來。

「為了滿足科研使用者在雙足運控算法上越來越強的需求,我們先對點式雙足機器人 P1 進行了産品化,這個獨特的形态,讓大家不需要一上來就做全尺寸人形、幾十個自由度的複雜算法研發,并配備豐富的二開接口和服務。」張力介紹到 P1 是逐際動力如何賦能人形機器人研發的定位。

出于以上種種考慮,本次參會的部分日本和歐洲公司也沒有涉足這一領域。

清華系的星海圖目前同樣也沒有開展腿部機器人項目的計劃。

聯創許華哲告訴 AI 科技評論,人形機器人在算法上很有趣,但需要投入大量的時間和精力。

「如果真正想将機器人技術應用到實際場景中,需要能快速産生效益和能力。」他分享道。

本次選擇通過日本代理商參會的明星公司波士頓動力也曾困于找不到盈利模式的難題。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

兩周前,波士頓動力的 CEO Robert Playter 來清華交流,告訴許華哲一定要找到賺錢的方法,否則公司就會被不停買賣。

不過,雙足人形機器人的産品市場契合度(PMF)其實并不低。

據參會者們分享,目前專注于足式人形機器人的公司主要面向科研市場,因為它們外形酷似人類,全球大量高校實驗室對此非常感興趣,清華大學就購買了許多人形機器人進行研究。

但若想讓機器人技術落地到工廠、家庭或超市等場景,就需要考慮更廣泛的商業化途徑。兼顧大型市場還是隻專注于其中一個領域,這取決于機器人公司的戰略選擇和目标市場的差異。

2

具身智能「剛剛」開始

去年,大模型的成功展示了深度學習具有規模效應,即隻要有足夠優秀的模型和海量資料,其潛力遠超過以往,也促使學術界與産業界對實作真正的通用人工智能(AGI)燃起了希望。

在大模型熱潮的影響下,一批機器人或者說是具身智能企業如雨後春筍般創立,希望能夠開發出能與實體世界進行互動的智能機器人,完成這個極具挑戰性的任務。

「大模型技術的爆發與硬體成本的降低表明了軟硬體技術都已走向成熟。」許華哲告訴 AI 科技評論,「過去創業者們常說 move bits not boxes,意指改變數字世界比改變實體世界要容易得多。雖然現在的技術尚未完全成熟到可以解決所有問題,但已足以讓人看到解決問題的希望,今年已到達一個成熟的轉折點,是以吸引了衆多公司投身于具身智能領域。」

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

在 ICRA 2024 的展會現場,「具身智能」成為了每位參會者熱議的話題。

地平線機器人事業部生态負責人胡春旭向 AI 科技評論分享了自己的觀察:「現在隻要涉及機器人與環境互動,與 AI 結合,都要說具身智能,就跟前兩年大家都在說人工智能是一樣的。」

「無論是科學家、創業者還是學生,大家都在讨論具身智能。」聯合創始人兼COO張力也感歎,具身智能的興起是他本次參會所感受到最顯著的趨勢,「通用機器人是一個在技術和商業化落地都還沒有共識的賽道,但是在這次全球學者和機器人企業聚首一堂的活動上,我能感受到大家逐漸從沒有共識,到開始進行收斂,這是一個非常好的現象。」

與傳統機器人公司相比,「新生代」的具身智能企業最大的差別在于是否采用了人工智能技術。

傳統機器人通常被設計來精确地完成特定任務,如工廠零件分揀機器人或家用掃地機器人,雖各有其功能,但其能力相對有限,内部預設的智能算法較為簡單。

新一代機器人的目标則更加通用以及「類人」,比如在家中充當保姆,在工廠中扮演勞工,靈活響應各種需求。

「比如優必選更強調自身運動,非夕科技強調力控,展會上展示了控制盤子上的球,這些更多展現了機器人本身的運動能力跟對外界的感覺、控制能力。」胡春旭認為,「現在的公司講具身智能,關注重心不是機器人自身的運動能力,更多的是如何跟外界互動,通過視覺識别外部環境後做抓取、放置等靈活的對外互動工作。」

艾歐智能便參與 ICRA 2024 最具有代表性的中國具身智能企業之一,将 AI 技術與機器人領域牢牢融合在一起。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

創始成員都來自騰訊、小鵬團隊,艾歐智能通過具身資料采集,建構不同應用場景下的基礎資料集,為全球人工智能和機器人研發企業和研究機構提供基礎場景資料和驗證方案。

傳統動作捕捉通常使用光筆或攝像頭,限制了活動範圍,而艾歐智能則采用慣性捕捉方式,不受地形限制,可自由采集資料,更适合日常生活資料采集,在采集資料的同時還不限制人的行動。

而且,除了動作資料外,艾歐智能還采集視覺、觸覺和語言資訊等多模态資料。

具體而言,艾歐智能使用安裝在頭盔上的多個相機來擷取視覺資訊;通過自研資料手套與資料鞋底擷取觸覺資訊;用麥克風記錄語言資訊;最後混合所有資訊進行機器人訓練。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

艾歐智能告訴 AI 科技評論,目前他們開源的資料集包含50萬條劇本式采集資料以及數百個小時的自由采集資料,涉及幾十種技能和數百種被操作對象,全部免費提供給社群供科研使用。

地平線機器人同樣也是具身智能企業的代表。

去年年末,地平線分拆了 AIoT(物聯網)團隊,成立地瓜機器人并對外融資,其定位是提供消費級機器人計算解決方案。

目前,地平線機器人正在研發着支援大模型部署的高性能機器人晶片。

在地平線機器人的事業部生态負責人胡春旭看來,具身智能意味着機器人一定會結合多模态大模型去了解周邊環境。

「過去機器人的智能化比較差,但這兩年機器人的運動能力已經被解決的相對比較好,現在大家都在關注智能化。」胡春旭向 AI 科技評論解釋,「提高機器人的智能化水準一定是基于多模态大模型的基座去做,目前雖然沒有很明确的落地案例,但這一定是未來趨勢,也是我們重點探索和布局的方向。」

胡春旭稱,「大模型晶片在機器人廠商中是剛需,關注的企業很多,但現在關鍵點在于,一是怎麼把大模型調教後放在晶片裡跑,二是跑下來後,怎麼能很好調試服務于場景,讓原來的那些基本算法變得更好用。對于我們來講,現在可能重點放在前面,讓大模型在我們晶片跑得更好,說實話本身上限就是硬體晶片的實際能力、實體水準。」

方舟無限同樣是一家新興具身智能企業,是全球首家具身智能領域量産資料采集方案供應商。

「上一代機器人主要依靠視覺智能,語言智能尚未被整合進機器人系統中,人類大腦決策大部分是雙手執行,在機器人中可能是視覺智能和語言智能的結合,是以說 GPT 模型可能是推動具身智能發展的一個關鍵因素。」創始人張鑫亮談道,「我們之前了解的人形機器人、四足機器人等更多地偏向于控制上的優勢,具身智能機器人追求的是讓機器人的大腦更完善,這也是我們的目标。」

同為具身智能企業的逐際動力于2023年釋出了其首款人形機器人CL-1,并于今年上半年接連公開該款機器人的遙操作及跑步等技術新進展。

「實體世界是圍繞人類設計的,人形機器人以類人的形态,更具有通用性和泛化性,将會成為未來落地應用的最佳載體。」張力談道。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

在 ICRA 2024 上,參會者們聊得火熱,也出現了如艾歐智能、地平線、逐際動力與方舟無限這類新興具身智能企業,但具身智能作為一個新熱點,距離商業落地仍有不短的距離,核心技術大多掌握在高校手中,是以許多學者也會參與創業。

「與再次成為熱點的自動駕駛技術不同,具身智能尚未真正成熟并能實作量産,是以熱點更多地集中在學術界而非工業界。」橫跨學術與産業的許華哲解釋道。

3

ICRA洞察:LLM罕見,

電驅主導,學習與操縱成新範式

在端側大模型中,盡管底層的 LLM 邏輯均為 MOE(混合專家模型),但在手機端和機器人端的落地路徑卻十分不同。

兩者的應用場景與需求都不同,機器人需要自主移動,是以一定會結合多模态大模型去對周邊環境做了解和互動(如怎麼穿過椅子去抓取桌面上的物體),與不可能自己跟環境互動的手機端相比,機器人加大模型的組合更強調「具身」智能。

然而,與大模型人聲鼎沸的現狀不同,在 ICRA 2024中,LLM 在機器人領域的應用十分罕見。

張鑫亮發現,ICRA 2024 會議更側重于機器人控制等硬體領域,軟硬體結合的應用在展會上較為罕見。

「除了我們的産品外,我幾乎找不到第二家在自主操作方面使用大模型的公司,除了少數做模仿學習和 Aloha 操作的公司。有的公司使用硬體機械臂進行工業抓取,但依然屬于傳統視覺,結合模型做抓取的公司在展會上并不多見,要麼隻專注于模型端,要麼隻專注于硬體端,與會者中似乎隻有我們有同時結合軟硬體的苗頭。」

*Aloha 是2023年由斯坦福大學等機構推出的一個用于雙機械手遠端操作的低成本開源硬體系統,可以遠端操作并完成組裝鍊條、托舉乒乓球等多種任務。

LLM 在機器人蹤迹難尋的原因之一,便是目前負責軟體與硬體研發的團隊并未實作融合。

相反,兩組人員分别在兩個領域進行研發。大模型團隊專注于模型開發,從軟體層面着手,待軟體完善後再着手硬體的開發。

而另一些人則先從硬體開始,再整合大模型。兩個方向分别涵蓋的決策領域太多,是以尚未有團隊能夠同時兼顧兩者。

「不過現在專注于硬體并向大模型過渡的團隊,以及僅專注于軟體開發的團隊,都在逐漸推進融合的過程。在這一背景下,與大模型最緊密相關的機器人領域就是具身智能。」張鑫亮解釋道。

機器人産業本身尚未形成一個穩定且盈利的商業模式,同樣是 LLM 尚未在機器人領域廣泛展開的原因之一。

胡春旭向 AI 科技評論講道,「從商業層面來講,大模型公司肯定會評估機器人企業的商業模式落地,但機器人行業距離大規模批量化的落地,還有很長的路要走。」

不過,在 ICRA 2024上,也有觀點認為:機器人目前的研究重點更多集中在解決基礎層面的功能性問題(low level issues),而非高層次的認知或決策問題(high level issues),後者在某種程度上已經通過大模型得到了解決。

例如,即使大模型能夠規劃出做飯的步驟,但如果機器人連冰箱門都無法打開,那麼這些進階規劃便無法實施。

許華哲告訴 AI 科技評論,「大模型并非目前機器人技術發展的瓶頸,其當務之急是解決實體互動和操作的基本問題,為未來更進階的內建和應用打下基礎。随着這些基礎問題的逐漸解決,大模型在機器人領域的內建和應用将變得更加可行和有效。」

ICRA 2024 展現出機器人領域正在經曆一場通向具身智能的範式轉變,其核心正是學習(Learning)方法和操縱(manipulation)能力的提升。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

ICRA 2024抓取與操縱比賽

衆多研究人員和公司正在從傳統的機器人方法轉向具身智能以及基于學習的方法。同時,集中于機器人操縱能力的工作也越來越多。

與後空翻等酷炫動作不同,如開瓶、拾取、觸摸等操縱能力可以直接滿足人們生活實際需求,是以也越來越受機器人業内人士的重視。

例如,波士頓動力近期推出兩款新型機器人,一款是碼垛機器人 Stretch,帶有吸盤能分揀物體;一款是人形機器人 Atlas。他們發現,傳統的機器控制無法解決操縱問題,「學習」才是新的可行方向。

最後,随着電機的快速發展,本屆 ICRA 上的電驅機器人以代替傳統的液壓機器人成為主力軍,業内普遍認為,換上電機後,機器人的爆發力與驅動力會更強。

4

寫在最後

不少參會者向 AI 科技評論表示,本屆 ICRA 并沒有帶來太多超出預期的驚喜。

具體而言,盡管具身智能的熱度飙升,但代表「智能」與「大腦」的大模型并未在行業中得到廣泛應用。

通往 AGI 的路何時能從數字世界逐漸擴充到實體世界?大模型的出現能否讓機器人真的擁有「智能」?

ICRA 2024 尚未見分曉,那便讓我們拭目以待。

ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識
ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識
ICRA 2024:「具身智能」熱度飙升,「學習」成機器人行業共識

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!

公衆号轉載請先在「AI科技評論」背景留言取得授權,轉載時需标注來源并插入本公衆号名片。

繼續閱讀