新聞速遞｜Google機器人團隊獲ICRA 2023 機器人學習方向最佳論文獎

1、Google機器人團隊獲ICRA 2023 機器人學習方向最佳論文獎：機器人實體控制的大語言模型程式

這篇論文主要讨論了大型語言模型（LLM）在機器人控制方面的應用。作者們指出，盡管LLM在了解和生成自然語言方面表現出色，但其在實際應用中，如機器人控制等領域的應用仍然有限。是以，他們提出了一種新的方法，即使用LLM編寫代碼來控制機器人的行為。

他們發現，編寫代碼的LLM在規劃、政策邏輯和控制方面表現出色。這些模型可以被重新用于編寫機器人政策代碼，給出自然語言指令（格式化為注釋）。政策代碼可以表達處理感覺輸出（例如，開放詞彙對象檢測器）和參數化控制原語API的函數或回報循環。當提供了幾個示例語言指令和相應的政策代碼（通過少量提示），LLM可以接收新的指令并自主重新組合API調用以生成新的政策代碼。此外，編寫代碼的模型可以表達各種算術運算以及基于語言的回報循環。他們不僅可以推廣到新的指令，而且由于在數十億行代碼和注釋上進行了訓練，也可以根據上下文為模糊的描述（例如，“更快”和“向左”）規定精确的值，以引出行為常識。

機器人智能AI&ROBOT

方法部分，作者們詳細介紹了如何使用大型語言模型（LLM）生成代碼作為政策。他們的方法主要包括以下幾個步驟：

1.定義語言模型程式（LMP）：作者們首先定義了語言模型程式（LMP）的概念。LMP是由語言模型生成并在系統上執行的任何程式。他們的工作主要研究了一類名為“代碼作為政策”的LMP，這類LMP将語言指令映射到代碼片段，這些代碼片段可以（i）響應感覺輸入（即來自傳感器或傳感器上層的子產品），（ii）參數化控制原語API，并（iii）直接在機器人上編譯和執行。

2.生成LMP：作者們展示了如何使用LLM生成LMP。他們提供了一些示例，如何将自然語言指令（格式化為注釋）轉化為代碼。例如，他們展示了如何使用LLM編寫代碼來控制機器人的行為，如移動物體，識别物體，以及執行更複雜的任務。

3.執行LMP：為了執行LMP，他們首先檢查它是否安全運作，確定沒有導入語句，沒有以__開頭的特殊變量，也沒有對exec和eval的調用。然後，他們使用Python的exec函數，将代碼作為輸入字元串，并使用兩個字典形成該代碼執行的範圍：（i）全局變量，包含生成的代碼可能調用的所有API，和（ii）局部變量，一個将在exec期間定義的變量和新函數填充的空字典。如果LMP預計會傳回一個值，他們會在exec完成後從局部變量中擷取它。

4.提示生成LMP：生成LMP的提示包含兩個元素：（i）提示，例如導入語句，告訴LLM哪些API可用以及如何使用這些API；（ii）示例，這些是指令到代碼對，展示了如何将自然語言指令轉化為代碼。這些可能包括執行算術運算，調用其他API，以及程式設計語言的其他特性。

5.進階LMP：作者們還展示了如何使用LLM生成更複雜的代碼，如使用控制流（如if-else和循環語句）和嵌套函數調用。他們還展示了如何使用LLM生成函數以供未來使用，以及如何使用LLM遵循良好的抽象實踐，避免将所有代碼邏輯“扁平化”。

在這篇論文的實驗部分，作者們展示了如何使用大型語言模型（LLM）編寫代碼來控制機器人的行為。他們提供了一些示例，包括如何使用LLM編寫Python腳本，如何使用第三方庫進行複雜操作，以及如何使用第一方庫進行操作。他們還展示了如何使用LLM編寫更複雜的代碼，如使用控制流（如if-else和循環語句）和嵌套函數調用。

在實驗中，他們使用了一些具體的任務來展示他們的方法的效果。例如，他們展示了如何使用LLM編寫代碼來移動物體，如何識别物體，以及如何執行更複雜的任務。他們還展示了如何使用LLM生成函數以供未來使用，以及如何使用LLM遵循良好的抽象實踐，避免将所有代碼邏輯“扁平化”。

以下是一些具體的實驗示例：

1.他們展示了如何使用LLM編寫代碼來移動物體。例如，他們展示了如何使用LLM編寫代碼來移動一個名為“紅色塊”的物體。他們首先擷取該物體的位置，然後将其向右移動一定的距離。

2.他們展示了如何使用LLM編寫代碼來識别物體。例如，他們展示了如何使用LLM編寫代碼來識别一個名為“藍色塊”的物體。他們使用了一個開放詞彙的物體檢測器來完成這個任務。

3.他們展示了如何使用LLM編寫代碼來執行更複雜的任務。例如，他們展示了如何使用LLM編寫代碼來将一個名為“藍色塊”的物體放在一個名為“藍色碗”的物體上。

4.他們展示了如何使用LLM生成函數以供未來使用。例如，他們展示了如何使用LLM編寫代碼來定義一個名為“get_total”的函數，該函數接受一個名為“xs”的參數，并傳回其總和。

5.他們展示了如何使用LLM遵循良好的抽象實踐，避免将所有代碼邏輯“扁平化”。例如，他們展示了如何使用LLM編寫代碼來定義一個名為“get_objs_bigger_than_area_th”的函數，該函數接受兩個參數——一個名為“obj_names”的物體名清單和一個名為“bbox_area_th”的門檻值，然後傳回所有大于該門檻值的物體的名字。

這些實驗結果表明，LLM可以有效地用于編寫控制機器人行為的代碼，具有很高的實用性和廣泛的應用前景。

最後作者們總結了他們的研究成果，并對未來的研究方向進行了展望。他們認為，大型語言模型（LLM）在編寫代碼方面的能力為機器人控制提供了新的可能性。通過使用LLM，我們可以将自然語言指令轉化為機器人政策代碼，進而實作更複雜的機器人行為。此外，他們還指出，LLM不僅可以了解和生成自然語言，還可以通過使用"say(text)"作為一個可用的動作原語API，參與人機對話和問答。他們的研究結果表明，LLM可以有效地編寫Python程式，并能夠處理各種複雜的任務，如移動物體，識别物體，以及執行更複雜的任務。他們的方法不僅可以廣泛應用于機器人控制，還可以用于其他需要編寫代碼的領域。

文章來源：CAAI認知系統與資訊處理專委會

2、埃斯頓：向子公司埃斯頓機器人增資4.5億元

埃斯頓8月1日公告，公司拟使用自有資金4.5億元對全資子公司南京埃斯頓機器人工程有限公司進行增資，其中3億元計入注冊資本，1.5億元計入資本公積。

埃斯頓公告稱，公司計劃将持有的埃斯頓醫療10%的股權以2400萬元的價格轉讓給控股股東派雷斯特。轉讓後，公司仍持有埃斯頓醫療16.68%的股權。此次交易旨在優化公司資産結構，聚焦主業發展，預計對公司2024年業績産生積極影響，稅前利潤影響金額約1500萬元。

資料來源：埃斯頓公告

埃斯頓公司拟使用自有資金4.5億元對全資子公司埃斯頓機器人增資，其中3億元計入注冊資本，1.5億元計入資本公積。增資完成後，埃斯頓機器人的注冊資本将由1.5億元增加至4.5億元，公司仍持有其100%股權。

本次增資旨在提升子公司資本實力和營運能力，符合公司戰略發展規劃。增資事項在公司董事會審批權限範圍内，無需送出股東大會審議，不構成關聯交易或重大資産重組。

資料來源：埃斯頓公告

公告顯示，2023年度，埃斯頓機器人實作營業收入16.57億元，淨利潤為0.29億元；2024年第一季度（未經審計）實作營業收入4.00億元，淨利潤為0.11億元。

埃斯頓表示，本次向埃斯頓機器人增資，是為了進一步滿足公司及子公司的經營發展需要，提升其資本實力，降低資産負債率，做大做強機器人産業，符合公司的戰略發展規劃。

埃斯頓機器人成立于2011年，法定代表人為吳侃，經營範圍涵蓋：以機器人及工業機器人成套系統為主的相關産品（含FTL柔性生産線制造、垂直多關節工業機器人、焊接機器人及其焊接裝置裝置）、裝置和工程內建項目的研發、生産和銷售，并提供相關配套服務；自營和代理各類商品和技術的進出口業務（國家限定公司經營或禁止進出口的商品和技術除外）等。

文章來源：新浪财經、同花順7x24快訊、埃斯頓等

新聞速遞｜Google機器人團隊獲ICRA 2023 機器人學習方向最佳論文獎

繼續閱讀

【黨紀學習教育】為官公罪、私罪都不可有

學習貫徹黨的二十屆三中全會精神丨健全宏觀經濟治理體系

父母想讓初高中孩子主動去學習，記住這個溝通和應對原則，很好用

田靜發了兩孩子學習的作品！結果一切都是為了賣貨

武城縣學習貫徹黨的二十屆三中全會精神宣講進基層走進武城經濟開發區

學習行政處罰法第十七條

清華大學占股的人形機器人公司，拿了3億融資 | 融中投融資周報

主打一個學習陪伴！多親C23防沉迷學生手機體驗

可愛的貓咪手繪線稿，供臨摹學習

最新消息！10月20日下午4點前新聞摘要，8條國内今日要聞！

新聞報道也能這麼離譜？知情者吐血分享，網友看完直呼不可思議！

這兩天一個大學生朋友和我私下聊天，講述他和大學輔導員老師的故事[捂臉]他大三，女輔導員33歲已婚，兩地分居狀态。他和她因

新聞分析：“馬拉松熱”背後的經濟賬

特斯拉攜最新最“硬核”人形機器人亮相中國國際消費電子博覽會

掃地機器人跨界造車，追覓想做“第二個華為”？

同樣73歲，劉曉慶還有桃色新聞，張紀中還能再次當爹，生命力超強