天天看點

機器人行業進入下沉階段,谷歌釋出低成本機器人學習平台 | 一周最火AI學術

機器人行業進入下沉階段,谷歌釋出低成本機器人學習平台 | 一周最火AI學術

大資料文摘專欄作品

作者:Christopher Dossman

編譯:Junefish、雲舟

嗚啦啦啦啦啦啦啦大家好,拖更的AIScholar Weekly欄目又和大家見面啦!

AI ScholarWeekly是AI領域的學術專欄,緻力于為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每周AI學術的前沿資訊。

每周更新,做AI科研,每周從這一篇開始就夠啦!

本周關鍵詞:Deep Fake、神經網絡、姿态估計

本周最佳學術研究

低成本機器人學習的基準

随着機器人行業的不斷發展,對于研究人員而言,不斷努力實作低成本機器人開發和解決方案至關重要。目前有很多相關研究正在進行中,例如最近的MuSHR賽車項目。

相關連結:

https://medium.com/ai%C2%B3-theory-practice-business/a-low-cost-open-source-robotic-racecar-for-education-and-research-91a896557f25

關于機器人技術的研究仍然非常活躍,為了在現實世界中進行強化學習,研究人員已經釋出了一個低成本的機器人開源平台。

機器人行業進入下沉階段,谷歌釋出低成本機器人學習平台 | 一周最火AI學術

為了加速不同領域的強化學習研究,這個新的機器人平台引入了兩個機器人。其中一個機器人 D’Claw是三指機器人,該設計有助于機器人學習如何靈巧地處理任務;另一個機器人D’Kitty是四足機器人,其設計便于學習靈活的腿部運動任務。

目前的機器人領域已有很多振奮人心的進步和預測,但未來将有更多令人歎為觀止的發展,其中之一就是低成本的訓練和測試環境。

ROBEL平台就是緻力于上述這一點。在巨大的成本優勢下,它特别的子產品化使其非常适合可擴充實驗。ROBEL平台不僅提供了便宜的解決方案,還易于維護,為從頭開始的硬體增強學習保駕護航。

代碼,檔案和結果:

https://sites.google.com/view/roboticsbenchmarks/

閱讀全文:

https://ai.googleblog.com/2019/10/robel-robotics-benchmarks-for-learning.html

YOLO Nano:對象檢測的新地标

随着人們對設計和開發更好的物體檢測(尤其是移動技術)的興趣日益濃厚,研究人員推出了YOLO Nano,這是一種高度緊湊的用于物體檢測的深度卷積神經網絡。

機器人行業進入下沉階段,谷歌釋出低成本機器人學習平台 | 一周最火AI學術

為實作這一目标,研究人員采用了一個人機協作的設計政策,該政策包括了基于規則的網絡設計原型階段和機器驅動的設計探索階段。YOLO Nano具有約4.0MB的模型大小,需要4.57B的推理運算操作,在VOC2007資料集上達到約69.1%的mAP。

研究人員在 PASCAL VOC 資料集上測試了YOLO Nano的模型大小、物體檢測精度和計算成本,結果顯示,YOLO Nano 在嵌入式物體檢測中實作了強大的推理速度和電源效率。

視訊監控,IoT,無人駕駛飛機,自動駕駛等應用需要本地嵌入式處理系統,YOLO Nano為此邁出了重要的一步。

相關連結:

https://arxiv.org/abs/1910.01271v1

TorchBeast釋出,懂Python就能做強化學習

這篇文章中,Facebook AI,牛津大學,帝國理工學院和倫敦大學學院的研究人員描述了TorchBeast的設計原理和實作。TorchBeast是用于強化學習研究的平台,它實作了流行的IMPALA代理,并且具有MonoBeast和PolyBeast兩個變體。

除了Python和PyTorch之外,MonoBeast不需要其他主要依賴項。PolyBeast則可以實作一些進階特性,它允許跨機器訓練,也是以更難安裝。MonoBeast變體的主要目的是使PolyBeast的入門變得容易。

研究人員堅信,TorchBeast讓我們離強化學習研究無需靜态架構或複雜庫的目标又近了一步。

通過用簡單易讀的PyTorch來實作IMPALA,TorchBeast可以促進公平的競争環境,幫助使用者從零開始建立易于使用的,可規模化且快速的設計。兩種版本都使用多程序來解決Python多線程的技術限制,最重要的是,它們使研究人員無需Python和PyTorch之外的任何程式設計知識,也能夠進行可擴充的強化學習研究。

TorchBeast是根據Apache 2.0許可以開源軟體包的形式釋出的:

https://github.com/facebookresearch/torchbeast

閱讀原文:

https://arxiv.org/abs/1910.03552v1

使用抽象渲染比較優化6D對象姿态預測

最近一項研究将渲染和比較架構應用在了單目6D姿态估計上,特别地,在初始姿态猜測可用的情況下,這一架構可以用于姿态優化。

在他們提出的對于二次渲染效果保持不變的抽象描述空間中,通過最小化渲染圖像和觀測圖像之間的像素級差異,可以從最新的姿勢估計方法中提升對6D姿勢的預測。

機器人行業進入下沉階段,谷歌釋出低成本機器人學習平台 | 一周最火AI學術

進一步地,他們像許多工業和機器人應用一樣假設了對象網格的可用性。這一方法已經在YCB-Video資料集上進行了評估,并表現出了很好的效果,同時也顯示出對正确的物體姿态估計有很大的潛力。

該方法在YCB-Video資料集上取得的良好效果,證明了該方法能夠在場景分析的背景下,對差分渲染的初始姿态估計進行穩健的細化。該方法也可與其他疊代求精過程相結合,進而有助于其對整體場景的了解。

研究人員表示,未來将會有許多在人類環境中工作的服務機器人,它們将使用為人類而設計的工具和工業零件進行活動,這樣的機器人能夠從精确的6D姿态估計中受益匪淺。

研究人員還計劃進一步提高其性能,并在未來研究其他應用,包括類級模型的非剛性注冊等。

原文:

Refining 6D Object Pose Predictions

人體姿勢估計的可學習三角測量

三星人工智能中心和莫斯科斯科爾科沃科技研究所的研究人員提出了兩種基于可學習三角剖分的多視點三維人體姿态估計新方法。第一個解決方案結合了基本的微分代數三角剖分,和從輸入圖像估計的置信權。第二種方法則是基于二維骨架特征映射的人體資料聚合方法。此後,三維卷積通過生成最終三維關節的熱力圖對聚集體積進行細化,并允許預先對人體姿勢進行模組化。

機器人行業進入下沉階段,谷歌釋出低成本機器人學習平台 | 一周最火AI學術

這一方法極大地減少了在CMU Panoptic資料集上實作高精度和生成平滑姿态序列所需的視圖數量,并且無需對時間進行處理,這證明了改進資料集真值标注的潛力。

這一方法證明了解決方案在資料集之間的可傳遞性,并在Human3.6M資料集上實作了最新的性能,Human3.6M資料集是目前最大的3D人體姿态基準之一,有許多針對單目和多視圖設定的報告結果。

該方法具有學習人體姿态的能力,對遮擋和局部視角具有較強的魯棒性。同時,該方法能夠明确地将錄影機參數作為獨立的輸入。體積三角形也被推廣到了單眼圖像,如果一個人的大緻位置是已知的,則産生的結果會非常接近最優。

但是,由于其隻支援預測場景中的一個個體,并且其體積三角剖分方法依賴于代數三角剖分的預測,該方法在某些方面也會受到限制。不過,研究者在論文中提供了解決這些局限性的方法。

網站:

https://saic-violet.github.io/learnable-triangulation/

原文:

https://arxiv.org/abs/1905.05754

其他爆款論文

人工智能社群如何開發出對人類有價值的系統:

https://arxiv.org/abs/1910.03515v1

Midi Miner釋出,基于python計算音調張力并對不同的音軌進行分類:

https://arxiv.org/abs/1910.02049

深度學習檢測虛假新聞:

https://arxiv.org/abs/1910.03496

Visual Domain Adaptation Challenge 2019,源代碼和預訓練模型:

https://arxiv.org/abs/1910.03548v1

根據公司的文案内容和方式預測消費者在Facebook上的參與度:

https://arxiv.org/abs/1909.09914

資料集

一種新的深度僞證資料集及檢測算法:

http://www.cs.albany.edu/~lsw/celeb-deepfakeforensics.html

TabFact:基于表進行事實驗證的大型資料集:

https://github.com/wenhuchen/Table-Fact-Checking

用于合成動作和時間推理的診斷資料集:

https://rohitgirdhar.github.io/CATER/

由真實場景視訊組成的群組修複資料集:

https://arxiv.org/pdf/1910.02618v2.pdf

AI大事件

Alexa是怎麼學習新語言的?

https://venturebeat.com/2019/10/11/amazon-explains-how-alexa-learns-new-languages/

Facebook釋出Captum,基于深度學習架構PyTorch,解釋神經網絡如何做出決策:

https://venturebeat.com/2019/10/10/facebooks-captum-brings-explainability-to-machine-learning/

超過40%的美國消費者希望他們的醫生使用人工智能進行更好的診斷:

https://www.forbes.com/sites/gilpress/2019/10/10/ai-stats-news-45-of-us-consumers-want-their-physician-to-use-ai-for-better-diagnosis/#255774edc9d4

神經網絡是如何透過牆壁看到我們在做什麼的:

https://news.yahoo.com/neural-networks-see-were-doing-205300324.html

Pytorch 1.3釋出,內建量化和并支援TPU:

https://venturebeat.com/2019/10/10/pytorch-1-3-comes-with-speed-gains-from-quantization-and-tpu-support/https://venturebeat.com/2019/10/10/pytorch-1-3-comes-with-speed-gains-from-quantization-and-tpu-support/