借助機(jī)器人的本體感覺對(duì)足式運(yùn)動(dòng)進(jìn)行研究已有數(shù)十年。在以往的研究手段中,研究人員往往采用基于模型的方法開發(fā)神經(jīng)網(wǎng)絡(luò)控制器。但是,這類方法無法在那些現(xiàn)實(shí)世界里沒有見過的環(huán)境中得到應(yīng)用。
近年來,為了獲得更好的泛化性和魯棒性,研究者們開始采用無模型強(qiáng)化學(xué)習(xí),在模擬中訓(xùn)練控制器,然后將學(xué)習(xí)到的策略直接轉(zhuǎn)移到真實(shí)的機(jī)器人上。
那么,如何在無需遙控器操控的條件下,讓四足機(jī)器人實(shí)現(xiàn)在復(fù)雜地形上自由流暢地行走呢?
近期,來自美國(guó)加州大學(xué)圣地亞哥分校和麻省理工學(xué)院的研究團(tuán)隊(duì),開發(fā)了一個(gè)可以提高機(jī)器人 3D 感知能力的模型,能夠支配四足機(jī)器人在各種困難地形場(chǎng)景下完成自動(dòng)化行走,比如爬樓梯、踩石頭、在樹林中走路等。
四足機(jī)器人在樹林中走路(來源:Github)
該四足機(jī)器人的額頭上裝有前置的深度攝像頭,該攝像頭向下傾斜的角度,可以幫助該機(jī)器人前面的兩足,根據(jù)所看到的前方場(chǎng)景和腳下地形做出正確的行動(dòng)決策。但其后面的兩足必須先記住前面看過的內(nèi)容,才能確保在經(jīng)過時(shí)踩在正確的位置上。
所以,這中間存在一個(gè)重要的問題,即需要一個(gè)短期的 3D 環(huán)境記憶體,能夠使得機(jī)器人的四足都對(duì)三維環(huán)境有良好的感知和模擬。
為此,該團(tuán)隊(duì)構(gòu)建了一種神經(jīng)體積記憶(Neural Volumetric Memory,NVM)架構(gòu),可以先借助自監(jiān)督方法對(duì)視頻幀中的三維特征進(jìn)行學(xué)習(xí),再用幾何變換把這些三維特征投影到同一個(gè)空間下面,最后通過模型將所有的特征信息融合在一起,讓機(jī)器人對(duì)它所處的 3D 環(huán)境建立起短期記憶。
其中,需要說明的是,將上述帶有特征的全部視覺信息綜合在一起,可以幫助四足機(jī)器人記住其看到的內(nèi)容,以及足部之前做過的動(dòng)作,并利用這些記憶指導(dǎo)它下一步行動(dòng)。這也表明,NVM 能為機(jī)器人執(zhí)行決策提供可靠的 3D 結(jié)構(gòu)信息,并為足式機(jī)器人利用視覺進(jìn)行觀察開辟新的可能性。
2023 年 3 月,相關(guān)論文以《用于視覺運(yùn)動(dòng)控制的神經(jīng)體積記憶》(Neural Volumetric Memory for Visual Locomotion Control)為題發(fā)表在CVPR上,并被選為Highlight論文。