與由岡田隆之教授領(lǐng)導(dǎo)的東北大學(xué)研究團隊合作,Socionext Inc .開發(fā)了一種新方法,可以減少SLAM(同步定位和測繪)所需的處理時間,這對于執(zhí)行自主控制的設(shè)備來說非常重要,時間僅為傳統(tǒng)技術(shù)所需時間的1/60。這種新方法使得在一些CPU性能有限、功耗有限的邊緣設(shè)備,如自動駕駛汽車、AGV (Automatic Guided Vehicle)、機器人、無人機等執(zhí)行自主控制的設(shè)備,以及AR (Augmented Reality,增強現(xiàn)實)眼鏡等設(shè)備的SoC中執(zhí)行高級SLAM處理成為可能。
這項研究工作已被ICCV(計算機視覺領(lǐng)域最負盛名的會議之一)接受為演講報告。這種新方法是在10月11日至17日在線舉行的ICCV 2021會議上推出的。
根據(jù)獲取物體周圍三維信息的傳感方法,SLAM可以分為兩種主要類型。一種是激光雷達(Light Detection and Ranging),利用激光測量距離。另一個是Visual SLAM,它使用相機圖像。視覺SLAM發(fā)展顯著,因為使用的攝像頭相對便宜,而且除了同時定位,這種方法還可以結(jié)合使用圖像識別的各種控制過程,因此可以期待很多應(yīng)用。
近年來,隨著深度學(xué)習(xí)的引入,圖像識別技術(shù)取得了顯著進展,深度學(xué)習(xí)的應(yīng)用成為視覺SLAM演進的重要因素。然而,基于特征點和攝像機方向的未知地標(biāo)三維信息的波束調(diào)整優(yōu)化是傳統(tǒng)方法的瓶頸。對于CPU處理能力有限的邊緣SoC設(shè)備,這將使實際處理變得困難。
為了應(yīng)對這一挑戰(zhàn),研究團隊提出了一種利用“圖網(wǎng)絡(luò)(GN)”[1](一種圖神經(jīng)網(wǎng)絡(luò))進行推理的近似計算方法。新方法包括從GN塊輸入的關(guān)鍵幀和地標(biāo)信息中推斷更新信息(圖2),并通過多棧GN結(jié)構(gòu)收斂到最終值(圖3)。與傳統(tǒng)的勒溫伯格-馬夸特方法的標(biāo)準光束像差相比,這使得推理過程需要更少的計算量。
研究團隊利用這種新的推理方法實現(xiàn)了Visual SLAM的綁定調(diào)整,并與廣泛使用的方法“G2O”進行了對比[2]。PC仿真結(jié)果表明,與g2o相比,新方法可將處理時間縮短至1/60。(圖4)
Socionext將從這項研究工作中積累經(jīng)驗,并將Visual SLAM技術(shù)確立為公司定制SoC解決方案的產(chǎn)品之一。該公司將為圖像識別領(lǐng)域的客戶系統(tǒng)(如工業(yè)設(shè)備和移動設(shè)備)提出創(chuàng)新的性能改進方案。此外,公司將繼續(xù)研究和開發(fā)新的推理方法,以提高處理效率,并將其應(yīng)用擴展到圖像識別以外的新客戶應(yīng)用。
關(guān)于反社會公司
Socionext Inc .是一家全球創(chuàng)新型企業(yè),業(yè)務(wù)涉及片上系統(tǒng)的設(shè)計、研發(fā)和銷售。公司聚焦消費、汽車、工業(yè)領(lǐng)域的世界先進技術(shù),在不斷推動多元化應(yīng)用發(fā)展的今天。Socionext融合了世界一流的專業(yè)知識、經(jīng)驗和豐富的IP產(chǎn)品組合,致力于為客戶提供高效的解決方案和客戶體驗。公司成立于2015年,總部位于日本橫濱,在日本、亞洲、美國和歐洲設(shè)有辦事處,領(lǐng)導(dǎo)產(chǎn)品開發(fā)和銷售。