研究人員尋找新的深度來訓(xùn)練無人機(jī)導(dǎo)航
時(shí)間: 2023-09-08 10:19:16
這段人體模型挑戰(zhàn)視頻,由弗吉尼亞州邁爾亨德森堡聯(lián)合基地的3d美國(guó)步兵團(tuán)(舊衛(wèi)隊(duì))錄制。谷歌的研究人員在人體模型挑戰(zhàn)的視頻上訓(xùn)練了一種算法,以從單個(gè)相機(jī)源確定深度。導(dǎo)航是一個(gè)篩選過程。就像昆蟲的復(fù)眼識(shí)別出它可以飛行的空間是什么和不是什么一樣,機(jī)器人上的傳感器不僅可以導(dǎo)航前方的路徑,還可以實(shí)時(shí)繪制出要避開的所有障礙物。今年發(fā)表的兩項(xiàng)研究,概述了如何訓(xùn)練機(jī)器人在充滿障礙的空間之間導(dǎo)航。具體來說,這些是關(guān)于在人群中移動(dòng)和在森林中移動(dòng)的研究。《無人駕駛飛行器在未知雜亂環(huán)境中的自主導(dǎo)航》著眼于不顧樹木在森林中飛行。CINESTAV、墨西哥國(guó)家理工學(xué)院研究與高級(jí)研究中心和英特爾實(shí)驗(yàn)室的研究人員創(chuàng)造了一種在陌生物體豐富的空間中快速飛行的方法。該框架使用深度傳感器的測(cè)量值來繪制距離上的視差。然后,第二種方法生成穿過該空間的路徑,同時(shí)考慮到傳感器看不到的限制。通過測(cè)量物體和繪制到設(shè)定目標(biāo)的路徑,框架的第三部分生成實(shí)際的移動(dòng)計(jì)劃。除了在模擬中進(jìn)行測(cè)試外,研究人員還將他們的框架應(yīng)用于一個(gè)經(jīng)歷了一系列現(xiàn)實(shí)挑戰(zhàn)的機(jī)器人。其中包括一個(gè)迷宮、一個(gè)工業(yè)倉(cāng)庫(kù)、一個(gè)有人在里面工作的實(shí)驗(yàn)室和一片森林。該地圖提供了寶貴的信息,不僅可以在不依賴GPS的情況下穿過空間,還可以逃離死胡同。作者寫道:“在一般雜亂的環(huán)境中,逃離‘口袋’或走出死胡同的能力是完成導(dǎo)航任務(wù)的基礎(chǔ)?!?。“除了避免局部碰撞外,這還需要維護(hù)和保持探索區(qū)域的最新地圖,以及處理未探索區(qū)域的策略?;谶@張地圖,機(jī)器人應(yīng)該能夠生成從當(dāng)前位置到目標(biāo)的運(yùn)動(dòng)計(jì)劃?!彪m然一個(gè)特定的實(shí)驗(yàn)室可能擠滿了愿意為機(jī)器人測(cè)試提供背景信息的科學(xué)家,但很難找到人們?cè)谟?xùn)練導(dǎo)航算法時(shí)原地踏步的深度。在社交媒體上傳播的病毒式電影挑戰(zhàn)《人體模特挑戰(zhàn)》中參賽作品,讓人們呆在原地,而拍攝挑戰(zhàn)的人則在他們周圍穿行。根據(jù)研究數(shù)據(jù),人體模型挑戰(zhàn)賽原來是一座金礦。谷歌研究團(tuán)隊(duì)發(fā)表的《通過觀察冰凍的人來學(xué)習(xí)移動(dòng)的人的深度》使用了大量的人體模型挑戰(zhàn)視頻來訓(xùn)練算法,在沒有特殊深度傳感器的情況下從靜止視頻中推斷深度。作者寫道:“在這篇論文中,我們采用了一種數(shù)據(jù)驅(qū)動(dòng)的方法,并從一個(gè)新的數(shù)據(jù)來源中學(xué)習(xí)了人類的深度先驗(yàn):數(shù)千個(gè)人們模仿人體模型的互聯(lián)網(wǎng)視頻,即在手持相機(jī)巡視現(xiàn)場(chǎng)時(shí),以不同的自然姿勢(shì)冷凍?!薄!耙?yàn)槿耸庆o止的,所以可以使用多視圖立體重建來生成訓(xùn)練數(shù)據(jù)?!毖芯咳藛T聲稱,他們的方法源于對(duì)人體模型挑戰(zhàn)數(shù)據(jù)集的訓(xùn)練,比現(xiàn)有的試圖從單個(gè)相機(jī)推斷深度的方法提供了更好、更準(zhǔn)確的深度預(yù)測(cè)。至少與具體方法同樣相關(guān)的是,從2000個(gè)上傳的個(gè)人視頻中挑選出一個(gè)數(shù)據(jù)集,該數(shù)據(jù)集可以訓(xùn)練算法來了解相機(jī)如何在空間中圍繞人移動(dòng)?!堵槭±砉ぜ夹g(shù)評(píng)論》的Karen Hao在談到這一特定數(shù)據(jù)集時(shí)寫道:“研究人員還發(fā)布了他們的數(shù)據(jù)集,以支持未來的研究,這意味著數(shù)千名參加人體模型挑戰(zhàn)賽的人將在不知不覺中繼續(xù)為計(jì)算機(jī)視覺和機(jī)器人研究的進(jìn)步做出貢獻(xiàn)?!??!半m然這對(duì)一些人來說可能是一個(gè)令人不安的驚喜,但這是人工智能研究的規(guī)則,而不是例外?!痹趶拇罅靠捎玫拿嫦蚬姷募糨嬛刑崛〉囊曨l集上訓(xùn)練導(dǎo)航算法的潛力是巨大的,尤其是如果它產(chǎn)生可以在簡(jiǎn)單的商用機(jī)器上運(yùn)行的程序。深度傳感器可能是軍用機(jī)器人導(dǎo)航的理想選擇,但在現(xiàn)有攝像頭上操作的潛力使更廣泛的機(jī)器人更容易在人群或樹林中飛行。將上傳用于短暫模因的私人數(shù)據(jù)集顛覆到機(jī)器人導(dǎo)航中的倫理影響需要考慮,尤其是當(dāng)科技公司的工作人員已經(jīng)對(duì)旨在和平、民用的研究與適應(yīng)軍事目的之間的關(guān)系提出質(zhì)疑時(shí)。也就是說,消耗公共領(lǐng)域的視頻或五角大樓專門擁有的視頻可以為承包商提供一種方式,他們渴望將世界上的此類研究轉(zhuǎn)化為軍事導(dǎo)航工具。記錄戰(zhàn)場(chǎng)信息可能很困難,但在戰(zhàn)爭(zhēng)游戲和軍事演習(xí)的視頻上訓(xùn)練數(shù)據(jù)集可能是一個(gè)探索不足的領(lǐng)域,這對(duì)軍方未來幾十年想要部署的自主機(jī)器人有潛在的好處。