當(dāng)?shù)貢r間周五,谷歌公司發(fā)布新的機(jī)器人模型Robotics Transformer 2(RT-2),搭載了大語言模型的最新進(jìn)展,且能幫助訓(xùn)練機(jī)器人理解扔垃圾等任務(wù)。
RT-2是一種“視覺-語言-行動”模型,可以通過在網(wǎng)絡(luò)上投喂信息和圖像,訓(xùn)練機(jī)器人執(zhí)行響應(yīng)的動作。這使得機(jī)器人變得更加聰明,并賦予它們新的理解和解決問題的能力。
例如,如果希望以前的系統(tǒng)能夠扔掉垃圾,必須明確地訓(xùn)練它們能夠識別垃圾,以及撿起并扔掉垃圾。RT-2則能夠從大量的網(wǎng)絡(luò)數(shù)據(jù)中轉(zhuǎn)移知識,它已經(jīng)知道什么是垃圾,并且可以在沒有明確訓(xùn)練的情況下識別垃圾。
谷歌宣稱,相比以往第一個版本,新的模型讓機(jī)器人的性能幾乎翻倍,準(zhǔn)確率從32%提升至62%。
谷歌DeepMind的機(jī)器人主管Vincent Vanhoucke說:“由于生成式AI的爆火,我們不得不重新考慮整個研究計劃。之前做的很多事情都已經(jīng)完全失效了。”
加州大學(xué)伯克利分校的機(jī)器人領(lǐng)域教授Ken Goldberg表示,機(jī)器人的靈巧程度仍達(dá)不到人類的水平,在一些基本任務(wù)上也表現(xiàn)不佳,但谷歌利用人工智能語言模型賦予機(jī)器人新的推理和即興創(chuàng)作技能,這是一個有希望的突破。