高清AV,JZZIJZZIJ日本成熟少妇

全球首個(gè)！谷歌旗下DeepMind展示用于通用機(jī)器人的AI智能體RoboCat：僅需100次訓(xùn)練便能完成任務(wù)，還能自我改進(jìn)提升

2023-06-22 15:24:48 騰訊網(wǎng)

每經(jīng)記者：蔡鼎????每經(jīng)編輯：蘭素英

(資料圖片)

機(jī)器人正迅速成為我們?nèi)粘Ｉ畹囊徊糠?，但它們通常只用于特定任?wù)。雖然人工智能領(lǐng)域的最新進(jìn)展可以使機(jī)器人在許多方面發(fā)揮作用，但全球在通用機(jī)器人制造方面的進(jìn)展仍然較慢，部分原因是收集真實(shí)世界的訓(xùn)練數(shù)據(jù)需要大量的時(shí)間。近日，谷歌旗下AI團(tuán)隊(duì)DeepMind的最新研究或可解決該領(lǐng)域面臨的這一“痛點(diǎn)”。

美東時(shí)間6月20日，DeepMind展示了用于機(jī)器人的AI智能體RoboCat。DeepMind稱其為全球首個(gè)能解決和適應(yīng)多重任務(wù)的智能體。更重要的是，RoboCat是一個(gè)可以自我改進(jìn)的AI代理，其可以操作不同的機(jī)械臂，而且只需最少100次演示即可解決任務(wù)，并從其自生成的數(shù)據(jù)中進(jìn)行改進(jìn)。

谷歌展示全球首個(gè)多任務(wù)AI智能體

谷歌旗下AI團(tuán)隊(duì)DeepMind的最新論文介紹了一種能夠進(jìn)行自我改進(jìn)的AI代理，本質(zhì)上是由AI賦能的軟件程序，相當(dāng)于機(jī)器人的“大腦”，由其加持的機(jī)器人與傳統(tǒng)機(jī)器人不同之處在于，RoboCat更具“通用性”，并可實(shí)現(xiàn)自我改進(jìn)、自我提升。

圖片來(lái)源：DeepMind截圖

DeepMind在之前的研究中探索了如何開發(fā)支持大規(guī)模學(xué)習(xí)多任務(wù)的機(jī)器人，并將語(yǔ)言模型理解與輔助機(jī)器人的現(xiàn)實(shí)世界能力相結(jié)合。這個(gè)名為RoboCat的機(jī)器人智能體是全球首個(gè)能解決和適應(yīng)多重任務(wù)的AI智能體，能夠?qū)W習(xí)在不同的機(jī)械臂上執(zhí)行各種任務(wù)，然后自我生成新的訓(xùn)練數(shù)據(jù)來(lái)對(duì)其進(jìn)行改進(jìn)。

RoboCat的學(xué)習(xí)速度比其他先進(jìn)模型快得多——只需要通過100次左右的演示，RoboCat就可以學(xué)會(huì)操控機(jī)械臂來(lái)完成各式各樣的任務(wù)，然后通過自生成的數(shù)據(jù)來(lái)進(jìn)行迭代改進(jìn)。這種能力將有助于加速機(jī)器人研究，因?yàn)檫@減少了對(duì)人類監(jiān)督訓(xùn)練的需求，也是創(chuàng)造通用機(jī)器人的重要一步。

DeepMind的研究科學(xué)家、RoboCat團(tuán)隊(duì)的共同作者Alex Lee表示，“我們證明，一個(gè)大模型可以解決多個(gè)真實(shí)機(jī)器人承載的各種任務(wù)，并能迅速適應(yīng)新的任務(wù)。”

據(jù)DeepMind，RoboCat基于其多模態(tài)模型Gato（西班牙語(yǔ)“貓”的意思），它可以在模擬和物理環(huán)境中處理語(yǔ)言、圖像和動(dòng)作。DeepMind將Gato的架構(gòu)與一個(gè)大型訓(xùn)練數(shù)據(jù)集結(jié)合并起來(lái)，該數(shù)據(jù)集由各種機(jī)器人手臂的圖像序列和動(dòng)作組成，可以解決數(shù)百種任務(wù)。

在DeepMind演示視頻中，RoboCat已經(jīng)可以通過自主學(xué)習(xí)操控機(jī)械臂，完成“套圈”“搭積木”“抓水果”等任務(wù)。這些任務(wù)看似簡(jiǎn)單，但考驗(yàn)了機(jī)械臂操作的精準(zhǔn)度、理解力以及對(duì)于形狀匹配難題的解決能力。目前RoboCat完成一項(xiàng)新任務(wù)的成功率已經(jīng)在初期36%的基礎(chǔ)上提升了一倍。

圖片來(lái)源：DeepMind截圖

基于原始數(shù)據(jù)集和新訓(xùn)練產(chǎn)生的數(shù)據(jù)，RoboCat的數(shù)據(jù)集將包含數(shù)百萬(wàn)次的訓(xùn)練軌跡數(shù)據(jù)。它學(xué)習(xí)的新任務(wù)越多，它就能更好地學(xué)習(xí)和解決額外的新任務(wù)。DeepMind的論文認(rèn)為，執(zhí)行任務(wù)成功率的大幅提升，是由于RoboCat的經(jīng)驗(yàn)越來(lái)越豐富，就像人們?cè)谔囟I(lǐng)域加深學(xué)習(xí)時(shí)發(fā)展出更多樣化的技能一樣。RoboCat獨(dú)立學(xué)習(xí)技能和快速自我完善的能力，特別是當(dāng)應(yīng)用于不同機(jī)器人設(shè)備時(shí)，將有助于為未來(lái)的研究鋪平道路。

圖片來(lái)源：DeepMind截圖

具身智能將引領(lǐng)AI下一個(gè)浪潮

《每日經(jīng)濟(jì)新聞》記者注意到，目前在機(jī)器人領(lǐng)域，包括特斯拉、谷歌、亞馬遜、英偉達(dá)、騰訊等巨頭已經(jīng)有所布局。然而，正如DeepMind上述論文指出，由于訓(xùn)練機(jī)器人需要大量的時(shí)間，因此智能化水平仍不足，難以實(shí)現(xiàn)大規(guī)模的商業(yè)化。而RoboCat的問世或許能解決這一“痛點(diǎn)”。

其實(shí)，DeepMind的RoboCat只是AI賦能機(jī)器人的主要案例之一。今年以來(lái)，已經(jīng)有數(shù)家公司將語(yǔ)言模型運(yùn)用到了機(jī)器人上：2023年年初，谷歌推出視覺語(yǔ)言模型PaLM-E，并運(yùn)用到工業(yè)機(jī)器人上；4月，阿里巴巴將千問大模型接入工業(yè)機(jī)器人；5月，特斯拉人形機(jī)器人Optimus展示了精準(zhǔn)的控制、感知能力，同月，英偉達(dá)發(fā)布全新自主移動(dòng)機(jī)器人平臺(tái)。

得益于此，人工智能加持的機(jī)器人化身具身智能（Embodied Intelligence）吸引了全球的廣泛關(guān)注。

馬斯克在特斯拉2023年股東大會(huì)上便表示，人形機(jī)器人將是今后特斯拉主要的長(zhǎng)期價(jià)值來(lái)源，“如果人形機(jī)器人和人的比例是2比1左右，那么人們對(duì)機(jī)器人的需求量可能是100億乃至200億個(gè)，遠(yuǎn)超電動(dòng)車的數(shù)量”。英偉達(dá)創(chuàng)始人黃仁勛在ITF World 2023半導(dǎo)體大會(huì)上也表示，AI下一個(gè)浪潮將是“具身智能”。

圖片來(lái)源：東吳證券研報(bào)截圖

東吳證券研報(bào)指出，具身智能首先需要聽懂人類語(yǔ)言，分解任務(wù)、規(guī)劃子任務(wù)，移動(dòng)中識(shí)別物體，與環(huán)境交互，最終完成任務(wù)。東吳證券認(rèn)為人形機(jī)器人很好地契合了具身智能的要求，有望成為標(biāo)桿應(yīng)用。“機(jī)器人研究的關(guān)鍵在于讓機(jī)器人適應(yīng)人類環(huán)境，最終走進(jìn)千家萬(wàn)戶的生活（工業(yè)、餐飲、醫(yī)療等多領(lǐng)域）。人形機(jī)器人有望率先在B端上量，最終打開C端市場(chǎng)。遠(yuǎn)期市場(chǎng)空間可觀。”

東吳證券預(yù)計(jì)，2035年，假設(shè)人形機(jī)器人價(jià)格為20萬(wàn)元，且照顧、陪伴功能分別為美國(guó)/歐洲/亞洲市場(chǎng)累計(jì)新增了5%/7%/4%的滲透率，即單年滲透率分別為1%/1.4%/0.8%。在較悲觀/中性/較樂觀的場(chǎng)景中，家庭場(chǎng)景的市場(chǎng)規(guī)模將分別達(dá)到3.00萬(wàn)億/3.66萬(wàn)億/4.26萬(wàn)億元。

每日經(jīng)濟(jì)新聞

關(guān)鍵詞：