《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > DeepMind「通才」AI智能體Gato來了,多模態、多任務,受大語言模型啟發

DeepMind「通才」AI智能體Gato來了,多模態、多任務,受大語言模型啟發

2022-05-13
來源:機器之心
關鍵詞: AI Gato

  在寫文章、畫圖之后,AI 大模型現在又同時有了打游戲的能力。不禁在想,DeepMind 的智能體 Gato 未來還能玩出哪些花活?

  假如使用單一序列模型就能解決所有任務,是再好不過的事情,因為這種模型減少了不必要的麻煩。不過這需要增加訓練數據的數量和多樣性,此外,這種通用模型隨著數據的擴充和模型的擴展,性能還會提高。從歷史上看,更擅長利用計算的通用模型最終也會超過特定于專門領域的模型。

  今日,受大規模語言建模的啟發,Deepmind 應用類似的方法構建了一個單一的「通才」智能體 Gato,它具有多模態、多任務、多具身(embodiment)特點。

  Gato 可以玩雅達利游戲、給圖片輸出字幕、和別人聊天、用機械臂堆疊積木等等。此外,Gato 還能根據上下文決定是否輸出文本、關節力矩、按鈕按壓或其他 token。

  與大多數智能體玩游戲不同,Gato 使用相同的訓練模型就能玩許多游戲,而不用為每個游戲單獨訓練。

  Gato 的訓練數據集應該盡量廣泛,需要包括不同模態,如圖像、文本、本體感覺(proprioception)、關節力矩、按鈕按壓以及其他離散和連續的觀察和行動。

  為了能夠處理這種多模態數據,Deepmind 將所有數據序列化為一個扁平的 token 序列。在這種表示中,Gato 可以從類似于標準的大規模語言模型進行訓練和采樣。在部署期間,采樣的 token 會根據上下文組合成對話響應、字幕、按鈕按下或其他動作。

  UCL 計算機系教授汪軍告訴機器之心,DeepMind 的這項最新工作將強化學習、計算機視覺和自然語言處理這三個領域合到一起,雖然技術思路上沿用了前人的方法,但能將 CV、NLP 和 RL 這三個不同模態映射到同一個空間,用一套參數表達,是非常不容易的。

  其積極意義在于,證明了 CV、NLP 和 RL 的結合是切實可行的,通過序列預測能夠解決一些決策智能的問題。考慮到 Gato 模型目前的參數量只能算中等,接下來繼續往這個方向探索,構建更大的模型,將會有非常大的意義。

  不過,Gato 大模型的 RL 部分只采用了監督學習方法,并未觸及強化學習真正的核心——reward 設計機制,目前的任務中也沒有多智能體決策的問題。汪軍教授表示,他的團隊近期在決策大模型上做了很多探索,包括證明多智能體決策也可以是序列模型,相關成果將于近期公布,歡迎大家關注。

  Gato 智能體細節

  在 Gato 的訓練階段,來自不同任務和模態的數據被序列化為扁平的 token 序列,由一個類似于大型語言模型的 transformer 神經網絡進行 batch 和其他處理。由于損失被 masked,Gato 只預測動作和文本目標。

  下圖為 Gato 的訓練流程。

  微信圖片_20220513152559.png

  在部署 Gato 時,提示(如演示)被 tokenised,形成了初始序列。接著,環境產生了首個觀察結果,該結果也被 tokenised 并添加到序列中。Gato 以自回歸的方式對動作向量進行采樣,一次只采樣一個 token。

  一旦包含動作向量的所有 token 都被采樣(由環境的動作規范確定),動作被解碼并發送給環境,然后逐步產生新的觀察結果。重復這一過程。Gato 模型始終在包含 1024 個 token 的上下文環境窗口內查看之前所有的觀察結果和動作。

  下圖展示了將 Gato 部署為控制策略(control policy)的流程。

  微信圖片_20220513152722.png

  除了各種自然語言和圖像數據集之外,Gato 還在包含模擬和真實環境中智能體經驗的大量數據集上進行了訓練。

  下表 1 左為用于訓練 Gato 的控制數據集,右為視覺與語言數據集。樣本權重(sample weight)表示每個數據集在訓練序列 batch 中平均所占的比例。

  微信圖片_20220513152735.jpg

  Gato 智能體能力

  研究者匯總了在以上數據上訓練時 Gato 的性能。也就是說,所有任務的所有結果都來自具有一組權重的單一預訓練模型。微調結果將在「實驗分析」章節展示。

  模擬控制任務

  下圖 5 展示了 Gato 在給定分數閾值之上執行不同控制任務的數量相對于 Gato 訓練數據中的專家表現。其中,x 軸上的值表示專家分數的特定百分比,0 對應隨機智能體性能。y 軸表示預訓練模型的平均性能等于或高于特定百分比時的任務數量。

  研究者將性能報告為百分比,其中 100% 對應每個任務的專家,0% 對應于隨機策略。對于訓練模型的每個模擬控制任務,他們在相應的環境中 roll out Gato 策略 50 次,并對定義的分數進行平均。如下圖所示,Gato 以超過 50% 的專家分數閾值執行了 604 個任務中的 450 多個。

  微信圖片_20220513161650.png

  在 ALE Atari 中,Gato 在 23 場 Atari 游戲中取得了人類平均(或更高的)分數,在 11 場游戲中取得了兩倍于人類的分數。雖然生成數據的單任務在線 RL 智能體依然優于 Gato,但可以通過增加容量或使用離線 RL 訓練而非純監督克服。研究者在文中還介紹了一個專業的單域 ALE Atari 智能體,它在 44 場比賽中都取得比人類更好的分數。

  在 BabyAI 中,Gato 在幾乎所有級別上都得到了 80% 以上的專家分數。對于最困難的任務 BossLevel,Gato 的得分為 75%。相比之外,另外兩個已發布的基準 BabyAI 1.0 和 BabyAI 1.1 分別使用 100 萬次演示對該單一任務進行訓練,它們的得分不過為 77% 和 90%。

  在 Meta-World 中,Gato 在接受訓練的 45 個任務中的 44 個中得到了 50% 以上的專家分數,35 個任務上得到 80% 以上,3 個任務上超過 90%。在規范的 DM Control Suite 上,Gato 在 30 個任務中的 21 個上都得到了 50% 以上的專家分數,在 18 個任務上得到 80% 以上。

  機器人基準評估

  第一視角遠程操作可以收集專家演示。然而,此類演示收集起來速度慢成本高。因此,數據高效的行為克隆方法對于訓練通用機器人操縱器是可取的,離線預訓練成為一個很有動力的研究領域。研究者也在已建立的 RGB Stacking 機器人基準上對 Gato 進行了評估。

  RGB Stacking 機器人基準上的技能泛化挑戰測試了智能體堆疊以往未見過形狀的對象的能力。智能體在一個包含各種形狀機器人堆疊對象的 episodes 的數據集上進行訓練。但是,五個對象形狀的三元組沒有包含在訓練數據中,而是作為測試三元組。研究者針對真實機器人上的每個測試三元組對訓練的 Gato 進行了 200 輪的評估。

  下表 2 的結果表明,Gato 在每個測試三元組上的成功率與 Lee 等人(2021)提出的單任務 BC-IMP(filtered BC)基準相當。

  微信圖片_20220513161708.png

  文本示例

  Gato 智能體也能生成基本對話以及給圖像加字幕(或描述)。下圖 6 展示了 Gato 為圖像加字幕的代表性示例。

  微信圖片_20220513161733.jpg

  下圖 7 展示了一些精選的純文本對話交流示例。

  微信圖片_20220513161748.jpg

  實驗分析

  下圖 8 中,DeepMind 評估了 3 種不同模型大?。ㄒ詤涤嫈岛饬浚?9M 模型、364M 模型和 1.18B 模型 (Gato)??梢缘贸?,在相等的 token 數下,隨著模型的擴展,模型性能隨之提高。

 微信圖片_20220513161804.png 

  下圖 10 將 Gato 在不同微調數據機制中的成功率與 sim-to-real 專家和 Critic-Regularized Regression (CRR) 智能體進行了比較,結果如下:Gato 在現實和模擬中(分別為左圖和右圖的紅色曲線),僅用 10 episodes 就恢復了專家的表現,并在 100 或 1000 episodes 微調數據時達到峰值,超過了專家。在此點之后(在 5000 處),性能會略有下降,但不會遠遠低于專家的性能。

  微信圖片_20220513161819.png

  下表 3 為 Gato 和 BC-IMP 比較結果。

  

微信圖片_20220513161829.png

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美一区二区私人影院日本| 亚洲全部视频| 国内免费精品永久在线视频| 亚洲深爱激情| 欧美中文在线观看| 亚洲狼人精品一区二区三区| 亚洲国产精品久久久久婷婷884| 狠狠色综合日日| 在线日韩av永久免费观看| 国产精品美女在线| 欧美成人一区二免费视频软件| 在线精品观看| 亚洲欧美久久久久一区二区三区| 樱桃成人精品视频在线播放| 亚洲欧洲精品成人久久奇米网| 免费不卡欧美自拍视频| 久久精品2019中文字幕| 国产婷婷色一区二区三区四区| 国产区欧美区日韩区| 亚洲欧美日韩综合aⅴ视频| 亚洲精品国产精品国产自| 亚洲美女视频| 一区二区三区福利| 国产精品久久午夜夜伦鲁鲁| 午夜精品三级视频福利| 欧美精品免费播放| 一区二区福利| 国产精品99久久久久久久vr| 国产精品你懂得| 欧美日韩一区二区三| 亚洲高清123| 欧美—级a级欧美特级ar全黄| 午夜精品久久久久久久| 国产日韩一区二区三区| 国产精品毛片高清在线完整版| 欧美777四色影视在线| 国产精品久久久久免费a∨大胸| 亚洲精品视频在线观看免费| 亚洲欧美制服另类日韩| 国内精品久久久久久| 亚洲欧洲午夜| 亚洲靠逼com| 在线观看91精品国产入口| 久久国产欧美| 久久久噜噜噜久噜久久| 亚洲在线日韩| 亚洲一区三区在线观看| 欧美日韩国产一区二区| 噜噜噜91成人网| 女主播福利一区| 久久久久这里只有精品| 欧美日韩三级在线| 欧美亚日韩国产aⅴ精品中极品| 在线国产日韩| 欧美色欧美亚洲另类七区| 99国产成+人+综合+亚洲欧美| 国外成人免费视频| 欧美少妇一区| 久久国产免费| 久久成人av少妇免费| 久久久亚洲成人| 欧美破处大片在线视频| 欧美三日本三级少妇三99| 在线亚洲一区二区| 亚洲色无码播放| 国产区日韩欧美| 亚洲一区二区精品| 欧美日韩岛国| 国产性色一区二区| 国产亚洲欧美aaaa| 在线观看日韩www视频免费| 久久免费国产精品| 国产尤物精品| 韩日欧美一区二区三区| 国产一区二区在线免费观看| 亚洲综合色在线| 欧美巨乳波霸| 红杏aⅴ成人免费视频| 9i看片成人免费高清| 一本大道久久a久久精二百| 欧美日本二区| 亚洲欧美日韩精品在线| 亚洲精品在线电影| 在线观看91精品国产入口| 国产精品99久久久久久人| 欲色影视综合吧| 亚洲一区二区三区在线观看视频| 在线成人免费观看| 欧美久久久久久久久久| 一区二区三区欧美激情| 欧美一区二区免费观在线| 欧美日韩日本网| 国产精品爽黄69| 亚洲日韩中文字幕在线播放| 久久夜色精品国产欧美乱极品| 欧美91大片| 亚洲欧美日韩中文在线制服| 国产一区二区三区视频在线观看| 久久三级福利| 久久精品亚洲乱码伦伦中文| 欧美日韩视频在线一区二区| 国产精品九九久久久久久久| 国产精品日韩欧美一区二区三区| 午夜精品国产精品大乳美女| 国产三级欧美三级| 欧美激情一区| 国产一区在线免费观看| 久久精品视频免费| 国产视频久久久久久久| 亚洲一区影音先锋| 久久aⅴ国产欧美74aaa| 免费不卡在线观看av| 欧美日韩国产一中文字不卡| 国产伪娘ts一区| 亚洲欧美成人在线| 国产日韩在线一区二区三区| 国产精品xxxav免费视频| 欧美一区二区三区四区视频| 久久狠狠一本精品综合网| 先锋亚洲精品| 久久久人成影片一区二区三区| 欧美日本在线视频| 久久这里只精品最新地址| 狠狠色噜噜狠狠狠狠色吗综合| 在线一区亚洲| 中文精品视频| 欧美一区二区三区喷汁尤物| 国产精品狼人久久影院观看方式| 久久久久久久久久码影片| 欧美高清在线视频观看不卡| 农夫在线精品视频免费观看| 韩国一区二区三区美女美女秀| 一区二区三区四区五区在线| 影音先锋亚洲一区| 精品动漫一区二区| 亚洲精品人人| 亚洲日本va午夜在线电影| 久久精品亚洲精品| 亚洲国产欧美日韩另类综合| 欧美精彩视频一区二区三区| 亚洲卡通欧美制服中文| 国产日本亚洲高清| 中文国产一区| 欧美日韩亚洲一区三区| 亚洲视频在线播放| 国产精品一香蕉国产线看观看| 欧美日韩第一区日日骚| 黑人一区二区三区四区五区| 狠狠色丁香久久婷婷综合_中| 国产精品一区久久久| 国产精品亚洲美女av网站| 欧美精品播放| 欧美日韩色综合| 在线观看国产欧美| 久久久久一区二区三区四区| 久久综合色婷婷| 国产精品丝袜久久久久久app| 激情综合中文娱乐网| 一区二区在线免费观看| 欧美性大战久久久久久久蜜臀| 中文欧美在线视频| 国产综合精品一区| 免费h精品视频在线播放| 亚洲黄色片网站| 欧美激情综合在线| 久久这里只有精品视频首页| 亚洲视频综合| 国内精品一区二区三区| 欧美寡妇偷汉性猛交| 国产麻豆精品theporn| 久久精品亚洲精品国产欧美kt∨| 国产精品久久久久久久久果冻传媒| 狠狠色综合色区| 欧美一区二区三区啪啪| 国产日韩欧美视频| 欧美成人按摩| 欧美精品大片| 欧美日韩一区二区三区免费看| 国产精品免费久久久久久| 欧美午夜电影网| 韩国视频理论视频久久| 亚洲一区二区成人在线观看| 中文国产成人精品| 国产精品久久久久毛片软件| 久久精彩视频| 国产欧美日韩中文字幕在线| 欧美三日本三级少妇三99| 羞羞漫画18久久大片| 嫩草成人www欧美| 欧美视频在线一区二区三区| 亚洲专区在线| 国产一区香蕉久久| 亚洲综合大片69999| 国产精品久久久久久模特| 久久久久国产精品www| 欧美人交a欧美精品| 国产精品入口日韩视频大尺度| 欧美在线播放一区二区| 国产精品ⅴa在线观看h| 亚洲一二三区在线观看| 国产精品久久二区| 久久久亚洲精品一区二区三区| 欧美性大战久久久久久久| 久久精品人人| 日韩亚洲欧美在线观看| 欧美一级黄色网| 国产精品久久久久9999| 夜夜爽夜夜爽精品视频| 一区二区三区在线观看国产| 黄色精品在线看| 91久久中文字幕| 久久人人爽人人爽| 久久久久久国产精品mv| 欧美日韩精品欧美日韩精品| 国产亚洲精品bv在线观看| 在线看无码的免费网站| 黑人巨大精品欧美一区二区小视频| 香蕉乱码成人久久天堂爱免费| 国产精品一区久久久久| 欧美淫片网站| 久久久久久高潮国产精品视| 激情久久中文字幕| 国产在线视频欧美| 性色一区二区| 一区二区三区欧美在线观看| 亚洲男女毛片无遮挡| 先锋影音久久| 亚洲一区二区三区在线看| 亚洲人成亚洲人成在线观看图片| 久久综合五月天婷婷伊人| 欧美精品一卡二卡| 欧美激情在线播放| 国精品一区二区| 一区二区欧美国产| 国产精品久久午夜| 午夜在线视频一区二区区别| 亚洲伊人久久综合| 中文在线一区| 久久一区二区三区国产精品| 欧美激情一区二区三区不卡| 欧美多人爱爱视频网站| 日韩视频在线一区| 亚洲国产欧美不卡在线观看| 亚洲一区在线看| 欧美日本视频在线| 久久久久久久尹人综合网亚洲| 国产精品国产亚洲精品看不卡15| 亚洲精品中文字幕在线| 国产日产亚洲精品系列| 亚洲欧美另类在线观看| 国产精品亚洲综合色区韩国| 欧美a级大片| 欧美日本不卡| 亚洲一区二区三区在线播放| 久久九九久精品国产免费直播| 国产精品第一页第二页第三页| 亚洲第一精品电影| 欧美日韩免费观看一区=区三区| 在线视频日韩| 国产精品va在线| 亚洲激情欧美| 亚洲美女视频在线观看| 亚洲精品国产精品国自产观看浪潮| 久久久久久一区| 欧美亚州韩日在线看免费版国语版| 国产精品一区免费在线观看| 午夜激情亚洲| 黑人巨大精品欧美一区二区小视频| 国产精品任我爽爆在线播放| 国产精品永久免费在线| 国产精品久久看| 在线免费不卡视频| 欧美日本不卡视频| 欧美色综合天天久久综合精品| 亚洲黄色影片| 国产精品热久久久久夜色精品三区| 久久久高清一区二区三区| 国产伦精品免费视频| 亚洲一区二区三区乱码aⅴ| 国产精品夜色7777狼人| 久久久精品国产99久久精品芒果| 亚洲精品久久久久久下一站| 欧美成人精品1314www| 欧美日韩一区二区三区| 亚洲美女一区| 亚洲日本中文字幕免费在线不卡| 亚洲毛片播放| 久久精品系列| 国产精品专区h在线观看| 久久久久一本一区二区青青蜜月| 国产精品亚洲视频| 亚洲国产一区二区在线| 午夜在线精品偷拍| 99re66热这里只有精品4| 国产视频在线观看一区二区三区| 免费观看欧美在线视频的网站| 狠狠入ady亚洲精品| 亚洲一区在线播放| 99在线精品免费视频九九视| 欧美激情影院| 亚洲一区二区三区四区五区黄| 欧美在线观看一区| 尤物九九久久国产精品的分类| 欧美freesex交免费视频| 国产精品久久久久久久电影| 久久福利一区| 欧美激情综合色| 一卡二卡3卡四卡高清精品视频| 免费日韩av电影| 欧美日韩第一区| 亚洲免费观看高清完整版在线观看熊| 亚洲一区二区三区在线播放| 欧美一区二区三区在线看| 久久久久久夜精品精品免费| 欧美性大战久久久久久久| 女女同性精品视频| 麻豆免费精品视频| 欧美激情亚洲国产| 亚洲少妇一区| 欧美日韩在线影院| 亚洲一区三区电影在线观看| 香蕉久久a毛片| 亚洲日韩成人| 欧美日韩成人综合在线一区二区| 亚洲精品日韩精品| 欧美在线精品免播放器视频| 日韩午夜在线视频| 18成人免费观看视频|