《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > OpenAI新研究補齊Transformer短板,將可預測序列長度提高30倍

OpenAI新研究補齊Transformer短板,將可預測序列長度提高30倍

2019-04-24

Transformer是一種強大的序列模型,但是它所需的時間和內存會隨著序列長度出現二階增長。近日,OpenAI研究人員開發出了一種深度神經網絡Sparse Transformer,該網絡在預測長序列方面創造了新紀錄——無論預測的是文本、圖像還是聲音。該神經網絡利用注意力機制中的一種改進算法,可以從長度可能是之前30倍的序列中提取模式。

現在,AI 研究中的一項挑戰是在圖像、視頻或聲音等復雜數據中進行長序列的精細相關性建模。Sparse Transformer 合并了 O(N^2)Transformer 自注意力機制的 O(N√N) 重組以及其他一些改進,從而直接用于這些豐富的數據類型。以前,這些數據上所使用的模型是專為某個領域制作的,或者很難將序列擴展到包含幾千個元素。


相比之下,OpenAI 開發的模型通過使用數以百計的層可以對包含上萬個元素的序列進行建模,在諸多領域都取得了當前最佳的表現。OpenAI 研究人員利用該模型幫助創建能夠更好地理解世界的 AI 系統。


深度注意力


在 Transformer 中,每一個輸出元素與輸入元素相連接,同時根據具體情況對它們之間的權重進行動態計算,這一過程被稱為「注意力機制」。雖然人們相信這使得 Transformer 較那些具有固定連接模式的模型更為靈活,但實際操作中需要為每一層和注意力頭創建一個 N×N 注意力矩陣,當應用于圖像或原始音頻等具有許多元素的數據類型時會消耗大量內存。

微信圖片_20190424221637.jpg

當矩陣存儲在內存或在逆推計算過程中進行再計算時,深度 Transformer(64 層和 4 個頭)的注意力內存使用情況。作為參考,用于深度學習的標準 GPU 內存通常是 12-32GB.


減少內存消耗的一種方法是在反向傳播過程中從檢查點處重新計算注意力矩陣,這是深度學習中的一種成熟的方法,以更多的計算來減少內存使用。


當 Transformer 中的注意力矩陣完成時,這意味著最大的內存消耗將不受層數的支配,使研究人員訓練網絡的深度大大超過從前。在實際操作中,研究人員發現在處理 CIFAR-10 等基準測試任務時,深度達 128 層的 Transformer 表現出的性能優于較淺的網絡。


為了訓練深度更大的模型,研究人員對 transformer 的操作順序進行了幾次調整,修改了初始化方法。詳情參見論文。


稀疏注意力


然而,對于非常大的輸入來說,甚至計算單個注意力矩陣都是不現實的。因此,OpenAI 使用了稀疏注意力模式,在這種模式中,每個輸出位置僅從輸入位置子集中計算權重。當子集相對于整個輸入集較小時(如元素數量是√N 而不是 N),即使對于非常長的序列,注意力計算也會變得比較容易,算法復雜度為 O(N√N)而不是 O(N^2)。


為了評估該方法的可行性,研究人員首先可視化并學習了圖像上深度 Transformer 的注意力模式,發現其中許多模式表現出了可解釋和結構化的稀疏模式。以下每幅圖像都顯示了哪個輸入像素(白色高亮標出)由一個給定的注意力頭處理,以預測圖像中的下一個值。當輸入部分集中在小的子集上并顯示出高度規律性時,該層就易于稀疏化。以下是 CIFAR-10 圖像上 128 層模型的樣本:

微信圖片_20190424221702.jpg

左:Layer 19,右:Layer 20。為一個 128 層的 CIFAR-10 網絡的若干層學習注意力模式(白色高亮顯示)。這些層學會了在兩個維度上分割注意力。Layer 19 匯總每一行的信息,Layer 20 按列匯總這些信息,從而有效分解了全注意力運算。

微信圖片_20190424221725.jpg

為獲取位置記憶而訓練的層(左:Layer 6;右:Layer 36),它們通常關注類似的位置,不管輸入數據或時間步長如何(Layer 6)。其他層學習高度依賴數據的訪問模式(Layer 36)。


雖然許多層顯示出稀疏的結構,但有些層清晰地顯示出了動態注意力,這種注意力延伸到整個圖像。為了保持網絡學習這種模式的能力,研究人員實現了注意力矩陣的二維分解,其中網絡可以通過兩步稀疏注意力關注到所有位置。

微信圖片_20190424221749.png


第一版 strided attention 大概等同于每個位置處理自己的行和列,它與以上網絡學得的注意力模式類似。(注意,列注意力可等同于處理轉置矩陣的行)。第二版 fixed attention 在最新的列元素之后處理固定列和元素,研究者認為這個模式對于數據無法擬合二維結構(如文本)的情況很有用。


實驗結果


Sparse Transformer 在 CIFAR-10、Enwik8 和 Imagenet 64 數據集上刷新了當前最優密度估計分數。

微信圖片_20190424221807.jpg

微信圖片_20190424221829.png

在 CIFAR-10、Enwik8 和 Imagenet 64 數據集上的密度估計性能(單位為 bits per byte/dim)。M 表示網絡中使用的參數(單位為百萬),W 表示網絡寬度,L 表示層數,H 表示頭數。


研究者還發現稀疏注意力比完整注意力的損失更低,且速度更快。這可能指向稀疏模式產生的有用歸納偏置,或者密集注意力的底層優化問題。


生成圖像


使用了稀疏注意力的 Transformer 似乎有一種全局結構的概念,這可以通過觀察圖像補全(image completion)進行定性評估。下圖可視化了一個在 64×64 ImageNet 上訓練的模型:

微信圖片_20190424221849.jpg


損壞原圖

微信圖片_20190424221907.jpg

修復圖像

微信圖片_20190424221927.jpg

真實圖像


研究人員還生成了完全無條件的樣本,其中未調整的 softmax 溫度為 1.0。這些模型使用最大似然目標進行訓練,其覆蓋了所有的數據模式(其中包括可能不存在的數據),而不是增強較小部分數據的保真度。從具有未調整溫度的模型中取樣,研究人員看到了該模型認為世界上存在的圖像的完整分布。因此,一些樣本看起來奇奇怪怪的。

微信圖片_20190424221943.jpg

模型示例


生成原始音頻波形


通過簡單改變位置嵌入,稀疏 Transformer 還能用來生成原始音頻,而非圖像。隨著深度學習擴展到新的數據類型,用這類網絡來指定歸納偏置也很容易。


該模型是在原始的古典音樂片段上訓練的,并使用了稀疏注意力來生成長度為 65000 的序列。這相當于大約 5 秒長的原始音頻,研究人員在下面的每個片段中將幾個樣本連接在一起。

微信圖片_20190424222027.jpg


代碼公布


通常,實現稀疏注意力需要將查詢和關鍵矩陣分割成塊,因此為了簡化實驗,OpenAI 實現了一組塊稀疏核,這些核在 GPU 上高效地執行這些操作。OpenAI 開源了這些核并提供了稀疏注意力函數的示例:

https://github.com/openai/sparse_attention


未來發展和限制


本文介紹的稀疏注意力模式只是對長序列進行高效建模的初步嘗試。研究人員認為,探索稀疏注意力的不同模式和各種組合非常有用,而且學習稀疏模式對下一代神經網絡架構來說也是一個很重要的研究途徑。


即使有了上述改進,自回歸序列生成對非常高分辨率圖像和音頻來說仍是不切實際的。但是,研究人員介紹的優化注意力操作可能有用,將它與其它方法(如多尺度方法)結合,可以建模高維數據。


論文:Generating Long Sequences with Sparse Transformers


微信圖片_20190424222049.png


論文鏈接:https://d4mucfpksywv.cloudfront.net/Sparse_Transformer/sparse_transformers.pdf


摘要:Transformer 是一種強大的序列模型,但是它所需的時間和內存會隨著序列長度出現二階增長。這篇論文介紹了注意力矩陣的稀疏因式分解,可以將其降低到 O(N√N)。該研究提出了 a)訓練更深網絡的架構和初始化變體;b)重新計算注意力矩陣以節省內存;c)用于訓練的快速注意力內核。研究者將具備這些變化的網絡稱為 Sparse Transformer,并證明該網絡可以使用數百個層來建模成千上萬個時間步長的序列。


該網絡在從原始字節中建模圖像、音頻和文本時使用的是同樣的架構,在 Enwik8、CIFAR10 和 ImageNet-64 數據集上取得了當前最優的密度估計性能。研究者生成的無條件樣本展示了全局一致性和極大的多樣性,并證明原則上可以使用自注意力建模長度超百萬的序列。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美日韩色综合| 欧美日韩国产一区精品一区| 欧美激情一区二区三区成人| 国产综合在线看| 亚洲伦理一区| 美日韩精品视频免费看| 亚洲国产精品成人久久综合一区| 久久婷婷人人澡人人喊人人爽| 欧美日韩网址| 韩国成人福利片在线播放| 99re6这里只有精品| 欧美顶级少妇做爰| 亚洲美女视频在线观看| 亚洲综合日韩在线| 亚洲精品少妇30p| 亚洲美女少妇无套啪啪呻吟| 欧美日本韩国一区二区三区| 亚洲激情第一区| 在线观看精品视频| 国产女人18毛片水18精品| 欧美日产国产成人免费图片| 欧美一区二区三区在线观看视频| 欧美视频一区| 亚洲国产视频直播| 在线播放中文字幕一区| 国产精品狼人久久影院观看方式| 亚洲高清不卡在线观看| 国产视频自拍一区| 久久精品国产999大香线蕉| 久久网站免费| 欧美另类专区| 一区二区三区福利| 欧美日韩日日骚| 欧美紧缚bdsm在线视频| 国产精品久久久久久久一区探花| 国产精品卡一卡二卡三| 一区二区三区高清在线观看| 激情综合色丁香一区二区| 蜜桃伊人久久| 亚洲一区二区三区免费在线观看| 国模一区二区三区| 亚洲欧洲精品一区二区三区| 国产欧美一区二区三区在线老狼| 日韩一二三区视频| 亚洲一区国产精品| 一本久道久久综合狠狠爱| 国产精品久久久久久久久免费| 日韩一级不卡| 亚洲国产天堂久久国产91| 在线免费观看一区二区三区| 久久一区欧美| 亚洲第一精品久久忘忧草社区| 久久久国产一区二区三区| 亚洲精品无人区| 欧美色大人视频| 在线观看成人小视频| 一区二区三区四区五区精品视频| 亚洲自拍偷拍福利| 免费日韩精品中文字幕视频在线| 欧美一区午夜精品| 欧美在线一区二区| 亚洲福利精品| 国产综合第一页| 一区二区三区精品在线| 欧美视频中文在线看| 亚洲片区在线| 久久精品国产精品亚洲精品| 久久精品国产一区二区三| 亚洲精品乱码久久久久久按摩观| 亚洲桃色在线一区| 亚洲国产一区视频| 午夜精品福利一区二区蜜股av| 91久久精品久久国产性色也91| 亚洲精品女人| 亚洲另类视频| 国产日韩欧美一区二区三区在线观看| 欧美日韩国产123| 日韩一级黄色大片| 国产亚洲精品久久久久婷婷瑜伽| 亚洲欧美在线aaa| 亚洲一区在线观看视频| 久久免费午夜影院| 日韩一区二区久久| 激情成人综合网| 欧美猛交免费看| 国产精品一卡二| 欧美激情一二三区| 国产精品每日更新| 久久精视频免费在线久久完整在线看| 午夜亚洲性色福利视频| 亚洲人成毛片在线播放| 国产日韩欧美视频| 亚洲午夜小视频| 亚洲激情成人在线| 欧美三级电影精品| 99精品国产热久久91蜜凸| 亚洲香蕉伊综合在人在线视看| 国产精品呻吟| 亚洲国产精品毛片| 久久久久国产精品一区三寸| 国产在线精品一区二区夜色| 国产精品国产三级国产aⅴ浪潮| 亚洲欧美三级伦理| 国产乱码精品一区二区三区不卡| 日韩亚洲国产精品| 亚洲三级电影全部在线观看高清| 亚洲日本欧美在线| 国产亚洲精品美女| 欧美日韩精品一区二区| 国产精品一二三| 久久av一区二区三区漫画| 亚洲精品一区二区三区在线观看| 国产欧美亚洲日本| 国产精品一区二区三区成人| 国产精品无码永久免费888| 在线免费观看日本欧美| 国产精品试看| 国产精品九九| 一本色道久久综合狠狠躁篇的优点| 一二三区精品福利视频| 欧美福利视频| 亚洲国产精品毛片| 欧美日韩亚洲一区| 欧美一区二区三区四区在线观看地址| 久久久人成影片一区二区三区| 欧美1区2区视频| 欧美电影电视剧在线观看| 欧美亚洲第一区| 欧美绝品在线观看成人午夜影视| 老司机久久99久久精品播放免费| 欧美精品一区二区高清在线观看| 午夜精品美女久久久久av福利| 亚洲欧美国产日韩中文字幕| 久久久久久亚洲综合影院红桃| 亚洲自拍另类| 欧美一级视频精品观看| 免费一区视频| 91久久国产自产拍夜夜嗨| 久久在线免费观看| 欧美亚洲在线观看| 在线观看亚洲专区| 午夜欧美大片免费观看| 亚洲国产国产亚洲一二三| 国产精品乱人伦中文| 国产精品二区影院| 99re6这里只有精品视频在线观看| 欧美日韩在线直播| 91久久极品少妇xxxxⅹ软件| 国产日韩久久| 激情小说亚洲一区| 一本色道久久综合狠狠躁的推荐| 国产欧美一区二区精品性| 欧美视频一区二区三区| 久久蜜桃av一区精品变态类天堂| 欧美伦理91| 国产乱子伦一区二区三区国色天香| 日韩视频在线观看一区二区| 国产日韩一区二区三区在线播放| 精品51国产黑色丝袜高跟鞋| 免费视频亚洲| 亚洲专区一区二区三区| 91久久精品美女高潮| 国产精品成人av性教育| 亚洲免费人成在线视频观看| 欧美日韩一区二区三区在线| 在线看国产一区| 欧美日韩国产综合一区二区| 欧美精品乱码久久久久久按摩| 欧美精品www| 国产精品一区在线观看| 亚洲日本欧美| 在线视频中文亚洲| 欧美激情一区二区三区全黄| 国语自产精品视频在线看8查询8| 国产精品永久入口久久久| 国产亚洲精品自拍| 狠狠久久综合婷婷不卡| 久久久久久日产精品| 136国产福利精品导航网址| 久久亚洲精选| 国产欧美日韩专区发布| 亚洲电影在线观看| 99热免费精品在线观看| 国产情侣一区| 国产一区成人| 亚洲日本无吗高清不卡| 亚洲区一区二区三区| 欧美日韩国产美女| 亚洲在线视频一区| 在线观看视频一区二区欧美日韩| 亚洲一区二区三区中文字幕在线| 亚洲小视频在线观看| 一区二区三区 在线观看视频| 欧美激情片在线观看| 亚洲精品久久久久久久久久久久| 亚洲午夜一二三区视频| 久久精品国产一区二区三区免费看| 欧美成人网在线| 久久久av毛片精品| 久久亚洲春色中文字幕久久久| 国产午夜精品全部视频在线播放| 欧美黄色免费网站| 亚洲乱码精品一二三四区日韩在线| 亚洲综合电影一区二区三区| 欧美午夜视频| 国内揄拍国内精品久久| 日韩一级片网址| 最新国产乱人伦偷精品免费网站| 欧美一区二区三区视频免费播放| 狠狠色综合播放一区二区| 免费在线播放第一区高清av| 亚洲丰满在线| 国产一在线精品一区在线观看| 亚洲人成小说网站色在线| 红桃视频一区| 亚洲午夜影视影院在线观看| 欧美一区二区福利在线| 亚洲在线观看免费视频| 亚洲精品自在久久| 亚洲国产精品国自产拍av秋霞| 欧美综合二区| 国产一区二区三区av电影| 国产精品v一区二区三区| 狂野欧美性猛交xxxx巴西| 亚洲电影自拍| 在线看日韩av| 欧美在线免费观看亚洲| av成人国产| 99精品免费| 亚洲第一精品夜夜躁人人躁| 亚洲人成精品久久久久| 黑人巨大精品欧美一区二区| 久久中文字幕导航| 亚洲高清久久久| 亚洲欧美日韩视频一区| 欧美激情第一页xxx| 欧美精品日韩精品| 欧美精品一区二区蜜臀亚洲| 欧美国产视频在线| 1000精品久久久久久久久| 国产精品99久久99久久久二8| 另类亚洲自拍| 久久国产精品一区二区| 久久久99国产精品免费| 国产日韩一区二区三区| 亚洲日韩成人| 亚洲免费成人av| 欧美影院成年免费版| 欧美高清视频在线播放| 欧美在线一二三区| 亚洲欧美综合v| 亚洲永久精品大片| 亚洲免费中文| 欧美岛国在线观看| 欧美一级专区| 亚洲美女av网站| 亚洲午夜在线观看视频在线| 欧美电影在线| 久久国产精品99久久久久久老狼| 亚洲欧美日韩精品久久久| 欧美另类99xxxxx| 在线精品视频在线观看高清| 久久久五月天| 久久久91精品国产一区二区精品| 原创国产精品91| 久久综合九色综合久99| 永久免费毛片在线播放不卡| 一本久道久久综合婷婷鲸鱼| 午夜精品一区二区在线观看| 亚洲日本va在线观看| 欧美日本视频在线| 国产精品日韩在线播放| aa国产精品| 欧美视频三区在线播放| 国产精品腿扒开做爽爽爽挤奶网站| 国产精品视频观看| 一区二区日韩欧美| 国产女精品视频网站免费| 欧美日本韩国在线| 国产亚洲精品久久飘花| 国产自产在线视频一区| 国产噜噜噜噜噜久久久久久久久| 国产精品视频免费在线观看| 免费不卡中文字幕视频| 中文国产亚洲喷潮| 亚洲精品免费一区二区三区| 欧美日韩亚洲三区| 欧美在线不卡| 欧美日韩四区| 亚洲一区激情| 蜜臀av国产精品久久久久| 亚洲国产精品123| 国产精品一区二区你懂得| 欧美日韩免费一区二区三区| 久久久精品国产99久久精品芒果| 在线欧美三区| 激情综合五月天| 精品96久久久久久中文字幕无| 欧美伊人久久久久久久久影院| 一区二区三区四区五区视频| 欧美一区=区| 欧美视频日韩| 欧美精品一区在线发布| 欧美日韩国产成人在线观看| 在线播放日韩专区| 欧美大片免费观看在线观看网站推荐| 亚洲综合精品一区二区| 国产欧美1区2区3区| 精品91在线| 欧美日韩中文另类| 久久亚洲影音av资源网| 国产乱码精品一区二区三区av| 免费成人av| 欧美在线一级视频| 在线观看国产日韩| 欧美**字幕| 欧美精品国产精品| 久久久99国产精品免费| 红杏aⅴ成人免费视频| 午夜日韩视频| 国产精品视频免费观看| 亚洲一区二区三区乱码aⅴ| 久久看片网站| 亚洲一区二区三区色| 国产一区二区三区四区在线观看| 免费永久网站黄欧美| 免费亚洲婷婷| 销魂美女一区二区三区视频在线|