《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > 微軟亞研:對深度神經網絡中空間注意力機制的經驗性研究

微軟亞研:對深度神經網絡中空間注意力機制的經驗性研究

2019-04-16

空間注意力(Spatial Attention)機制最近在深度神經網絡中取得了很大的成功和廣泛的應用,但是對空間注意力機制本身的理解和分析匱乏。

論文:An Empirical Study of Spatial Attention Mechanisms in Deep Networks

鏈接:https://arxiv.org/abs/1904.05873


摘要:空間注意力(Spatial Attention)機制最近在深度神經網絡中取得了很大的成功和廣泛的應用,但是對空間注意力機制本身的理解和分析匱乏。本論文對空間注意力機制進行了詳盡的經驗性分析,取得了更深入的理解,有些認知是跟之前的理解很不一樣的,例如,作者們發現 TransformerAttention 中對 query 和 key 的內容進行比較對于空間注意力幫助很小,但對于 Encoder-Decoder Attention(編碼器-解碼器注意力)是至關重要的。另一方面,將可變形卷積(DeformableConvolution)與和 query 無關的 key saliency 進行適當組合可以在空間注意力中實現最佳的準確性-效率之間的權衡。本論文的研究結果表明,空間注意力機制的設計存在很大的改進空間。


引言

微信圖片_20190416160350.jpg

圖 1. 不同的注意力因子的描述。采樣點上方的顏色條表示其內容特征。當圖中存在內容特征或相對位置時,表明該項將它們用于注意力權重計算。


注意力機制使神經網絡能夠更多地關注輸入中的相關部分。自然語言處理(NLP)中最先研究了注意力機制,并開發了 Encoder-Decoder 模塊以幫助神經機器翻譯(NMT),當給定一個 query(例如,輸出句子中的目標詞),計算其輸出時,會依據 query 對某些 key 元素(例如,輸入句子中的源詞)進行優先級排序。后來空間注意力模塊被提出,用于建模句子內部的關系,此時 query 和 key 都來自同一組元素。重磅論文 Attention is All You Need 中提出了 TransformerAttention 模塊,大大超越了過去的注意力模塊。注意力建模在 NLP 中的成功,激發了其在計算機視覺領域中的應用,其中 Transformer Attention 的不同變體被應用于物體檢測和語義分割等識別任務,此時 query 和 key 是視覺元素(例如,圖像中的像素或感興趣的區域)。


在給定 query,確定分配給某個 key 的注意力權重時,通常會考慮輸入的三種特征:(1)query 的內容特征,可以是圖像中給定像素的特征,或句子中給定單詞的特征;(2)key 的內容特征,可以是 query 鄰域內像素的特征,或者句子中的另一個單詞的特征;(3)query 和 key 的相對位置。


基于這些輸入特征,在計算某對 query-key 的注意力權重時,存在四個可能的注意力因子:(E1)query 內容特征和 key 內容特征;(E2)query 內容特征和 query-key 相對位置;(E3)僅 key 內容內容特征;(E4)僅 query-key 相對位置。在 Transformer Attention 的最新版本 Transformer-XL 中,注意力權重表示為四項(E1,E2,E3,E4)的總和,如圖 1 所示。這些項依賴的屬性有所區別。例如,前兩個(E1,E2)對 query 內容敏感。而后兩者(E3,E4)不考慮 query 內容,E3 主要描述顯著的 key 元素,E4 主要描述內容無關的的位置偏差。盡管注意力權重可以基于這些因子被分解,但是這些因子之間的相對重要性尚未被仔細研究。此外,諸如可變形卷積和動態卷積(Dynamic Convolution)之類的流行模塊雖然看起來與 Transformer Attention 無關,但也采用了關注輸入的某些相關部分的機制。是否可以從統一的角度看待這些模塊以及它們的運行機制如何不同等問題也未被探索過。


這項工作將 Transformer Attention,可變形卷積和動態卷積視為空間注意力的不同實例(以不同注意力機制,涉及了注意力因子的不同子集)。為分析不同注意力機制和因子的影響,本文在廣義注意力形式下對比了不同的注意力機制的各種因素,該調查基于多種應用,包括神經機器翻譯,語義分割和物體檢測。本研究發現:(1)在 Transformer Attention 模塊中,對 query 敏感的項,尤其是 query 和 key 內容項 E1,在 Self Attention(自注意力)中起著微不足道的作用。但在 Encoder-Decoder Attention 中,query 和 key 內容項 E1 至關重要;(2)盡管可變形卷積僅利用基于 query 內容和相對位置項的注意力機制,但它在圖像識別方面比在 Transformer Attention 中對應的項 E2 更有效且高效;(3)在 Self Attention 中,query 內容和相對位置項 E2 以及僅考慮 key 內容的項 E3 是最重要的。將可變形卷積與 Transformer Attention 中僅考慮 key 內容的項 E3 進行適當組合會提供比 Transformer Attention 模塊更高的精度,且在圖像識別任務上具有低得多的計算開銷。


本文中的觀察挑戰了對當前空間注意力機制的傳統理解。例如,人們普遍認為,注意力機制的成功主要歸功于對 query 敏感的注意力項 E1 和 E2,尤其是 query 和 key 內容項 E1。這種理解可能源于最開始 Encoder-Decoder Attention 模塊在神經機器翻譯中的成功。事實上,在最近的一些變體,如 Non-Local 模塊和 Criss-Cross 模塊中,僅有 query 和 key 內容項 E1 得到保留,所有其他項都被丟棄。這些模塊在 Self Attention 應用中仍能很好地發揮作用,進而增強了這種理解。但是本文的研究表明這種理解是不正確的。本文發現這些僅具有 query 敏感項的注意力模塊實際上與那些僅具有 query 無關項的注意力模塊性能相當。本文的研究進一步表明,這種退化可能是源于注意力模塊的設計,而不是 Self Attention 的固有特征,因為可變形卷積被發現在圖像識別任務中能有效且高效地利用 query 內容和相對位置。


這一實證分析表明,深度網絡中空間注意力機制的設計還有很大的改進空間。本文的研究結果在這個方向上取得了一些初步進展,希望這項研究能夠激發關于建??臻g注意力中的運行機制的進一步研究。


廣義注意力形式


給定 query 元素和一組 key 元素,注意力函數根據注意力權重對 key 內容進行相應的聚合,其中注意力權重衡量了 query-key 的兼容性。為了允許模型處理來自不同特征子空間和不同位置的 key 內容,多個注意力函數的輸出依照一組可學習的權重進行線性組合。令 q 索引某內容特征為 z_q 的 query 元素,并且 k 索引具有內容特征 x_k 的 key 元素,最終輸出的注意力特征 y_q 被計算為:

微信圖片_20190416160415.png


表示第 m 個注意力函數中的注意力權重,key 元素遍歷區域Ω_q,W_m 和 W'm 是可學習權重。通常,注意力權重在Ω_q 內被標準化到和為 1。


在這個廣義注意力形式下,Transformer Attention 與可變形卷積、動態卷積的區別在如何計算 。Transformer 中 A_m 由 E1,E2,E3,E4 四項計算得到,形式為:

微信圖片_20190416160448.png


而可變形卷積的計算形式為(G 為雙線性插值函數):

微信圖片_20190416160502.png

 

動態卷積也可以在進行微小修改后納入廣義注意力形式,詳見論文。


Transformer Attention 中各項因子的對比

微信圖片_20190416160523.jpg

圖 2.TransformerAttention 中四項的準確性–效率權衡(E1 對應 key 和 query 內容,E2 對應 query 內容和相對位置,E3 對應于僅考慮 key 內容,E4 對應于僅考慮相對位置)。這里數字對應著每項是否被激活(例如,0011 表示 E3 和 E4 被激活,w/o 表示不采用 TransformerAttention)。由于 Encoder-Decoder Attention 機制對于 NMT 是必不可少的,因此(d)中沒有 w/o 設置。一些配置的結果在圖中重疊,因為它們具有相同的精度和計算開銷。研究中的關鍵配置以紅色突出顯示。圖中還畫出了本文中 Self Attention 的推薦配置「“0010 +可變形卷積”」。


(1)在 Self Attention 中,與和 query 無關項相比,query 敏感項起著很小的作用。特別是 query 和 key 內容項,該項對準確性的影響可忽略不計,而在圖像識別任務中計算量很大??偟膩碚f,Transformer Attention 模塊帶來的精度提升很大(從不帶 Transformer Attention 模塊的配置(「“w / o”」)到使用完整版 Transformer 注意力的配置(「“1111”」))。其中,query 無關項(從配置「“w / o”」到「“0011”」)帶來的收益比 query 敏感項(從配置「“0011”」到「“1111”」)帶來的收益大得多。特別地,query 和 key 內容項 E1 帶來的性能增益可以忽略不計。刪除它(從配置「“1111”」到「“0111”」)只會導致精度微弱下降,但能大大減少圖像識別任務中的計算開銷。


(2)在 Encoder-Decoder Attention 中,query 和 key 內容項是至關重要的。如果不用 E1 會導致精度明顯下降,而僅使用配置「“1000”「提供的精度幾乎與完整版本(配置「“1111”」)相同。這是因為 NMT 的關鍵步驟是對齊源語句和目標語句中的單詞。遍歷 query 和 key 內容對于這種對齊是必不可少的。


(3)在 Self Attention 中,query 內容及相對位置的項 E2 和僅有 key 內容項 E3 是最重要的。相應的配置「“0110”」提供的精度非常接近完整版(配置「“1111”」),同時在圖像識別任務中節省了大量的計算開銷。還值得注意的是,捕獲顯著性信息的僅有 key 內容項 E3 可以有效地提高性能,而幾乎沒有額外的開銷。


本文的研究結果與人們普遍認知相反,尤其是人們認為 query 敏感項,特別是 query 和 key 內容項對于 Transformer Attention 的成功至關重要。實驗結果表明,這僅適用于 Encoder-Decoder Attention 場景。在 Self Attention 場景中,query 和 k_ey 內容項甚至可以刪除。


可變形卷積和 Transformer Attention 中 E_2 的對比

微信圖片_20190416160545.jpg

圖 3. 可變形卷積和 Transformer Attention 中 E_2 的對比


(1)對于目標檢測和語義分割,可變形卷積在準確性和效率上都大大超過 E2 項。對于 NMT,可變形卷積在準確性和效率方面與 E2 項相當。在效率方面,可變形卷積不需要遍歷所有關鍵元素。這種優勢在圖像上是顯而易見的,因為涉及許多像素。在準確性方面,可變形卷積中的雙線性插值基于特征圖的局部線性假設。這種假設在圖像上比在語言上更好,因為圖像局部內容變化很緩慢,但語言中單詞會發生突然變化。


(2)可變形卷積與僅有 Key 內容項(「“0010 +可變形卷積”」)的組合提供了最佳的準確性 - 效率權衡。其準確性與使用可變形卷積和完整的 TransformerAttention 模塊(「“1111 +可變形卷積”」)相當,計算開銷略高于僅有可變形卷積的開銷(「“w/o +可變形卷積”」)。


動態卷積和 Transformer Attention 中 E_2 的對比

微信圖片_20190416160604.jpg

圖 4. 動態卷積和 Transformer Attention 中 E_2 的對比。二者都利用了 query 的內容信息和相對位置。在表的后四行中,E_2 的空間范圍也被限制到了一個固定大小,以進一步揭示其和動態卷積的區別。


(1)在機器翻譯中,動態卷積和 Transformer Attention 的 E_2 項性能相當,且動態卷積計算量較低。但在物體檢測和語義分割中,動態卷積比 E_2 性能顯著下降。


(2)在對 E_2 限制空間范圍與動態卷積和卷積核一致后,隨著卷積核縮小,動態卷積和 Transformer Attention E_2 的性能都有所下降,但是 E_2 還是比動態卷積性能好且計算量更低。動態卷積在圖片識別任務上表現欠佳的可能原因是該模塊的許多細節是為了機器翻譯設計的,可能不適用于圖像識別任務。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美一区1区三区3区公司| 久久国产福利| 香蕉视频成人在线观看| 亚洲国产美女精品久久久久∴| 狠狠色综合网| 在线亚洲精品| 一区视频在线播放| 欧美三级午夜理伦三级中文幕| 亚洲伦理在线免费看| 国内精品久久久久久久影视蜜臀| 亚洲欧美日韩国产成人| 亚洲另类自拍| 国产精品日韩精品欧美在线| 一本一本久久a久久精品牛牛影视| 欧美日韩国产综合网| 久色婷婷小香蕉久久| 在线观看成人一级片| 欧美人成在线视频| 欧美成人嫩草网站| 麻豆九一精品爱看视频在线观看免费| 国产伦精品一区二区三区在线观看| 亚洲视频在线一区观看| 亚洲精品日韩综合观看成人91| 一区二区三区精密机械公司| 蜜桃av噜噜一区二区三区| 欧美日韩在线精品| 亚洲美女福利视频网站| 亚洲一区二区三区四区五区黄| 久久九九久久九九| 国产欧美日韩三级| 亚洲国产日韩美| 亚洲视频免费看| 午夜欧美精品久久久久久久| 欧美在线视频观看| 欧美精品自拍偷拍动漫精品| 国产自产女人91一区在线观看| 一区二区视频免费完整版观看| 国产一区二区三区高清| 亚洲一区在线播放| 亚洲大片av| 国产视频久久久久久久| 一本久久综合| 亚洲高清成人| 欧美在线一级va免费观看| 久久精品国产精品亚洲综合| 国产精品99久久久久久久女警| 免费不卡欧美自拍视频| 亚洲激情网站免费观看| 国内免费精品永久在线视频| 亚洲在线免费观看| 欧美国产日韩一二三区| 亚洲影院高清在线| 国产偷自视频区视频一区二区| 黑人巨大精品欧美一区二区小视频| 日韩午夜在线| 欧美性久久久| 欧美视频精品一区| 欧美日韩不卡合集视频| 久久免费视频网站| 欧美性久久久| 久久精品国产久精国产爱| 久久精品国产免费| 欧美日韩亚洲视频| 久久一区二区三区四区| 在线成人中文字幕| 美女免费视频一区| 欧美三级视频在线观看| 黑丝一区二区三区| 久久激情视频久久| 日韩亚洲欧美在线观看| 激情欧美日韩一区| 激情欧美一区二区三区| 狠狠色狠狠色综合日日91app| 久久久蜜桃精品| 狠狠色狠狠色综合日日小说| 午夜在线a亚洲v天堂网2018| 欧美成人国产va精品日本一级| 国产精品久久久久久久7电影| 亚洲午夜在线观看视频在线| 亚洲欧美激情视频在线观看一区二区三区| 亚洲成色777777在线观看影院| 亚洲国产清纯| 亚洲国产美女| 国产日韩欧美中文在线播放| 美女精品国产| 激情综合激情| 欧美三级乱人伦电影| 亚洲韩国青草视频| 欧美精品日韩一本| 国产欧美一区在线| 亚洲激情在线观看| 国产精品一区久久| 欧美在线一区二区| 久久久久久久一区| 亚洲欧美卡通另类91av| 99在线|亚洲一区二区| 鲁大师影院一区二区三区| 伊人久久亚洲影院| 亚洲国产精品高清久久久| 激情综合五月天| 久久综合狠狠| 在线免费观看日本欧美| 欧美精品一区二| 欧美小视频在线| 久久精品人人做人人综合| 国产一区二区三区日韩欧美| 欧美日韩一区视频| 国产欧美日韩综合一区在线观看| 欧美日韩成人在线| 亚洲欧美国内爽妇网| 国产亚洲在线| 影音先锋亚洲一区| 国产精品久久久久久久久动漫| 国产精品视频99| 国产精品99免视看9| 亚洲久久在线| 欧美日韩国产在线观看| 亚洲一区二区精品在线| 国产精品亚洲人在线观看| 欧美日韩不卡| 国产精品美女久久久久久2018| 亚洲大黄网站| 欧美精品久久一区二区| 欧美激情aaaa| 国产亚洲电影| 国产视频一区欧美| 亚洲一区bb| 鲁鲁狠狠狠7777一区二区| 亚洲视频播放| 国产精品久久久久久久久动漫| 精品电影一区| 亚洲中字在线| 亚洲毛片av| 国产精品麻豆va在线播放| 日韩视频一区二区| 亚洲美女淫视频| 欧美成人免费va影院高清| 欧美日韩一二三区| 久久久美女艺术照精彩视频福利播放| 欧美精品aa| 久久精品国产99国产精品澳门| 国产精品久久久久天堂| 久久99在线观看| 国产精品mm| 久久精品一区| 国产欧美精品xxxx另类| 欧美高清视频免费观看| 久久久久91| 国产精品视频一区二区三区| 欧美日韩免费观看一区| 欧美一区二区视频网站| 一级日韩一区在线观看| 一区二区三区 在线观看视| 久久av老司机精品网站导航| 99re热精品| 99re6热在线精品视频播放速度| 国产精品高清网站| 樱桃国产成人精品视频| 日韩午夜在线电影| 欧美日韩免费在线视频| 韩国女主播一区二区三区| 亚洲国产精品激情在线观看| 日韩午夜三级在线| 久久久国产一区二区| 在线亚洲欧美专区二区| 久久精品理论片| 欧美日韩国语| 欧美日韩精品久久久| 欧美成在线观看| 欧美jizz19hd性欧美| 欧美精品成人91久久久久久久| 樱花yy私人影院亚洲| 国产亚洲欧美另类中文| 亚洲女同在线| 亚洲国产三级网| 亚洲激情图片小说视频| 国产日韩精品视频一区二区三区| 在线观看亚洲视频| 国产精品日韩电影| 久久久久久久久岛国免费| 亚洲高清视频的网址| 一本色道久久综合亚洲精品高清| 亚洲欧美日韩在线| 中文日韩在线视频| 国产精品高清在线观看| 欧美日韩亚洲一区在线观看| 国产伦精品一区二区三区在线观看| 黄色亚洲在线| 久久久久国产精品www| 久久九九全国免费精品观看| 一区二区亚洲精品| 国产亚洲精品成人av久久ww| 欧美一区二区三区视频免费| 欧美日韩国产影片| 欧美aa在线视频| 在线观看的日韩av| 国产乱理伦片在线观看夜一区| 亚洲第一天堂av| 久久精品国产第一区二区三区| 国产一本一道久久香蕉| 亚洲精品一线二线三线无人区| 欧美一站二站| 久久天天躁夜夜躁狠狠躁2022| 欧美v日韩v国产v| 国产亚洲精品资源在线26u| 久久精品二区三区| 亚洲综合色婷婷| 欧美高清日韩| 亚洲另类黄色| 一区二区三区日韩欧美精品| 在线日韩精品视频| 国产精品一区二区视频| 欧美影院成人| 亚洲一区精品视频| 久久成人精品一区二区三区| 香蕉视频成人在线观看| 国产精品五月天| 亚洲网站啪啪| 欧美视频免费在线| 美女脱光内衣内裤视频久久网站| 狠狠色噜噜狠狠狠狠色吗综合| 一区二区三区精品国产| 国内精品视频666| 日韩午夜av电影| 亚洲精品国精品久久99热一| 久久国产精品72免费观看| 久久久噜噜噜久久久| 国产精品永久免费在线| 亚洲精品欧美极品| 国产精品亚洲欧美| 性欧美videos另类喷潮| 性欧美videos另类喷潮| 亚洲女与黑人做爰| 欧美精品一区二区蜜臀亚洲| 欧美人成在线| 久久人人97超碰人人澡爱香蕉| 欧美v日韩v国产v| 久久成人久久爱| 欧美人与性动交α欧美精品济南到| 欧美日韩大陆在线| 悠悠资源网亚洲青| 欧美日韩中文字幕日韩欧美| 欧美精品xxxxbbbb| 女同性一区二区三区人了人一| 亚洲国产经典视频| 欧美日韩一区二| 亚洲一本视频| 亚洲国产欧美日韩另类综合| 欧美国产极速在线| 欧美激情在线免费观看| 亚洲欧美一区二区三区在线| 欧美精品一区视频| 亚洲自啪免费| 欧美视频在线观看| 亚洲小少妇裸体bbw| 销魂美女一区二区三区视频在线| 在线亚洲电影| 亚洲欧美三级伦理| 亚洲一卡二卡三卡四卡五卡| 久久日韩精品| 欧美精品乱人伦久久久久久| 亚洲一级在线观看| 免费在线播放第一区高清av| 国产精品欧美精品| 欧美激情精品久久久久久久变态| 国产一区二区三区在线免费观看| 久久成人精品| av成人免费在线| 午夜精品美女久久久久av福利| 裸体女人亚洲精品一区| 国产一区二区三区成人欧美日韩在线观看| 欧美日韩亚洲国产一区| 国产自产2019最新不卡| 亚洲女同同性videoxma| 国产伦精品一区二区三区高清版| 午夜精品久久一牛影视| 欧美亚洲一级片| 久久久福利视频| 欧美日韩高清在线观看| 午夜日韩激情| 最新国产精品拍自在线播放| 亚洲欧美另类在线| 国产啪精品视频| 欧美一区视频在线| 欧美精品久久久久久| 在线免费观看视频一区| 欧美性大战久久久久久久| 国产日韩专区| 欧美大片91| 国产啪精品视频| 久久se精品一区二区| 亚洲网站在线播放| 激情婷婷久久| 亚洲五月六月| 理论片一区二区在线| 在线观看亚洲精品视频| 伊人久久噜噜噜躁狠狠躁| 欧美日韩xxxxx| 欧美性猛交99久久久久99按摩| 国产精品欧美激情| 一区二区在线不卡| 亚洲在线国产日韩欧美| 亚洲免费大片| 美女图片一区二区| 国产精品试看| 欧美一区二区视频观看视频| 久久综合久色欧美综合狠狠| 国产综合av| 国产精品青草久久久久福利99| 亚洲综合色自拍一区| 亚洲欧美日韩中文在线制服| 亚洲大胆美女视频| 久久夜色精品| 美女视频一区免费观看| 日韩一级精品| 99国产精品私拍| 欧美视频在线免费看| 久久爱www久久做| 国产精品蜜臀在线观看| 久久xxxx精品视频| 国产精品视频xxx| 亚洲欧美精品| 国产丝袜美腿一区二区三区| 99精品视频免费全部在线| 亚洲精品欧洲精品| 久久久国产精彩视频美女艺术照福利| 日韩视频精品在线观看| 欧美一区二区在线看|