《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業界動態 > 微軟推出全新通用預訓練方法——MASS,效果比 BERT 和 GPT 更好?

微軟推出全新通用預訓練方法——MASS,效果比 BERT 和 GPT 更好?

2019-06-28
關鍵詞: 微軟 BERT GPT

  據報道:自 2018 年以來,預訓練無疑是自然語言處理(NLP)領域中最熱門的研究課題之一。通過利用 BERT、GPT 和 XLNet 等通用語言模型,該領域的研究者們在自然語言理解方面已經取得了許多重大的突破。然而,對于序列到序列的自然語言生成任務,這些主流的預訓練方法并沒有帶來顯著的改進,對此,微軟亞洲研究院提出了一個全新的通用預訓練方法——MASS,在該任務中可以得到比 BERT 和 GPT 更好的效果。

  前言

  BERT 和 XLNet 在自然語言理解任務(例如:情感分類、自然語言推理和 SQuAD 閱讀理解)方面取得了巨大成功。然而, NLP 領域除了自然語言理解任務之外,還存在很多序列到序列的語言生成任務,例如機器翻譯、文本摘要生成、對話生成、問答、文本風格轉換等。對于這些任務,使用編碼器-注意力-解碼器框架是主流方法。

5d141b3156872-thumb.png

  圖 1 編碼器 - 注意力 - 解碼器框架

  如圖 1 所示,編碼器將源序列 X 作為輸入并將其轉換為隱藏表示的序列,然后解碼器通過注意力機制從編碼器中抽象出隱藏表示的序列信息,并自動生成目標序列文本 Y。

  BERT 和 XLnet 通常是對一個編碼器進行自然語言理解的預訓練;而 GPT 則是對一個解碼器進行語言建模的預訓練。當利用 BERT 和 GPT 進行序列到序列的語言生成任務時,我們通常需要對編碼器和解碼器分別進行預訓練。在這種情況下,編碼器 - 注意力 - 解碼器框架和注意力機制并沒有得到聯合訓練。然而,注意力機制在這類任務中極為重要,一旦缺失便會導致 BERT 和 GPT 無法達到最佳性能。

  一種新的預訓練方法

  針對序列到序列的自然語言生成任務,微軟亞洲研究院的機器學習小組提出了一種新的預訓練方法,即掩蔽的序列到序列預訓練(MASS:Masked Sequence to Sequence Pre-Training)。MASS 隨機掩蔽一個長度為 k 的句子片段,并通過編碼器 - 注意力 - 解碼器框架預測這一被掩蔽的片段。

2.png

  圖 2 MASS 框架

  如圖 2 所示,編碼器端的第 3-6 個標記被掩蔽,而在解碼器端,僅有被掩蔽的標記被預測出來,而其他標記則被掩蔽。

  MASS 預訓練具有以下優勢:

  解碼器端的其他標記(在編碼器端未被掩蔽的標記)被掩蔽,從而推動解碼器提取更多信息以幫助預測連續句子片段,促進編碼器-注意力-解碼器結構的聯合訓練;

  為了給解碼器提供更多有用的信息,編碼器被強制提取未被掩蔽的標記的含義,這可以提高編碼器理解源序列文本的能力;

  解碼器被設計用以預測連續的標記(句子片段),這可以提升解碼器的語言建模能力。

  統一的預訓練框架

  MASS 有一個重要的超參數 k(被掩蔽的片段的長度)。通過調整 k 值,MASS 可以將 BERT 中掩蔽的語言建模和 GPT 中的標準語言建模結合起來,從而將 MASS 擴展成一個通用的預訓練框架。

  當 k = 1 時,根據 MASS 的設計,編碼器端的一個標記被掩蔽,而解碼器端則會預測出該掩蔽的標記,如圖 3 所示。解碼器端沒有輸入信息,因而 MASS 等同于 BERT 中掩蔽的語言模型。

3.png

  圖 3 k = 1時,編碼器端一個標記被掩蔽,而解碼器端則會預測出該掩蔽的標記

  當 k = m(m 是序列的長度)時,在 MASS 中,編碼器端的所有標記都被掩蔽,而解碼器端會預測所有的標記,如圖 4 所示。解碼器端無法從編碼器端提取任何信息,MASS 等同于 GPT 中的標準語言模型。

4.png

  圖 4 k = m 時,編碼器端的所有詞都被掩蔽,而解碼器端會預測所有的標記,等同于 GPT 中的標準語言模型

  不同 k 值下 MASS 的概率公式如表 1 所示,其中 m 是序列的長度,u 和 v 分別是掩蔽片段的起始和終止位置,代表從位置 u 到 v 的標記都被掩蔽的序列??梢钥闯?,當 k = 1 或 m 時,MASS 的概率公式等同于 BERT 中的被掩蔽的語言模型和 GPT 中的標準語言模型。

  表 1 在不同 k 值下 MASS 的概率公式

  研究人員通過實驗來分析了在不同 k 值下的 MASS 性能,如圖 5 所示:

5.png

  圖 5 在訓練前和微調階段的各種掩蔽長度 k 下 MASS 的表現,其中包括 a) 英語句子預訓練模型的PPL b) WMT13 英語-法語翻譯的法語句子 c) WMT13 無監督英語-法語翻譯的 BLEU 值 d) 文本摘要生成的 ROUGE 值 e) 對話生成的PPL

  當 k 等于句子長度的一半時,下游任務可以達到其最佳性能。掩蔽句子中一半的詞可以很好地平衡編碼器和解碼器的預訓練部分。如果預訓練更偏向編碼器端(k = 1,即 BERT)或更偏向解碼器端(k = m,LM / GPT),則無法實現最優的性能,這也表現出了 MASS 在序列到序列的語言生成任務中的優勢。

  序列到序列的語言生成任務測試

  預訓練

  值得注意的是,MASS 僅需要無監督的單語數據進行預訓練(例如 WMT News Crawl Data、Wikipedia Data 等)。MASS 支持跨語言任務(例如機器翻譯)和單語任務(例如文本摘要生成、對話生成)。在對英語-法語翻譯等跨語言任務進行預訓練時,研究人員可以在一個模型中同時進行英語-英語和法語-法語的預訓練,并使用附加的語言嵌入向量來區分語言。在無監督的機器翻譯、低資源機器翻譯、文本摘要生成和對話生成四個領域,研究人員對 MASS 進行了微調,以驗證其有效性。

  無監督機器翻譯

  關于無監督機器翻譯任務,研究人員將 MASS 與之前的方法進行了比較,包括以前最先進的方法 Facebook XLM。XLM 使用了由 BERT 創建的掩蔽預訓練語言模型,以及標準語言模型來分別預訓練編碼器和解碼器。

  結果如表 2 所示,MASS 在 WMT14 英語-法語、WMT16 英語-德語和英語-羅馬尼亞語的六個翻譯方向上的表現都優于 XLM,并取得了最新的最優結果。

6.png

  表 2 MASS 與之前關于無監督機器翻譯方法之間的比較;英語-法語翻譯報道在 newstest2014 上,其它的在 newstest2016 可以找到;由于 XLM 在編碼器和解碼器中使用 MLM 和 CLM 的不同組合,因此報告上顯示的是每個語言對上 XLM 的最高 BLEU 值

  低資源機器翻譯

  低資源機器翻譯是指使用有限的雙語訓練數據來進行機器翻譯。研究人員模擬了 WMT14 英語-法語,WMT16 英語-德語和英語-羅馬尼亞語翻譯(分別為 10K,100K 和 1M 雙語數據)的低資源情景。

7.png

  圖 6 MASS 與低資源機器翻譯方法之間的比較

  圖 6 顯示 MASS 在不同數據規模上的表現,均比不用預訓練的基線模型有不同程度的提升,并隨著監督數據越少,提升效果越顯著。

  文本摘要生成

  研究人員將 MASS 與 BERT+LM(編碼器用 BERT 預訓練,解碼器用標準語言模型 LM 預訓練)、DAE(去噪自編碼器)進行了比較。從表 3 中可以看出,MASS 的表現都優于 BERT+LM 和 DAE。

5d141b31dd221-thumb.png

  表 3 文本摘要生成任務中,MASS 和兩種預訓練方法之間的比較

  對話生成

  研究人員將 MASS 和 BERT+LM 進行了比較。表 4 顯示 MASS 實現了比 BERT+LM 更低的 PPL。

9.png

  表 4 MASS 與 BERT+LM 之間的比較數據

  MASS 連續在序列到序列的語言生成任務上實現顯著增益,Facebook 的研究者表示,期待今后在自然語言理解任務中測試 MASS 的性能,并希望在未來的工作中,將 MASS 的應用領域擴展到包含語音、視頻等其它序列到序列的生成任務中。

  

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          日韩午夜一区| 国产在线观看精品一区二区三区| 久久美女性网| 欧美日韩一区二区三| 国产精品一区二区三区成人| 欧美深夜影院| 亚洲专区欧美专区| 久久久.com| 欧美激情亚洲自拍| 精品不卡一区二区三区| 国产日韩欧美自拍| 欧美三级在线视频| 女人天堂亚洲aⅴ在线观看| 久久精品人人爽| 亚洲黄色免费网站| 欧美成人一区二区| 国产日韩欧美精品| 亚洲天堂av在线免费| 韩日欧美一区二区三区| 亚洲无线一线二线三线区别av| 亚洲小说区图片区| 99在线精品视频| 欧美日韩一区二区在线观看视频| 国内精品久久久久影院薰衣草| 一本色道**综合亚洲精品蜜桃冫| 亚洲精选在线| 久久在线视频在线| 亚洲欧美在线免费| 国模叶桐国产精品一区| 亚洲欧洲日本专区| 亚洲免费综合| 国产亚洲精品久久久久久| 欧美日韩亚洲一区二区三区在线观看| 亚洲欧美日韩另类| 夜夜躁日日躁狠狠久久88av| 欧美激情一区在线观看| 国内精品久久久久国产盗摄免费观看完整版| 亚洲国产一成人久久精品| 国内视频一区| 亚洲精品在线免费观看视频| 影音国产精品| 影音先锋日韩精品| 久久天堂av综合合色| 国产一区视频网站| 亚洲国产精品黑人久久久| 亚洲欧美日韩精品久久奇米色影视| 亚洲国产日韩欧美一区二区三区| 国产精品福利在线观看网址| 在线视频一区观看| 一区二区三区福利| 免费成人av在线看| 久久精品一区蜜桃臀影院| 亚洲激情影院| 久久字幕精品一区| 91久久精品久久国产性色也91| 午夜精品久久久久久久久久久久| 国产精品入口日韩视频大尺度| 欧美中日韩免费视频| 久久夜色精品国产欧美乱极品| 在线一区二区三区四区| 欧美激情偷拍| 一区二区三区福利| 亚洲国产精品一区二区久| 国产综合视频| 亚洲日本免费电影| 亚洲日本久久| 国产精品久久久久久久免费软件| 韩国成人福利片在线播放| 亚洲人成在线播放网站岛国| 亚洲激情第一页| 激情久久综艺| 欧美日韩播放| 久久黄色网页| 另类图片综合电影| 亚洲电影下载| 欧美亚洲成人网| 久久se精品一区二区| 中文av一区二区| 欧美日韩精品在线视频| 欧美精品一级| 国产欧美日韩在线播放| 精品成人一区二区| 国产欧美日韩精品丝袜高跟鞋| 欧美午夜性色大片在线观看| 亚洲视频一区二区在线观看| 在线观看视频欧美| 欧美高清一区二区| 欧美国产一区二区在线观看| 亚洲免费高清视频| 日韩亚洲欧美成人一区| 先锋影音国产精品| 一区二区三区在线高清| 亚洲伊人一本大道中文字幕| 在线观看亚洲精品视频| 亚洲欧洲日本专区| 国产日产欧美a一级在线| 久久野战av| 在线中文字幕一区| 亚洲视频免费| 亚洲午夜视频在线| 午夜亚洲性色视频| 在线播放中文字幕一区| 亚洲国产精品成人va在线观看| 久久躁狠狠躁夜夜爽| 国产精品亚洲不卡a| 美女图片一区二区| 亚洲一区影院| 欧美日韩视频第一区| 久久性天堂网| 在线观看亚洲精品视频| 香蕉亚洲视频| 国产一区二区av| 亚洲免费在线电影| 久久精品视频在线观看| 国产精品美女主播在线观看纯欲| 久久综合久久综合这里只有精品| 欧美激情精品久久久久久免费印度| 亚洲男人第一网站| 精品二区久久| 欧美~级网站不卡| 国产日韩精品一区观看| 亚洲美女视频网| 在线中文字幕不卡| 久热国产精品视频| 99国内精品| 久久资源av| 黑人一区二区三区四区五区| 欧美日本三级| 欧美区在线播放| 亚洲国产精品成人久久综合一区| 影音先锋久久资源网| 久久最新视频| 亚洲女同在线| 亚洲激情av在线| 欧美在线亚洲在线| 国产精品jizz在线观看美国| 欧美日韩国产丝袜另类| aa日韩免费精品视频一| 一区二区三区四区五区精品视频| 亚洲国产电影| 久热这里只精品99re8久| 欧美一区二区三区在线看| 欧美激情精品久久久久久变态| 欧美日韩mv| 亚洲综合电影| 娇妻被交换粗又大又硬视频欧美| 国产日韩一级二级三级| 亚洲国产91精品在线观看| 久久精品视频在线看| 免费中文字幕日韩欧美| 免费成人高清在线视频| 国内精品亚洲| 伊人婷婷久久| 国产日韩欧美一区二区| 欧美成人首页| 欧美日韩一区国产| 亚洲精品在线一区二区| 日韩午夜电影在线观看| 国产视频久久久久久久| 国产精品成人aaaaa网站| 国产精品久久国产精麻豆99网站| 亚洲黑丝在线| 看片网站欧美日韩| 美国三级日本三级久久99| 国产精品人人爽人人做我的可爱| 欧美日韩亚洲一区二| 久久久久久免费| 欧美日韩在线免费视频| 一区免费观看视频| 欧美在线观看日本一区| 亚洲国产视频直播| 亚洲一区二区三区在线看| 狠狠色狠狠色综合人人| 免费中文字幕日韩欧美| 亚洲福利视频网站| 一区二区三区在线免费视频| 91久久夜色精品国产网站| 欧美精品一区二区三区视频| 亚洲精品一区二| 久久精品国产69国产精品亚洲| 亚洲经典自拍| 久久免费99精品久久久久久| 91久久精品国产91久久性色| 久久美女性网| 老司机午夜精品视频在线观看| 91久久精品国产91久久| 一区二区三区国产在线| 亚洲二区在线视频| 免费一级欧美片在线观看| 欧美精品一区二区三区在线看午夜| 亚洲国产成人久久| 欧美成人按摩| 亚洲毛片播放| 欧美高清不卡在线| 在线看片一区| 欧美日韩三级一区二区| 久久久久一本一区二区青青蜜月| 国产日韩欧美三区| 久久久av网站| 欧美日韩一区自拍| 亚洲欧美日韩直播| 欧美成人一区二区三区在线观看| 亚洲综合国产激情另类一区| 亚洲视频网站在线观看| 亚洲精品一区二区三区在线观看| 欧美日韩精品欧美日韩精品| 在线看片第一页欧美| 欧美日韩一区二区在线观看| 美乳少妇欧美精品| 欧美一区观看| 亚洲女ⅴideoshd黑人| 国产美女精品在线| 亚洲一区二区在线免费观看| 亚洲人午夜精品| 午夜精品视频在线观看一区二区| 91久久精品一区| 亚洲毛片一区二区| 国产精品一国产精品k频道56| 欧美精品一卡| 麻豆国产精品777777在线| 亚洲麻豆视频| 欧美电影免费| 国产欧美视频一区二区| 一本久道综合久久精品| 欧美一区二区免费| 亚洲精品少妇30p| 国产日韩综合一区二区性色av| 国产精品一二三视频| 亚洲裸体视频| 欧美日韩亚洲精品内裤| 亚洲国产成人精品视频| 亚洲三级毛片| 激情婷婷亚洲| 黄色成人小视频| 国产在线精品二区| 欧美人与性禽动交情品| 国产精品多人| a91a精品视频在线观看| 亚洲一区国产一区| 亚洲一区在线观看视频| 亚洲综合日韩在线| 韩国一区二区三区美女美女秀| 亚洲欧美另类中文字幕| 亚洲另类春色国产| 国产伦精品一区二区三区视频黑人| 美女视频一区免费观看| 欧美午夜国产| 99热这里只有成人精品国产| 欧美大片在线看免费观看| 国产美女在线精品免费观看| 久久久国产午夜精品| 亚洲国产精品t66y| 亚洲人成网站999久久久综合| 亚洲国产高清aⅴ视频| 欧美日韩国产999| 国产日韩在线看片| 亚洲欧美高清| 国产区亚洲区欧美区| 欧美成人网在线| 亚洲第一天堂av| 欧美视频中文字幕| 一区二区三区久久精品| 亚洲国产另类久久精品| 久久亚洲美女| 国产精品视频久久一区| 亚洲私人影院在线观看| 欧美日韩一区综合| 亚洲免费精彩视频| 亚洲另类一区二区| 国产热re99久久6国产精品| 亚洲欧美在线观看| 欧美系列一区| 宅男噜噜噜66一区二区| 在线观看日韩精品| 亚洲影院在线观看| 欧美在线播放| 裸体素人女欧美日韩| 亚洲一区在线观看免费观看电影高清| 免费成人黄色片| 亚洲人人精品| 欧美理论电影在线观看| 久久综合电影| 久久久99国产精品免费| 欧美国产日本| 日韩视频免费在线观看| 欧美日韩一区视频| 亚洲高清精品中出| 国产在线观看91精品一区| 国产女主播视频一区二区| 国产精品网站在线播放| 国产精品爱啪在线线免费观看| 欧美一区二区视频在线观看2020| 国产欧美欧美| 亚洲美女视频| 亚洲大片免费看| 日韩一区二区久久| 亚洲午夜久久久久久久久电影院| 亚洲欧美视频在线观看视频| 国产精品家教| 亚洲欧美日韩专区| 免费在线观看一区二区| 午夜精品一区二区三区在线视| 亚洲三级视频在线观看| 久久人人九九| 男女精品视频| 在线观看亚洲视频啊啊啊啊| 国产在线高清精品| 国产精品久久久久免费a∨大胸| 国产欧美日韩视频一区二区三区| 亚洲欧美中文在线视频| 在线观看av一区| 亚洲精品综合久久中文字幕| 伊人精品视频| 亚洲高清视频的网址| 国产精品超碰97尤物18| 国产精品乱码妇女bbbb| 日韩亚洲欧美一区二区三区| 国产麻豆9l精品三级站| 欧美女同在线视频| 久久精品国产96久久久香蕉| 蜜臀av性久久久久蜜臀aⅴ| 久久久夜色精品亚洲| 国产精品区免费视频| 一区二区不卡在线视频 午夜欧美不卡在| 极品尤物一区二区三区| 欧美一区二区网站| 国产精自产拍久久久久久| 亚洲精品视频二区|