《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 32分鐘訓練神經機器翻譯,速度提升45倍

32分鐘訓練神經機器翻譯,速度提升45倍

2018-09-10

深度模型的訓練時間通常對研究者而言都是很大的挑戰,我們需要花數小時甚至數天才能知道某個小改進到底好不好。然而如果我們從一開始就考慮降低模型訓練時間,那么很多概念都能迅速驗證。在 Facebook 開發者的試驗中,他們采用了低精度和大批量等一系列加速訓練方法,并成功地將需要 24 小時訓練的 NMT 降低到 32 分鐘。該項目相關的分布式訓練代碼已開源。


項目地址:https://github.com/pytorch/fairseq

微信圖片_20180910214226.gif


我們想讓用戶用自己喜歡的語言體驗我們的產品,同時與世界各地的人們建立聯系。為此,我們使用神經機器學習(NMT)自動翻譯帖子和內容中的文本。我們之前關于這一課題的研究 fairseq 已經開源,這是一個序列到序列的學習庫,可供任何人訓練 NMT 模型,完成自動摘要或其他文本生成任務。


隨著 NMT 模型在從大規模單語數據(只有一種語言的數據)中的學習越來越成功,訓練速度變得越來越重要。為了適應這樣的發展,我們必須想辦法大大減少訓練時間。直到最近,NMT 模型的這種訓練在單臺機器上還需要數周,對于快速實驗和部署來說,這一速度實在太慢。


由于在精度和訓練設置上做了幾項改變,我們在短短 32 分鐘內就能訓練一個強大的 NMT 模型(參見《Scaling Neural Machine Translation》),速度是原來的 45 倍(原來需要 24 小時)。在之后的一項研究《Understanding Back-Translation at Scale》中,我們展示了這一速度大幅提升的訓練設置如何讓我們利用單語文本訓練準確得多的模型。


《Scaling Neural Machine Translation》:https://arxiv.org/abs/1806.00187

《Understanding Back-Translation at Scale》(EMNLP 2018):https://arxiv.org/abs/1808.09381


加速訓練


我們首先在一臺配備 8 塊 Volta GPU 的英偉達 DGX-1 機器上把模型的訓練時間從近 24 小時縮減至不到 5 小時。神經網絡包含數百萬個參數,這些參數在訓練過程中會被調整并通常以 32 位浮點精度存儲。然后,我們把訓練的精度從 32 位轉換為 16 位,這樣不僅能減少 GPU 內存占用,還讓我們能夠使用英偉達最新 Volta GPU 架構提供的經過高度優化的 Tensor Core。降低了精度(16 位)的訓練有時會由于浮點「溢出」而導致模型質量降低。在本研究中,我們實施了一個已知的自動監控和防止溢出程序,并將訓練時間從近 24 小時減至 8.25 小時,速度提升 2.9 倍而沒有降低模型質量。


接下來,我們通過所謂的累積更新,延遲了模型更新來減少 GPU 之間的通信。通過同步訓練模型,從而每個 GPU 可以維持一個完整、相同的模型副本,但是會處理訓練數據的不同部分。處理時需要反向傳播——在網絡上被分為 forward pass 和 backward pass(前向/反向),以計算訓練模型所需的統計量。在處理每個小批量(mini-batch),GPU 會同步地相互交流結果(梯度)。這樣可能導致效率低下:首先,在 GPU 之間發送數據會消耗時間;其次,處理較快的工作站必須等待速度較慢的工作站(即所謂散兵游勇),然后訓練才能繼續。


后者對于文本相關模型來說是一大挑戰,不同的句子長度會使這個問題更加嚴重。我們對這兩個問題的解決方案是在工作線程互相通信之前,讓每個工作線程處理并累積多個小批量的結果,從而延遲同步點。這將訓練時間縮減至 7.5 小時,且無損模型質量。


累積更新還能增加有效的批大小,即每一個訓練步所使用的數據量。在我們的研究設置中,批大小增大為 16 倍。這使得學習率可以翻倍,訓練時間減少到 5.2 個小時,比原始系統實現了 4.6 倍的加速。


圖:通過 (i) 減少工作站之間的通信、(ii) 減少不同 GPU 的工作負載變化從而節約閑置時間,累加多個前向/反向步驟的梯度,實現訓練加速。

微信圖片_20180910214254.jpg

最后,我們使用 16 位浮點數來進一步提高每一個工作站的批大小,從而利用釋放出的額外 GPU 內存。通過將每個工作站的批大小從 3.5K 單詞提升到 5K 單詞,該研究將總訓練時間減少到 4.9 個小時,對原始系統實現了 4.9 倍的加速。


擴展


我們對單個機器訓練的優化還可應用于在多個機器上進行并行訓練(即分布式訓練)。我們將訓練從單個 DGX-1 機器擴展到 16 個機器(即 128 塊 GPU),發現可以在 37 分鐘內訓練完成同樣的模型,與原始的單機器設置相比,速度提升了 38.6 倍。


在多個機器上訓練時,另一個優化是同時發生 GPU 通信和反向傳播。在反向傳播之后,我們將所有信息傳達給其他工作站。典型情況下,反向傳播和通信按順序執行,但是我們通過盡可能并行 GPU 通信和反向傳播而節省時間。具體來說,我們在反向傳播步驟結束后立刻開始在多個工作站之間同步梯度。這樣 GPU 通信和反向傳播發生就實現了并行,這節省了 14% 的訓練時間,且使總訓練時間從將近 24 個小時下降到 32 分鐘,速度提升了 44.7 倍。

微信圖片_20180910214342.jpg

圖:反向傳播與梯度同步的并行示意圖。

微信圖片_20180910214407.jpg

圖:每次改進后訓練總時間的變化情況。


在更多未翻譯數據上訓練


加速訓練允許我們在更大數據集上訓練模型。一般而言,訓練 NMT 模型需要原文與參考譯文對應的成對文本,例如雙語數據等。但是,雙語數據相對于網絡上或其它地方常見的大量單語數據要有限地多。在第二篇論文《Understanding Back-Translation at Scale》中,我們展示了如何通過僅提供我們想要翻譯的語言的文本來提升模型的翻譯性能,以及利用大量的此類數據可以大幅提升模型準確度。


通過單語數據提升 NMT 模型最高效的方法之一是反向翻譯(back-translation)。如果我們的目標是訓練一個英語到德語的翻譯模型,我們可以首先訓練一個從德語翻譯到英語的模型并利用該模型翻譯所有的單語德語數據,然后在已有的和新的數據上簡單地訓練一個英語到德語的最終模型。我們的論文顯示,數據如何被翻譯是非常重要的,通過采樣故意不總是選擇最好的翻譯同樣也是非常重要的。

微信圖片_20180910214435.gif

圖:演示反向翻譯的動畫


如果我們把 2.26 億個反向翻譯的句子添加到現有的包含 500 萬個句子的訓練數據中,我們就能大幅提升翻譯質量。下圖(左)顯示了這一系統在標準 WMT』14 英-德基準測試集上的準確率(fairseq & 單語數據)。該系統可以在 16 個 DGX-1 機器上經過 22.5 小時訓練而成。圖中還顯示了 DeepL 的準確率,這是一個依賴于高質量人工翻譯的專業翻譯服務,此前該服務在該基準測試上表現最佳。

微信圖片_20180910214456.jpg


快速翻譯


我們還提高了 fairseq 模型的翻譯速度。具體來說,我們實現了很巧妙的高速緩存,或從計算和批處理中移除完成句子的幾個單詞而不是句子。這提高了大約 60% 的速度。下圖展示了 fairseq 和其它工具集的對比。只從 32 位浮點數變到 16 位浮點數就能提升 40% 的速度。

微信圖片_20180910214542.jpg

圖:在標準 WMT』14 英語-德語基準測試集上使用大型 Transformer 模型和 V100GPU 得到的翻譯速度。


未來計劃


擴展和提高自動化翻譯技術仍將是我們工作的重點。為了讓該研究項目盡快成長起來,我們共享了分布式訓練的代碼,并將其作為我們的 fairseq 開源項目的一部分,從而使其他研究者也可以輕松地以更快的速度訓練 NMT 模型。進行分布式訓練僅需稍微改動訓練命令。


實現更快的 NMT 訓練是一項激動人心的發現。大幅度地降低訓練時間可以加快實驗周轉,使我們能更輕松地在更好的模型中做研究。把無標簽數據應用到翻譯之外的問題(如問答或自動摘要)上也是很不錯的發現。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美亚洲系列| 亚洲成色777777女色窝| 亚洲精品日产精品乱码不卡| 久久国产99| 亚洲高清在线精品| 国产九色精品成人porny| 欧美日韩在线视频一区二区| 欧美日韩一区在线视频| 国产精品美女久久久| 99re热这里只有精品视频| 国产精品99久久久久久久久| 国产精品视频导航| 国产欧美日韩激情| 久久久久久久91| 国产精品豆花视频| 久久综合国产精品| 国产精品二区在线| 亚洲精品一区在线观看| 欧美日韩在线亚洲一区蜜芽| 国产精品久久91| 久久精品日产第一区二区| 国产欧美一区二区三区久久| 国产精品久久二区二区| 亚洲大片在线| 欧美精品成人91久久久久久久| 影音先锋亚洲电影| 久久国产精彩视频| 国产精品综合网站| 欧美日韩人人澡狠狠躁视频| 国产精品入口66mio| 久久综合九九| 欧美黑人在线播放| 欧美性猛交xxxx乱大交蜜桃| 国产精品永久免费观看| 国内精品久久久久久久影视麻豆| 欧美刺激午夜性久久久久久久| 亚洲无毛电影| 国产精品一区二区三区乱码| 亚洲国产精品va在线看黑人| 黄色日韩网站| 亚洲夫妻自拍| 一区二区三区国产在线观看| 欧美精品午夜| 亚洲国产精品99久久久久久久久| 在线不卡中文字幕| 麻豆freexxxx性91精品| 99国产欧美久久久精品| 免费h精品视频在线播放| 欧美精品一区二区在线播放| 亚洲国产一成人久久精品| 亚洲网站视频| 亚洲国产欧美日韩另类综合| 欧美成人精品在线播放| 亚洲精品国精品久久99热| 亚洲欧美日韩区| 亚洲欧美国产精品va在线观看| 亚洲电影免费观看高清完整版在线观看| 国产午夜精品久久| 一区二区三区视频在线看| 另类人畜视频在线| 欧美三级特黄| 久久噜噜亚洲综合| 好看的av在线不卡观看| 欧美三级乱人伦电影| 久久综合一区二区三区| 亚洲七七久久综合桃花剧情介绍| 欧美日韩国产123区| 欧美日本在线播放| 永久免费精品影视网站| 99在线精品观看| 午夜精品久久久久影视| 亚洲天堂av图片| 国产一区在线播放| 亚洲午夜精品在线| 国产精品久久一级| 99精品视频一区二区三区| 欧美日韩国产大片| 国产一区二区三区精品久久久| 亚洲区第一页| 亚洲国产精品成人一区二区| 国产精品videosex极品| 亚洲一区制服诱惑| 午夜激情综合网| 欧美ab在线视频| 亚洲成人资源| 亚洲免费中文字幕| 欧美了一区在线观看| 久久不射电影网| 欧美电影资源| 亚洲精品在线视频观看| 一卡二卡3卡四卡高清精品视频| 一区电影在线观看| 好吊色欧美一区二区三区四区| 黑人巨大精品欧美黑白配亚洲| 亚洲国产精品视频| 亚洲国产小视频在线观看| 欧美视频在线观看免费网址| 国产精品国产三级国产专播精品人| 欧美体内谢she精2性欧美| 亚洲免费av观看| 久久久99国产精品免费| 欧美小视频在线| 亚洲级视频在线观看免费1级| 狠狠色综合日日| 久久久不卡网国产精品一区| 国产麻豆9l精品三级站| 美女被久久久| 日韩视频在线一区二区三区| 性欧美1819sex性高清| 久久精品成人| 蜜臀av在线播放一区二区三区| 91久久精品国产91久久| 欧美色欧美亚洲另类二区| 在线看成人片| 一区二区电影免费在线观看| 欧美日韩一卡| 91久久精品美女高潮| 国内成人精品2018免费看| 亚洲精品久久在线| 欧美日韩综合另类| 亚洲精品国产系列| 蜜臀91精品一区二区三区| 久久久亚洲精品一区二区三区| 一区二区三区四区国产| 亚洲精品在线视频观看| 亚洲国产精品成人va在线观看| 亚洲精品影院在线观看| 欧美图区在线视频| 亚洲人永久免费| 亚洲欧美日韩一区二区三区在线观看| 午夜免费日韩视频| 国产一区二三区| 欧美一区二区三区在线播放| 性欧美8khd高清极品| 日韩性生活视频| 香港久久久电影| 国产精品二区影院| 国产精品久久久久久av下载红粉| 欧美激情在线观看| 91久久精品国产91久久| 亚洲精品中文字幕在线| 久久国产一区| 一区二区三区视频在线观看| 激情av一区二区| 亚洲午夜成aⅴ人片| 久久国产欧美| 久热精品视频在线观看一区| 亚洲在线视频| 一区二区不卡在线视频 午夜欧美不卡'| 亚洲国产乱码最新视频| 国产精品久久久久天堂| 久久久久国色av免费看影院| 亚洲第一精品夜夜躁人人爽| 欧美另类极品videosbest最新版本| 99在线精品视频在线观看| 久久超碰97人人做人人爱| 欧美精品一区视频| 欧美欧美在线| 亚洲国产片色| 娇妻被交换粗又大又硬视频欧美| 一区二区久久久久| 欧美成人午夜激情在线| 久久久xxx| 国产综合色在线| 久久免费视频网站| 国产在线视频欧美| 欧美高清视频免费观看| 亚洲激情视频在线播放| 欧美一区二区视频在线观看| 亚洲午夜av在线| 国产欧美一区在线| 国产精品一区二区三区免费观看| 尤物九九久久国产精品的特点| 亚洲电影av| 性8sex亚洲区入口| 国内精品视频在线播放| 欧美好吊妞视频| 一区二区日本视频| 国产精品成人免费精品自在线观看| 美女视频黄 久久| 久久躁狠狠躁夜夜爽| 国产欧美日韩在线观看| 欧美激情亚洲精品| 国产精品乱码一区二三区小蝌蚪| 国产一区999| 亚洲激情视频在线播放| 国产精品一区在线观看| 欧美电影免费观看高清| 国语自产精品视频在线看一大j8| 一区二区三区欧美在线观看| 欧美日韩亚洲国产精品| 亚洲欧洲免费视频| 午夜在线成人av| 欧美日韩另类丝袜其他| 欧美性猛交xxxx免费看久久久| 午夜日韩激情| 免费成人激情视频| 久久久最新网址| 午夜在线观看免费一区| 99国产精品久久久久久久成人热| 免费成人高清| 亚洲视频在线免费观看| 欧美日韩18| 亚洲欧美日韩精品一区二区| 欧美三级免费| 国产精品对白刺激久久久| 久久久夜色精品亚洲| 久久激情中文| 欧美日韩中国免费专区在线看| 国产精品久久久久久久午夜片| 久久综合一区二区| 亚洲自拍偷拍色片视频| 国产精品入口福利| 欧美日韩一区二区在线播放| 99日韩精品| 欧美另类videos死尸| 一本色道久久88综合亚洲精品ⅰ| 欧美区在线播放| 欧美一级大片在线观看| 欧美精品成人一区二区在线观看| 欧美日产在线观看| 欧美成人精品三级在线观看| 亚洲少妇诱惑| 欧美精品一区在线发布| 美女日韩欧美| 另类成人小视频在线| 在线精品视频免费观看| 在线综合亚洲欧美在线视频| 久久久久久综合网天天| 亚洲人成网站777色婷婷| 欧美日本三级| 欧美午夜精品理论片a级按摩| 在线观看日韩av先锋影音电影院| 亚洲一区二区三区视频播放| 欧美日韩xxxxx| 欧美人妖另类| 亚洲在线一区| 欧美午夜电影完整版| 国产偷国产偷亚洲高清97cao| 欧美成人午夜激情| 久久久爽爽爽美女图片| 久久精品国产精品| 久久久伊人欧美| 欧美成人xxx| 欧美日韩国产片| 亚洲国产三级| 免费成人av在线| 久久亚洲国产成人| 中国日韩欧美久久久久久久久| 欧美成人a视频| 国产欧美在线播放| 亚洲午夜未删减在线观看| 国产一区二区三区日韩| 亚洲欧美在线aaa| 欧美在线啊v一区| 米奇777在线欧美播放| 日韩视频一区| 欧美日韩国产丝袜另类| 一本色道久久综合狠狠躁篇的优点| 在线视频精品| 国产精品久久久亚洲一区| 国产精品magnet| 久久久久久久久久久久久久一区| 一区在线视频观看| 欧美在线一二三区| 国产日韩欧美不卡在线| 国产热re99久久6国产精品| 美女日韩在线中文字幕| 国内偷自视频区视频综合| 免费在线播放第一区高清av| 久久精品中文字幕免费mv| 韩国成人福利片在线播放| 亚洲在线成人精品| 猛男gaygay欧美视频| 午夜精品福利电影| 欧美日韩综合一区| 亚洲国产欧美一区| 在线观看91久久久久久| 另类春色校园亚洲| 欧美精品免费在线观看| 欧美中文字幕视频| 国产亚洲aⅴaaaaaa毛片| 国产精品香蕉在线观看| 亚洲一区二区精品视频| 亚洲欧美乱综合| 欧美日韩国产小视频| 日韩视频国产视频| 亚洲精品日韩在线| 免费在线亚洲欧美| 欧美日韩一区二区在线| 欧美大片91| 亚洲综合日韩中文字幕v在线| 狼狼综合久久久久综合网| 久久午夜羞羞影院免费观看| 欧美日韩国产在线| 欧美激情在线免费观看| 亚洲国产精品成人久久综合一区| 欧美成人免费va影院高清| 欧美精品在线视频观看| 国产综合色在线| 亚洲神马久久| 欧美国产高清| a91a精品视频在线观看| 久久精品国产一区二区电影| 国产精品乱码一区二三区小蝌蚪| 欧美日一区二区三区在线观看国产免| 欧美激情国产日韩精品一区18| 国产精品毛片在线| 欧美三日本三级三级在线播放| 在线一区二区日韩| 久久综合色88| 国产精品一二三四区| 欧美在线www| 国产精品香蕉在线观看| 国产一区视频在线观看免费| 久色成人在线| 欧美mv日韩mv国产网站| 亚洲欧美日韩成人高清在线一区| 永久免费毛片在线播放不卡| 亚洲国内精品在线| 午夜一区在线| 一区二区三区三区在线| 亚洲人成在线观看网站高清| 在线看片成人| 欧美日韩中文在线| 亚洲在线中文字幕| 国产精品久久久久久久7电影| 国产欧美日韩不卡免费|