《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 其他 > 教學:頂級FPGA和GPU的PK

教學:頂級FPGA和GPU的PK

2022-08-16
來源:FPGA之家

  本部分,我們就跟隨作者一起看看Intel StraTIx10 NX和Nvidia在這個領域的利器T4以及V100之間的對比,過程分為芯片級對比以及系統級對比。

  本部分一起先來看看芯片級對比

  首先來看下我們的GPU對手——Nvidia T4和V100分別有320個和640個張量核(專門用于AI工作負載的矩陣乘法引擎)

7a6a2812-1cfd-11ed-ba43-dac502259ad0.png

  Nvidia Tesla T4

7a868c1e-1cfd-11ed-ba43-dac502259ad0.png

  Nvidia Tesla V100

  下面表格總結了與StraTIx10 NX和這些同代工藝GPU的關鍵指標對比。 就die尺寸來說,V100是Nvidia最大的12nm GPU,幾乎比T4大50%,而StraTIx10 NX比兩種GPU都小。

7aa010ee-1cfd-11ed-ba43-dac502259ad0.png

  首先,文章使用GPU最擅長處理的工作負載:通用矩陣乘(GEMM)來跑GPU的benchmark(什么是GEMM請移步https://spaTIal-lang.org/gemm),為了測量最佳的GPU性能,對每個器件使用最新的library,這些庫不會出錯,并且分別在使用和不使用張量核的情況下測試性能。對于fp32和fp16實驗,分別使用CUDA10.0和10.2的CuBLAS庫進行V100和T4。對于int8,我們使用CUDA10.2中的cuBLASLt庫,這樣可以比cuBLAS庫獲得更高的int8性能。文章使用Nvidia的官方(高度優化)的cuDNN kernel來處理DL工作負載,并且分別對V100和T4使用了從cuDNN7.6.2和7.6.5。 (cuBLAS API,從cuda6.0開始;cuBLASLt API,從cuda10.1開始)

  cuDNN庫不支持int8計算kernel,但它們支持將所有模型權重保存在片上內存中。對于每個工作負載、問題大小和序列長度,文章在兩種GPU上運行了所有可能的配置組合,如精度{fp32、fp16、int8}、計算樣式{persistent、non-persistent}、張量核心設置{enable、disable}。然后,選擇最佳的性能,來和Stratix10 NX的NPU進行比較。 這里因為是芯片級對比,所以只考慮了芯核的計算效率,不包括任何初始化、芯核啟動或主機-GPU數據傳輸開銷。

  下圖給出了T4和V100 GPU上fp32、fp16和int8精度的GEMM benchmark測試結果。結果表明,相對于張量核禁用情況(藍線),啟用張量核(紅線) 可以顯著提高GPU在GEMM上的性能。

7ac33b46-1cfd-11ed-ba43-dac502259ad0.png

  然而,一個普遍的趨勢是,張量核雖然是為GEMM設計的,但在矩陣大小為2048或以下情況時的利用效率明顯不如峰值情況(紅色虛線)。因此要實現高利用率,除非工作負載中的矩陣大小非常大,而這在實際DL工作負載中并不常見。T4和V100上的張量核都不支持fp32的精度,而是在執行乘法運算之前,將fp32數據轉換為fp16。相對于純fp16 GEMM,這種數據轉換開銷降低了張量核性能。另一個有趣的情況是,當T4張量核在int8模式下工作時,它們需要將輸入矩陣從標準的行/列主要格式轉換為特定于張量核的布局。因此,即使在處理非常大的8192×8192矩陣時,在張量核(沒有標記的紅線)上實現的int8性能還不到峰值性能的45%。

  為了更好地理解這種數據轉換的開銷,文章還進行了一個額外的實驗,在這個實驗中,對張量核進行了特殊布局(帶有標記的紅線)。即使不算矩陣布局變化的開銷,對于4096×4096及以下的矩陣大小,張量核利用率也小于40%,在6144×6144矩陣中利用率達到最高為72%。

  下面來看看FPGA上的情況,上圖(Fig.6)的右上角那張圖比較了Stratix10 NX上的NPU性能與具有int8張量核的T4 GPU的性能。為了公平地比較,文章禁用了NPU兩個輸入矩陣其中一個的矩陣布局變換,只保留了對另一個輸入以及輸出矩陣的布局變換(因為NPU以標準格式使用和生成這些矩陣)。

  雖然NPU是為矩陣向量運算而設計的,但它在GEMM工作負載上仍然實現了與T4相似的性能,其矩陣大小從512到3072不等(最大的矩陣可以fit進片上BRAM)。

  最后,一起看看頂級FPGA和GPU的PK結果。下圖(Fig.7)將文章在Stratix10 NX上增強型NPU的性能與T4和V100的最佳性能進行比較。對于比較小的batch-3和batch-6情況,FPGA性能總是顯著高于兩個GPU。FPGA在batch-6(其設計為:雙核batch-3)中表現最好,平均性能分別是T4和V100的24.2x和11.7x。

7aefa910-1cfd-11ed-ba43-dac502259ad0.png

  與batch-6相比,FPGA在batch-3上的性能較低,因為兩個核中的一個完全空閑。然而,它仍然比T4和V100分別平均快了22.3x和9.3x。在batch size高于6時,如果batch size不能被6整除,則NPU可能不能被充分利用。例如,在batch size為8、32和256的情況下,NPU最多可以達到其batch-6性能的67%、89%和99%,而batch size為12、36和258(上圖中的虛線所示)可以達到100%的效率。在32輸入的中等batch size情況下,NX仍然比T4具有更好的性能,并且與V100性能相當。

  即使在比較大的batch size情況下,NX的性能也比T4高58%,只比die size更大(大將近一倍)的V100低30%。這些結果表明,人工智能優化的FPGA在低batch實時推理中不僅可以實現比GPU好一個數量級的性能,而且可以在放寬延遲約束下的高batch推理中和GPU匹敵。上圖(Fig.7)中的右下角圖總結了不同batch size情況下NX相對于CPU的平均加速情況。

  上圖(Fig.7)中的右上角圖顯示了與不同batch大小下的兩個GPU相比,NX的平均利用率。NX在batch-6中的平均利用率為37.1%,而T4和V100分別僅為1.5%和3%。GPU張量核并非直接互連,它們只能接收來自本地核內寄存器文件的輸入。因此,每個GPU張量核都必須發送它的partial result到全局內存中,并與其他張量核同步,以結合這些partial result。然后GPU從全局內存中讀取組合好的矢量來執行進一步的操作,如激活函數(activation functions)。

  較高的batch size可以攤銷這種同步延遲,但即使在batch-256情況下,T4和V100的利用率分別只有13.3%和17.8%。 另一方面,FPGA在架構上也更具優勢,其在張量塊之間有專用的用來做減法的互連, FPGA的可編程布線資源還允許將MVU tile和矢量單元級引擎級聯起來進行直接通信,減少了像GPU中那樣必須通過內存通信的情況。

  綜上可以看到,FPGA依靠架構優勢和超高的資源利用率,在AI性能PK上對GPU形成了強勁挑戰。下一篇,我們再來一起看看從系統角度,FPGA和GPU的對比情況以及功耗方面的分析。



更多信息可以來這里獲取==>>電子技術應用-AET<< 

mmexport1621241704608.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美精品www| 欧美亚州一区二区三区| 亚洲午夜羞羞片| 国产欧美日韩在线观看| 国产一区二区精品久久91| 最新日韩精品| 葵司免费一区二区三区四区五区| 激情欧美一区二区三区在线观看| 亚洲欧美日韩在线高清直播| 亚洲一区精品电影| 亚洲视频高清| 亚洲欧洲一区二区在线观看| 国产噜噜噜噜噜久久久久久久久| 亚洲精品美女| 国产精品99久久久久久久女警| 亚洲一区二区三区涩| 在线成人av| 欧美精品尤物在线| 在线日本成人| 亚洲自拍三区| 国产精品成人一区二区三区夜夜夜| 在线看一区二区| 欧美日韩精品一区二区| 中文精品99久久国产香蕉| 久热成人在线视频| 国产一级精品aaaaa看| 久久精品一区二区三区不卡| 欧美视频在线观看一区| 麻豆精品视频在线| 亚洲欧美成人精品| 亚洲免费小视频| 国语自产偷拍精品视频偷| 国产欧美综合一区二区三区| 一本色道久久综合| 欧美性猛交99久久久久99按摩| 国产区亚洲区欧美区| 国产精品一区二区在线观看网站| 久久国产精品久久国产精品| 一本一本久久a久久精品综合妖精| 欧美午夜a级限制福利片| 亚洲国产va精品久久久不卡综合| 免费欧美日韩国产三级电影| 国产亚洲精品一区二区| 一本一道久久综合狠狠老精东影业| 久久成人精品视频| 精品999久久久| 国产日本欧美一区二区三区在线| 亚洲伦理在线| 亚洲福利视频二区| 欧美日韩成人| 亚洲免费av网站| 欧美国产精品劲爆| 欧美激情亚洲另类| 欧美成人黑人xx视频免费观看| 欧美日韩伦理在线| 午夜久久久久久| 国产亚洲视频在线| 国产精品theporn88| 亚洲精品美女久久久久| 老司机成人网| 欧美视频久久| 久久综合九色综合网站| 国产欧美在线看| 亚洲七七久久综合桃花剧情介绍| 国产精品99久久99久久久二8| av不卡在线| 久久精品一区二区三区中文字幕| 亚洲国产精品va在线看黑人动漫| 亚洲欧洲精品成人久久奇米网| 欧美性大战久久久久| 欧美高清在线一区二区| 一本色道婷婷久久欧美| 亚洲综合首页| 久久婷婷国产综合精品青草| 在线播放国产一区中文字幕剧情欧美| 久久国产欧美精品| 性伦欧美刺激片在线观看| 亚洲精品一区二区三区99| 欧美精选在线| 亚洲视频图片小说| 国产伦精品免费视频| 国产一区二区精品在线观看| 久久精彩免费视频| 在线亚洲电影| 久久视频国产精品免费视频在线| 9国产精品视频| 欧美一区二区在线播放| 久久久久久久一区| 亚洲综合色自拍一区| 亚洲影视中文字幕| 国产精品激情av在线播放| 欧美在线观看视频一区二区| 日韩视频第一页| 亚洲大胆美女视频| 久久综合亚州| 国产精品美女| 久久精品国产99国产精品| 在线视频精品一| 亚洲精品中文字幕在线| 猛男gaygay欧美视频| 欧美a级理论片| 国产精品成人一区二区三区吃奶| 欧美一区二区视频在线| 国产精品午夜春色av| 国产视频欧美视频| 亚洲人成网站999久久久综合| 国产精品福利网站| 久久久久久精| 久久久999精品视频| 韩国三级电影久久久久久| 欧美激情第3页| 欧美三级特黄| 欧美剧在线观看| 国产日韩在线一区二区三区| 国产免费观看久久| 亚洲高清久久久| 亚洲成人资源| 亚洲狠狠婷婷| 欧美日韩视频在线一区二区观看视频| 99精品欧美一区二区蜜桃免费| 国产农村妇女毛片精品久久莱园子| 免费日韩av电影| 国产日韩1区| 亚洲巨乳在线| 欧美成人免费在线| 久久精品夜夜夜夜久久| 久久精品视频在线观看| 欧美精品一区视频| 国产亚洲午夜高清国产拍精品| 美女啪啪无遮挡免费久久网站| 亚洲在线一区二区三区| 一区二区久久久久| 欧美不卡在线| 欧美香蕉大胸在线视频观看| 嫩草成人www欧美| 国产综合18久久久久久| 国产精品国产三级国产普通话三级| 国产亚洲成精品久久| 国产精品麻豆欧美日韩ww| 美日韩丰满少妇在线观看| 欧美在线视频日韩| 国产日本欧美在线观看| 欧美精品三级在线观看| 亚洲精品久久久久久久久久久久| 国产精品成人免费精品自在线观看| 一区免费在线| 欧美午夜精品久久久久免费视| 国产免费成人av| 国产视频一区免费看| 免费不卡在线观看av| 国产欧美日韩一区二区三区在线观看| 欧美专区日韩视频| 欧美激情一区在线| 国产在线国偷精品产拍免费yy| 欧美大片国产精品| 亚洲欧美日本另类| 日韩午夜电影av| 激情综合中文娱乐网| 久久三级视频| 欧美性开放视频| 久久久之久亚州精品露出| 久久精品一区蜜桃臀影院| 在线观看视频一区二区欧美日韩| 欧美电影美腿模特1979在线看| 亚洲午夜av| 久久国产精品色婷婷| 欧美精品久久久久久| 亚洲久久成人| 好看的av在线不卡观看| 日韩一区二区久久| 欧美一级片久久久久久久| 国产精品亚洲产品| 另类尿喷潮videofree| 国产精品亚洲欧美| 欧美成人亚洲成人| 99热精品在线观看| 狠狠干成人综合网| 免费观看一级特黄欧美大片| 黄色亚洲免费| 狠狠干成人综合网| 日韩一级视频免费观看在线| 国产日韩欧美电影在线观看| 亚洲综合激情| 一级日韩一区在线观看| 欧美电影免费观看高清完整版| 亚洲一区二区三区久久| 亚洲毛片网站| 久久精品国产99精品国产亚洲性色| 一区二区三区波多野结衣在线观看| 欧美在线欧美在线| 免费久久99精品国产自| 久久成人av少妇免费| 国产精品欧美经典| 午夜精品理论片| 欧美视频在线一区二区三区| 亚洲精品日产精品乱码不卡| 亚洲综合日韩| 美女脱光内衣内裤视频久久网站| 六月天综合网| 国产精品美女主播在线观看纯欲| 亚洲日本免费电影| 久久av在线看| 亚洲一区影音先锋| 一本大道久久精品懂色aⅴ| 亚洲另类春色国产| 国产精品久久久久久久一区探花| 久久黄色影院| 欧美日韩一区二区三区在线观看免| 久久国内精品视频| 欧美午夜不卡影院在线观看完整版免费| 欧美大成色www永久网站婷| 欧美亚洲日本国产| 一区二区三区视频在线| 欧美日韩麻豆| 亚洲国产高清视频| 久热这里只精品99re8久| 欧美日韩亚洲一区二区三区四区| 欧美一区二区视频在线| 亚洲一区二区视频在线观看| 欧美freesex交免费视频| 亚洲在线视频一区| 国产欧美一区二区精品忘忧草| 久久久高清一区二区三区| 亚洲欧美激情一区二区| 亚洲欧美一区二区三区久久| 国产精品亚洲综合一区在线观看| 女人色偷偷aa久久天堂| 欧美精品一区在线观看| 国产精品久久久久999| 亚洲电影欧美电影有声小说| 欧美在线关看| 亚洲你懂的在线视频| 国产精品伦一区| 国产综合色在线视频区| 久久夜色精品| 激情久久综艺| 久久久久久一区二区三区| 亚洲成人原创| 国产精品99一区二区| 亚洲欧洲日本国产| 亚洲国产精品精华液网站| 伊人伊人伊人久久| 亚洲精选中文字幕| 99www免费人成精品| 欧美在线精品一区| 在线精品亚洲一区二区| 亚洲免费伊人电影在线观看av| 欧美精品一区二区视频| 香蕉免费一区二区三区在线观看| 欧美一区二区三区另类| 国产精品日韩欧美| 蜜臀av性久久久久蜜臀aⅴ| 国产精品揄拍500视频| 老色鬼久久亚洲一区二区| 亚洲电影在线免费观看| 欧美成人a视频| 久久婷婷蜜乳一本欲蜜臀| 在线播放日韩专区| 久久综合导航| 亚洲一区三区在线观看| 国产免费观看久久| 国产一区二区久久久| 亚洲国产日韩欧美在线动漫| 欧美性大战久久久久久久蜜臀| 一区二区在线观看av| 夜夜嗨av一区二区三区免费区| 欧美xxxx在线观看| 亚洲激情视频在线观看| 一区二区亚洲精品| 激情国产一区二区| 在线看片欧美| 国产精品永久免费在线| 欧美日韩二区三区| 欧美日韩精品二区| 午夜精品久久久久久久99水蜜桃| 一区二区三区视频在线播放| 亚洲一区国产精品| 久久婷婷丁香| 国产精品日韩在线播放| 欧美.日韩.国产.一区.二区| 欧美日韩在线观看视频| 欧美专区在线观看| 极品少妇一区二区| 麻豆精品传媒视频| 午夜视频在线观看一区二区| 国产一区二区三区成人欧美日韩在线观看| 国产精品s色| 国产综合色在线视频区| 亚洲欧洲99久久| 欧美在线网站| 国内成人在线| 欧美影院午夜播放| 欧美专区一区二区三区| 欧美精品一区二区三区在线看午夜| 久久久噜噜噜久久狠狠50岁| 在线亚洲精品| 欧美影院成年免费版| 欧美1区2区| 欧美日韩高清不卡| 国产亚洲精品一区二555| 欧美一区永久视频免费观看| 一区二区毛片| 久久成人免费电影| 欧美激情视频一区二区三区不卡| 国产精品三上| 久久久久一区二区| 久久激情中文| 日韩亚洲欧美成人一区| 欧美激情一区二区三区成人| 国产色综合天天综合网| 午夜精品视频一区| 亚洲激情第一页| 欧美一级电影久久| 欧美gay视频| 国产区欧美区日韩区| 久久精品系列| 亚洲欧美日韩在线一区| 欧美国产日韩免费| 精品二区视频| 国产精品99久久久久久久女警| 久久国产精品亚洲77777| 久久精品99无色码中文字幕| 午夜精品久久99蜜桃的功能介绍| 久久亚洲免费| 欧美在线地址| 欧美一区1区三区3区公司| 国产一区在线播放| 久久精品亚洲一区二区三区浴池|