《電子技術應用》
您所在的位置:首頁 > EDA與制造 > 業界動態 > 特斯拉、高通、華為AI處理器深度分析

特斯拉、高通、華為AI處理器深度分析

2021-09-06
來源: 佐思產研

  很多人會問,為什么沒有英偉達?目前所有主流深度學習運算主流框架后端都是英偉達的CUDA,包括TensorFlow、Caffe、Caffe2、PyTorch、mxnet、PaddlePaddle,CUDA包括微架構和指令集以及并行計算引擎。CUDA壟斷了深度學習或者也可以說壟斷了人工智能,這一點類似ARM的微架構和指令集。CUDA強大的生態系統,造就了英偉達牢不可破的霸主地位。深度學習的理論基礎在上世紀五十年代就已經齊備,無法應用的關鍵就是缺乏像GPU這樣的密集簡單運算設備,是英偉達的GPU開創了人類的深度學習時代,或者說人工智能時代,CUDA強化了英偉達的地位。你可以不用英偉達的GPU,但必須轉換格式來適應CUDA。

  CUDA開啟了并行計算或多核運算時代,今天人工智能用的所有加速器都是多核或眾核處理器,幾乎都離不開CUDA。CUDA程序構架分為兩部分:Host和Device。一般而言,Host指的是CPU,Device指的是GPU或者叫AI加速器。在CUDA程序構架中,主程序還是由CPU 來執行,而當遇到數據并行處理的部分,CUDA 就會將程序編譯成 GPU能執行的程序,并傳送到GPU。而這個程序在CUDA里稱做核(kernel)。CUDA允許程序員定義稱為核的C語言函數,從而擴展了C語言,在調用此類函數時,它將由N個不同的CUDA線程并行執行N次,這與普通的C語言函數只執行一次的方式不同。執行核的每個線程都會被分配一個獨特的線程ID,可通過內置的threadIdx變量在內核中訪問此ID。在 CUDA 程序中,主程序在調用任何 GPU內核之前,必須對核進行執行配置,即確定線程塊數和每個線程塊中的線程數以及共享內存大小。你可以不用英偉達的GPU,但最終都離不開CUDA,也就是需要轉換成CUDA格式,這就意味著效率的下降。所以英偉達是參考級的存在。

  從CUDA的特性我們不難看出,單獨的AI加速器是無法使用的。今天我們分析三款可用于智能駕駛領域的AI加速器,分別是高通的AI100,華為的昇騰,特斯拉的FSD。這其中高通AI100比較少見。

  高通AI100最早于2019年4月在深圳的高通AI開放日露面,2020年9月量產。AI100是高通目前唯一的AI推理運算加速器,定位四個方面的應用:一是數據中心的邊緣計算,二是5G行動邊緣計算,三是智能駕駛與智能交通,四是5G基礎設施。

  AI100有兩個側重點:一是5G游戲,AI100發布當天邀請了VIVO手機、騰訊王者榮耀開發團隊利用AI100現場開了一場電玩競賽,即把部分運算放到5G邊緣服務器上,減輕手機端的負載。二是智能交通和智能駕駛,高通自動駕駛Ride平臺的AI加速器很有可能就是AI100的車規翻版。

  高通特別展示了AI100在智能交通/智能駕駛領域的應用。

  同時支持24路200萬像素幀率25Hz的圖像識別,特斯拉的FSD不過是同時8路130萬像素幀率30Hz的圖像識別,性能至少是特斯拉FSD的3倍。 AI100可以像刀片服務器那樣應用,用PCIe交換機最多16個級聯。

  最高每瓦有12.37TOPs的算力,特斯拉FSD是36瓦的功耗,AI部分估計大約為24瓦,每瓦只有大約3TOPs每瓦的算力,英偉達的Orin大致為5.2TOPs每瓦的算力。

  上圖為高通AI100內部框架圖。設計很簡潔,16個AI核,內核與內核之間是第四代PCIe連接,帶寬有186GB/s,8通道的PCIe網絡,然后再與各種片上網絡(NoC),包括存儲NoC、運算NoC和配置NoC通過PCIe總線連接。片上存儲器容量高達144MB,帶寬136GB/s。外圍存儲器為256Gb的LPDDR4。支持汽車行業的ISO26262安全標準,即ASIL,達到B級。

  NoC是多核AI處理器的核心技術之一,特斯拉FSD只有兩個NPU,很可能用不到NoC而用比較落后的總線技術,不過高通和華為都用到了。

  NoC的詳細理論就不說了,可以理解為一個運行在PE與存儲之間的通訊網絡。NoC技術和網絡通信中的OSI(Open System Interconnection)技術有很多相似之處,NoC技術的提出也是因為借鑒了并行計算機的互聯網絡和以太網絡的分層思想,二者的相同點有:支持包交換、路由協議、任務調度、可擴展等。NoC更關注交換電路和緩存器的面積占用,在設計時主要考量的方面也是這些。NoC的基本組成為:IP核、路由器、網絡適配器以及網絡鏈路,IP核和路由器位于系統層,網絡適配器位于網絡適配層。針對NoC的這四個基本組成,也衍生出了許多的研究方向和優化途徑。

  常見AI加速器的NoC如上表。需要指出高通和華為都用了Arteris,這家公司實際是高通的子公司,高通在2013年11月收購了這家僅有43人的法國小公司,今天中國幾乎所有的大中型芯片公司都是其客戶,包括瑞芯微、國民技術、華為、全志、炬力、展訊等,可以說都在給高通打工。英特爾在2019年收購了Netspeed,Facebook在2019年收購了Sonics,這兩家的NoC使用面遠不如高通的Arteris。

  每個AI核內部框架如上,主要分4個部分,分別是標量處理、向量處理、存儲處理和張量處理。深度學習中經常出現4種量,標量、向量、矩陣和張量。神經網絡最基本的數據結構就是向量和矩陣,神經網絡的輸入是向量,然后通過每個矩陣對向量進行線性變換,再經過激活函數的非線性變換,通過層層計算最終使得損失函數的最小化,完成模型的訓練。

  標量(scalar):一個標量就是一個單獨的數(整數或實數),不同于線性代數中研究的其他大部分對象(通常是多個數的數組)。標量通常用斜體的小寫字母來表示,標量就相當于Python中定義的x=1。

  向量(Vector),一個向量表示一組有序排列的數,通過次序中的索引我們能夠找到每個單獨的數,向量通常用粗體的小寫字母表示,向量中的每個元素就是一個標量,向量相當于Python中的一維數組。

  矩陣(matrix),矩陣是一個二維數組,其中的每一個元素由兩個索引來決定,矩陣通常用加粗斜體的大寫字母表示,我們可以將矩陣看作是一個二維的數據表,矩陣的每一行表示一個對象,每一列表示一個特征。

  張量(Tensor),超過二維的數組,一般來說,一個數組中的元素分布在若干維坐標的規則網格中,被稱為張量。如果一個張量是三維數組,那么我們就需要三個索引來決定元素的位置,張量通常用加粗的大寫字母表示。

  不太嚴謹地說,標量是0維空間中的一個點,向量是一維空間中的一條線,矩陣是二維空間的一個面,三維張量是三維空間中的一個體。也就是說,向量是由標量組成的,矩陣是向量組成的,張量是矩陣組成的。

  標量運算部分可以看作一個小CPU,控制整個AI Core的運行。標量計算單元可以對程序中的循環進行控制,可以實現分支判斷,其結果可以通過在事件同步模塊中插入同步符的方式來控制AI Core中其它功能性單元的執行流水。它還為矩陣計算單元或向量計算單元提供數據地址和相關參數的計算,并且能夠實現基本的算術運算。復雜度較高的標量運算如數據流量控制則由專門的AI CPU通過算子完成,AI處理器是無法單獨工作的,必須要外置的CPU給予配合。

  華為昇騰系列內核架構。圖片來源:互聯網

  華為的昇騰910即Davinci Max,和高通AI100一樣,也是8192個Int8,4096個FP16。不過昇騰910是訓練用的,高通AI100是推理用的,但910不計成本使用HBM2代存儲,性能遠超AI100。

  上圖為特斯拉FSD信號內部流轉,相干流量即深度學習的數據流量需要CPU控制,當然也不只是為深度學習服務。 圖像識別深度學習中運算量最大的卷積部分實際就是矩陣的乘和累加??梢苑纸鉃?維的標量或者叫算子(即權重)與2維的向量即輸入圖像乘和累加。

  上圖為特斯拉FSD神經網絡架構,特斯拉把矩陣的乘和累加簡單寫成了MulAccArray。特斯拉做芯片剛剛入門,FSD上除了NPU是自己做的外,其余都是對外采購的IP。NPU方面,主要就是堆砌MAC乘和累加單元,在稍微有技術含量的標量計算領域,特斯拉沒有公布采用何種指令集,應該是沒什么特色。華為和高通都是采用了VLIW。

  高通的向量處理器可以簡單看作一個DSP。眾所周知,高通的AI技術來源于其DSP技術,高通對DSP非常青睞,而已經失去生命力的VLIW超長指令集非常適合用在深度學習上,深度學習運算算法非常單一且密集度極高,并不需要通用場景下的實時控制。并且其程序運行有嚴格的時間要求,cache這種不可控時間的結構就不適合了,通常采用固定周期的TCM作為緩存,這樣內存訪問時間就固定了。有了上述的特征,靜態編譯在通用場合下面臨的那些困難就不存在了,而DSP其更高效的并行運算能力和簡化的硬件結構被完全發揮出來。

  AI100為了考慮多種應用場合,有FP16和Int8兩種精度陣列,Int8即8位整數精度是智能駕駛領域最常見的,FP16則是游戲、AR/VR領域常用的。Int8有8192個,FP16有4096,特斯拉則是9216個Int8陣列,如果AI100只考慮智能駕駛,在總面積(差不多可等同于成本)不變的情況下算力還可以再提高不少。

  上圖為特斯拉NPU部分流程與裸晶分布,算力理論峰值只是根據MAC數量簡單計算得出,實際存儲器是瓶頸,存儲器能讓算力大打折扣,這也是為什么訓練用AI芯片都不惜成本用HBM內存的原因。特斯拉的芯片上,大部分都給了SRAM,也是為了解決存儲器瓶頸問題。這里常見到兩個單位,GiB和GB,GB是十進制,GiB是二進制,1GiB=(1024*1024*1024)B=1073741824B,1GB=(1000*1000*1000)B=1000000000B,1GiB/1GB=1073741824/1000000000=1.073741824。要求精度不高的話,可以直接替換,高通AI100有144MB的片上存儲,特斯拉只有32MiB,高通顯然可以碾壓特斯拉的,此外外圍的LPDDR4存儲上,高通也是碾壓特斯拉,特斯拉帶寬只有63.58 GiB/s,高通AI100是136GB/s。

  最后說算力,AI處理器對比似乎離不開算力對比,實際單獨講算力數據毫無意義,上圖是高通AI100在五個數據集上的表現,我們可以看到性能與效率差別巨大,AI算力越強,其適用面就越窄,與深度學習模型的捆綁程度就越高,換句話說,AI芯片只能在與其匹配的深度學習模型上才能發揮最大性能,換一個模型,可能只能發揮芯片10%的性能,所有AI芯片目前的算力數據都是理論峰值數據,實際應用中都無法達到理論峰值,某些情況下,可能只有峰值算力的10%甚至2%。100TOPS的算力可能會萎縮到2TOPS。

  在芯片領域,特斯拉只能算是小學生,只要有意愿,高通、英特爾、英偉達、華為、AMD、聯發科、三星都能碾壓特斯拉。




mmexport1621241704608.jpg


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          亚洲天堂激情| 欧美激情视频一区二区三区在线播放| 小嫩嫩精品导航| 久久久人成影片一区二区三区观看| 国产日韩精品视频一区| 国产一区二区三区在线观看免费视频| 欧美国产乱视频| 亚洲已满18点击进入久久| 欧美一区二区三区视频免费播放| 欧美性事免费在线观看| 国产偷自视频区视频一区二区| 欧美日韩国产成人精品| 国产热re99久久6国产精品| 午夜精品999| 亚洲一区欧美激情| 老司机午夜精品| 亚洲黄色免费网站| 国产精品久久91| 免费看成人av| 国产精品色午夜在线观看| 黄色工厂这里只有精品| 欧美日韩国产首页在线观看| 午夜激情一区| 欧美一区亚洲二区| 亚洲欧美中文日韩v在线观看| 日韩视频免费观看高清完整版| 国产一区二区三区电影在线观看| 欧美日本在线播放| 一区二区欧美亚洲| 一区在线免费| 国产精品亚洲第一区在线暖暖韩国| 亚洲伦理精品| 亚洲男女毛片无遮挡| 欧美国产1区2区| 欧美久久久久中文字幕| 久久午夜激情| 国内精品久久久久伊人av| 久久国产精品一区二区三区| 国产欧美一区二区色老头| 欧美日韩天天操| 欧美a级一区| 亚洲视频中文字幕| 国产精品久久久久7777婷婷| 欧美一区午夜精品| 国产免费一区二区三区香蕉精| 国内外成人免费激情在线视频网站| 亚洲欧美制服中文字幕| 久久黄色级2电影| 一本久久综合亚洲鲁鲁| 在线亚洲高清视频| 欧美午夜片在线观看| 亚洲色图制服丝袜| 欧美va天堂va视频va在线| 亚洲人成精品久久久久| 99re视频这里只有精品| 国产欧美日韩免费| 日韩午夜电影| 欧美日韩国产不卡在线看| 亚洲精品免费在线观看| 久久精品视频在线| 亚洲国产三级在线| 亚洲欧美日韩精品久久奇米色影视| 欧美日韩精品一区二区在线播放| 狠狠狠色丁香婷婷综合久久五月| 亚洲一区一卡| 国产精品日日做人人爱| 久久精品主播| 欧美成人伊人久久综合网| 亚洲高清色综合| 亚洲第一在线视频| 国产日韩综合| 国产精品综合网站| 蜜桃久久av一区| 欧美一级片久久久久久久| 欧美精品在线免费播放| 亚洲第一毛片| 老牛嫩草一区二区三区日本| 亚洲区中文字幕| 激情文学一区| 亚洲精华国产欧美| 亚洲乱码久久| 亚洲伦理一区| 亚洲午夜在线视频| 欧美日韩一区二区三区在线| 国产精品va在线播放| 欧美日韩免费观看一区二区三区| 亚洲在线第一页| 玖玖玖国产精品| 国产精品久久久久久av下载红粉| 亚洲国产日韩综合一区| 欧美一区二区三区电影在线观看| 老司机午夜精品| 一区二区三区在线观看视频| 亚洲午夜精品一区二区三区他趣| 国产欧美精品日韩区二区麻豆天美| 久久精品国产69国产精品亚洲| 亚洲日本理论电影| 亚洲欧美日韩综合国产aⅴ| 久久综合给合久久狠狠狠97色69| 欧美一级大片在线观看| 国产精品最新自拍| 亚洲一区二区三区成人在线视频精品| 欧美日韩在线播| 老司机成人在线视频| 在线看片欧美| 亚洲高清在线精品| 伊人一区二区三区久久精品| 欧美激情精品久久久六区热门| 欧美国产在线电影| 国产精品久久久久久久app| 国产亚洲欧美色| 欧美激情一区二区三区| 国产精品一二三四| 激情欧美一区二区三区| 亚洲精品日韩精品| 亚洲精品日韩在线观看| 欧美久久久久中文字幕| 欧美日韩精品久久久| 欧美一区二区三区播放老司机| 欧美一区二粉嫩精品国产一线天| 国产精品久久久久久久一区探花| 亚洲欧美网站| 亚洲精品在线观| 久久久无码精品亚洲日韩按摩| 国产精品综合网站| 久久蜜桃av一区精品变态类天堂| 99热免费精品在线观看| 久久欧美肥婆一二区| 欧美电影在线观看| 永久免费毛片在线播放不卡| 亚洲欧美视频一区二区三区| 国产精品色在线| 欧美激情视频一区二区三区不卡| 一区二区三区中文在线观看| 久久丁香综合五月国产三级网站| 欧美精品18videos性欧美| 久久国产66| 狂野欧美激情性xxxx欧美| 欧美日韩视频在线| 欧美午夜片欧美片在线观看| 香蕉国产精品偷在线观看不卡| 亚洲精品视频免费在线观看| 欧美电影免费观看高清完整版| 精品成人乱色一区二区| 欧美日韩高清在线一区| 韩国自拍一区| 国产日韩高清一区二区三区在线| 亚洲第一精品久久忘忧草社区| 一区二区日韩欧美| 久久精品一区二区三区不卡| 国产农村妇女毛片精品久久莱园子| 亚洲精品一二| 中文av字幕一区| 亚洲欧美经典视频| 国产手机视频一区二区| 亚洲日本成人在线观看| 亚洲欧美国产精品va在线观看| 午夜精品av| 欧美日韩精品一区二区在线播放| 国产美女精品人人做人人爽| 亚洲欧美日韩国产另类专区| 午夜精品久久久久久久| 亚洲一区欧美| 一区二区三区精品久久久| 激情综合五月天| 国产精品v亚洲精品v日韩精品| 亚洲电影免费观看高清| 久久精品综合| 亚洲伊人久久综合| 国产精品乱子久久久久| 在线精品视频一区二区| 一区在线观看视频| 欧美日韩成人在线视频| 性久久久久久久| 国产欧美综合一区二区三区| 一区视频在线看| 欧美精品久久久久久久| 欧美成人免费播放| 亚洲视频综合在线| 欧美精品一卡二卡| 另类国产ts人妖高潮视频| 老司机一区二区三区| 中文一区二区在线观看| 亚洲欧洲一区二区在线观看| 国产美女精品在线| 99精品热视频只有精品10| 久久噜噜噜精品国产亚洲综合| 国产精品日韩在线| 亚洲伦理自拍| 亚洲免费网址| 一区二区三区欧美成人| 亚洲电影免费观看高清完整版在线| 一区二区精品在线| 亚洲国产婷婷香蕉久久久久久| 欧美三区视频| 国产日韩精品久久久| 欧美成人乱码一区二区三区| 国产麻豆精品久久一二三| 欧美影院成人| 99国产精品久久久久老师| 午夜激情亚洲| 亚洲精品国产日韩| 欧美性做爰毛片| 亚洲第一视频网站| 久久在线免费| 亚洲啪啪91| 亚洲精品色图| 国产一区二区三区自拍| 国产精品久久二区| 久久亚洲一区二区三区四区| 一区二区三区日韩精品| 亚洲国产精品精华液2区45| 亚洲国产一区二区三区a毛片| 国内精品久久久久国产盗摄免费观看完整版| 国产精品美女在线| 亚洲欧美日韩精品综合在线观看| 欧美日韩国产黄| 欧美日韩视频一区二区三区| 亚洲国产人成综合网站| 亚洲午夜羞羞片| 久久这里有精品15一区二区三区| 久久精品亚洲一区| 欧美电影电视剧在线观看| 欧美精品 日韩| 一本色道久久综合精品竹菊| 激情文学综合丁香| 欧美精品日韩综合在线| 欧美经典一区二区三区| 国产日韩欧美三区| 国产一区二区| 亚洲视频二区| 国产精品卡一卡二| 久久精品国产96久久久香蕉| 欧美在线视频全部完| 国产精品久久久久久久免费软件| 欧美精品18| 免费日韩av片| 欧美承认网站| 欧美一区二区三区四区在线观看| 一区二区91| 国产一区二区主播在线| 国产精品日韩欧美一区二区| 欧美一区不卡| 国产一区二区中文字幕免费看| 亚洲国产日韩欧美| 狠狠干综合网| 亚洲四色影视在线观看| 亚洲精品一区二区网址| 亚洲欧美日韩国产综合精品二区| 玖玖国产精品视频| 欧美电影打屁股sp| 欧美高清视频一区二区三区在线观看| 一本一道久久综合狠狠老精东影业| 国产精品久久久久久久久婷婷| 一区二区福利| 国产麻豆日韩欧美久久| 欧美三级日本三级少妇99| 久久久久久电影| 亚洲精品免费一区二区三区| 99视频精品| 欧美日韩第一区日日骚| 亚洲国产日日夜夜| 久久久久九九九九| 欧美一级艳片视频免费观看| 伊人成人网在线看| 蜜臀va亚洲va欧美va天堂| 韩国精品在线观看| 午夜欧美大片免费观看| 欧美日韩亚洲综合在线| 欧美视频不卡中文| 国产精品午夜久久| 在线视频一区二区| 欧美伦理在线观看| 欧美人牲a欧美精品| 欧美激情一区在线观看| 亚洲国产成人精品久久久国产成人一区| 亚洲女性裸体视频| 蜜臀91精品一区二区三区| 亚洲精品久久久久久下一站| 久久久精品tv| 亚洲综合成人在线| 欧美日韩一级片在线观看| 亚洲国产黄色片| 久久久综合网| 国产精品亚洲片夜色在线| 国产精品一区二区三区观看| 欧美日韩另类字幕中文| 亚洲人成网站777色婷婷| 欧美黑人在线播放| 欧美大片在线看| 欧美视频在线一区二区三区| 欧美一区不卡| 国产精品国产馆在线真实露脸| 国产人久久人人人人爽| 国产亚洲欧美一区二区三区| 欧美视频在线观看免费网址| 一区二区三区黄色| 一区二区免费在线观看| 亚洲国产成人午夜在线一区| 欧美xxxx在线观看| 欧美精品久久99| 国产手机视频一区二区| 久久精品久久综合| 在线综合视频| 欧美日韩亚洲高清| 欧美一区二区在线免费观看| 欧美激情第10页| 欧美激情按摩在线| 久久精品女人的天堂av| 久久久久久色| 一区二区三区成人精品| 国产亚洲精品bt天堂精选| 久久精品噜噜噜成人av农村| 国产精品成人国产乱一区| 最新中文字幕一区二区三区| 国产精品一区二区久激情瑜伽| 国产精品久久久久aaaa| 国产欧美一区二区三区另类精品| 国内精品伊人久久久久av一坑| 国产欧美日韩一区二区三区在线观看| 国产字幕视频一区二区| 精品96久久久久久中文字幕无| 在线国产精品一区| 蜜臀av性久久久久蜜臀aⅴ四虎| 亚洲永久免费观看| 国产精品一区二区在线观看网站| 狠狠网亚洲精品| 欧美一区二区三区在线播放|