《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 一窺ARM的AI處理器

一窺ARM的AI處理器

2018-05-30
關鍵詞: ARM ADI MLProcesor AI

最近,ARM進一步公開了ML Procesor的一些信息。EETimes的文章“Arm Gives Glimpse of AI Core”[1] 和 AnandTech的文章“ARM Details “Project Trillium” Machine Learning Processor Architecture”分別從不同角度進行了介紹,值得我們仔細分析。


ARM公開它的ML Processor是在今年春節前夕,當時公布的信息不多,我也簡單做了點分析(AI芯片開年)。

這次ARM公開了更多信息,我們一起來看看。首先是關鍵的Feature和一些重要信息,2018年中會Release。


微信圖片_20180530232600.jpg



微信圖片_20180530232732.jpg

???

頂層架構

與最初公布的基本框圖相比,我們這次看到了更細化的模塊框圖和連接關系,如下圖所示。


微信圖片_20180530232809.jpg

MLP的頂層對外來看是個比較典型的硬件加速器,它有本地的SRAM,通過一個ACE-Lite接口和外部交互數據和主要的控制信息(指令)。另外應該還有一些控制信號,估計在這里略去了(可以參考Nvidia的NVDLA)。

在上圖中綠色箭頭應該表示的是數據流,紅色表示控制流。MLP中的CE共享一套DMA,Control Unit和Sync Unit,它的基本處理流程大概是這樣的:1. 配置Control Unit和DMA Engine;2. DMA Engine從外部(如DDR)讀入數據存在本地的SRAM中;3. Input Feature Map Read模塊和Weight Read模塊分別讀入待運算的feature map和weight,處理(比如Weight的解壓縮),并發送到MAC Convolution Engine(后面簡稱為MCE);4. MCE執行卷積等操作,并把結果傳輸給Programmable Layer Engine(后面簡稱為PLE);5. PLE執行其它處理,并將結果寫回本地SRAM;6. DMA Engine把結果傳輸到外部存儲空間(如DDR)。

微信圖片_20180530232846.jpg



在頂層標出的Broadcast接口,實現在多個Compute Engine(后面簡稱為CE)之間廣播feature map數據的功能。因此,基本的卷積運算模式是,相同的feature map廣播到多個CE,不同的CE使用不同的weight來和這些feature map進行運算。

從目前的配置來看,MLP包括16個compute engine,每個有128個MAC,即一共有16x128=2048個MAC,每個cycle可以執行4096個操作。如果要實現ARM所說的4.6TOPS的總的處理能力,則需要時鐘周期達到1.12GHz左右。由于這個指標是針對7nm工藝,實現問題不大。

???

MCE實現高效卷積

在MLP的架構中,MCE和PLE是最重要的功能模塊。MCE提供主要的運算能力(處理90%的運算),應該也是MLP中面積和功耗最大的部分。因此,MCE設計優化的一個主要目標就是實現高效的卷積操作。具體來講,MLP的設計主要考慮了以下一些方法,這些方法大部分我們之前也都討論過。

微信圖片_20180530233208.jpg



一個比較有趣的點是上面提到的“varied internal precision”。目前還不太清楚其具體的含義。不過對應用來說看到的應該是固定的8bit數據類型。至于對低精度Inference的支持,[1]中提供的信息是,“The team is tracking research on data types down to 1-bit precision, including a novel 8-bit proposal from Microsoft. So far, the alternatives lack support in tools to make them commercially viable, said Laudick.” 因此在第一版的MLP中,應該也不會看到低精度或者Bit-serial MAC了(參考AI芯片開年中對ISSCC2018出現的Bit-serial Processing的介紹)。

此外,數據的壓縮和對工藝的優化也是提高整體效率的主要手段。特別是工藝的優化,結合ARM的工藝庫,應該有比較好的效果,這也是ARM有優勢的地方。

???

PLE實現高效的可編程性

如下圖所示,PLE的結構基本是在一個ARM MCU基礎上擴展了Vector處理和NN處理的指令。在討論可編程性的時候,其出發點主要是NN算法和架構目前還在不斷演進。

微信圖片_20180530233242.jpg



我們前面已經分析了整個MLP的基本工作流程,MCE在完成了運算之后把結果傳輸給PLE。從這里可以看出,MCE應該是把結果發送到Vector Register File(VRF),然后產生中斷通知CPU。之后,CPU啟動Vector Engine對數據進行處理。具體如下圖所示。

微信圖片_20180530233412.jpg



對于做專用處理器的同學來說,這種scalar CPU+vector engine的架構并不陌生。這里,本地SRAM,VRF和PLE之外的Maing SRAM Unit(CE中的SRAM)之間有Load/Store單元和uDMA實現數據的傳輸,數據流也是比較靈活的。綜合來看,在MLP中,每個CE中都有一個PLE和MCE配合,即每個MCE(128個MAC)就對應一個可編程架構。因此,ARM MLP的可編程性和靈活性是要遠高于Google TPU1和Nvidia的NVDLA的。當然,靈活性也意味著更多額外的開銷,如[1]中指出的,“The programmable layer engine (PLE) on each slice of the core offers “just enough programmability to perform [neural-net] manipulations””。High-efficient Programmability是MLP的一個主要賣點之一,而ARM的“just enough”是否真是最合適的選擇,還有待進一步觀察。


???

其它信息

在這次發布中信息中,ARM還強調了他們在數據壓縮方面的考慮,包括對lossless compression的硬件支持。這部分內容我在之前的文章中也有比較多的討論,就不再贅述了,貼幾張比較有意思的圖,大家看看。

微信圖片_20180530233450.jpg







微信圖片_20180530233514.jpg

微信圖片_20180530233538.jpg

作為一個IP核,可配置性(configurability)是一個重要的特征。目前還不知道MLP有哪些硬件參數可以支持靈活配置。Compute Engine的數量,MAC數量,SRAM大小,這些比較大的參數應該有可能是支持配置的。其它更細致的內容還要看最終發布的情況。另外,這些參數的配置和相關的軟件工具有非常密切的關系,更多的可配置參數也意味著軟件工具需要相應的支持,難度更大。[2]對此的說法:“In terms of scalability the MLP is meant to come with configurable compute engine setups from 1 CE up to 16 CEs and a scalable SRAM buffer up to 1MB. The current active designs however are the 16CE and 1MB configurations and smaller scaled down variants will happen later on in the product lifecycle.”

???

競爭態勢

除了比較中規中矩的性能指標外,ARM還沒有公布MLP具體的面積,功耗等參數,以及具體發布的日期(目前的說法是“production release of the RTL is on track for mid-year”)。

在這個已經比較“擁擠”的市場,ARM顯然是動作比較慢的。[1]一開始就提到了,“Analysts generally praised the architecture as a flexible but late response to a market that is already crowded with dozens of rivals.”并列舉了一些競爭對手的例子。

其實,從ARM在處理器IP市場和整個生態鏈的關鍵地位來看,晚一點關系也不大。如[1]所說,一方面,ARM正在和一些智能手機廠商進行深度的合作,“ In a sign of Arm’s hunger to unseat its rivals in AI, the company has “gone further than we normally would, letting [potential smartphone customers] look under the hood””。

ARM的另一個重要優勢是,ARM在推出MLP之前在軟件工具上還是有一些準備的,包括armnn和開源的計算庫等等,如下圖。

微信圖片_20180530233602.jpg



這些工具的廣泛使用都可以幫助ARM積累經驗,優化硬件和軟件工具。正如[1]中引用來自ARM的說法,“Winning the hearts and minds of software developers is increasingly key in getting design wins for hardware sockets...This is kind of the start of software 2.0. For a processor company, that is cool. But it will be a slow shift, there’s a lot of things to be worked out, and the software and hardware will move in steps.” 


我們也看到,目前大量的嵌入AI應用還是運行在ARM的各種硬件上的,很多公司在相關算法和實現的優化上投入了很大的力量,也取得了很好的效果。當然這樣帶來另一個有趣的問題,那就是未來引入MLP之后,ML任務到底放到哪里跑?不同特點的處理器怎么配合?文章中正好也提到這個問題,“Arm will release more data on the core’s performance when it is launched, probably in mid-June. But don’t expect detailed guidance on when to run what AI jobs on its CPU, GPU, or new machine-learning cores, a complex issue that the company, so far, is leaving to its SoC and OEM customers.” 看來這個“難題”短期之內還是丟給用戶了。


另外一個值得關注細節是,[1]中提到,“Theoretically, the design scales from 20 GOPS to 150 TOPS, but the demand for inference in the Internet of Things will pull it first to the low end. Arm is still debating whether it wants to design a core for the very different workloads of the data center that includes training. “We are looking at [a data center core], but it’s a jump from here,” and its still early days for thoughts on a design specific for self-driving cars, said Laudick.”從這里可以看出,至少MLP在處理能力上還是具有比較強的伸縮性的,應該可以覆蓋從Edge到Cloud的大部分的inference應用。如果是最高的150TOPS,MAC的規模應該和Google第一代Inference專用的TPU類似,不過相比Google的脈動陣列架構,MLP有更復雜的控制通道,靈活性還是要高不少。不知道未來,這會不會幫助ARM打開data center的inference市場。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美午夜精品久久久久久超碰| 国产亚洲成av人在线观看导航| 欧美在线视频免费| 亚洲免费成人av电影| 欧美国产视频在线观看| 久久精品色图| 夜夜嗨av一区二区三区| 欧美日韩亚洲91| 欧美sm重口味系列视频在线观看| 亚洲免费视频一区二区| 欧美小视频在线| 亚洲全黄一级网站| 欧美日韩视频在线一区二区观看视频| 国产精品99免视看9| 亚洲国产欧美一区二区三区丁香婷| 韩国成人理伦片免费播放| 国产一区二区三区四区三区四| 一本一本久久a久久精品牛牛影视| 免费不卡欧美自拍视频| 欧美全黄视频| 久久国产加勒比精品无码| 亚洲一区视频在线| 亚洲高清在线| 欧美久久久久久蜜桃| 91久久线看在观草草青青| 国产精品激情电影| 在线电影国产精品| 亚洲国产高清aⅴ视频| 一区二区在线看| 国产精品久久久久久影视| 亚洲第一在线综合网站| 欧美日本免费一区二区三区| 国产伦精品一区二区三区视频孕妇| 欧美夜福利tv在线| 欧美日韩国产综合视频在线观看中文| 欧美影院精品一区| 国内精品久久久久久久果冻传媒| 欧美成人综合| 国产美女精品一区二区三区| 亚洲精品一区二区三区樱花| 欧美成人综合| 亚洲伦理一区| 久久精品二区| 国产在线精品一区二区夜色| 国内久久精品| 日韩视频―中文字幕| 亚洲国产精品久久久久婷婷884| 欧美成人精品激情在线观看| 麻豆av一区二区三区| 亚洲第一精品久久忘忧草社区| 国产精品日韩电影| 精品动漫3d一区二区三区| 久久精品中文字幕一区二区三区| 欧美色视频在线| 国产精品久久国产愉拍| 在线观看中文字幕亚洲| 另类国产ts人妖高潮视频| 亚洲国产一区二区三区a毛片| 先锋a资源在线看亚洲| 欧美大片在线观看| 最新成人av网站| 欧美永久精品| 午夜精品久久99蜜桃的功能介绍| 亚洲一区中文字幕在线观看| 久久人人97超碰精品888| 久久精品国产99精品国产亚洲性色| 欧美一区二区在线免费观看| 欧美精品久久久久久久免费观看| 日韩亚洲成人av在线| 亚洲高清中文字幕| 国产欧美日韩一级| 亚洲精品在线三区| 国产乱码精品一区二区三区av| 亚洲黄色免费网站| 欧美激情精品久久久久久久变态| 欧美aaaaaaaa牛牛影院| 国产亚洲一级| 久久精品男女| aa日韩免费精品视频一| 国产伦精品一区二区三区照片91| 野花国产精品入口| 亚洲精品免费观看| 久久久久一区二区三区四区| 国产亚洲综合在线| 日韩视频在线观看一区二区| 亚洲淫片在线视频| 国产精品久久久一区麻豆最新章节| 夜夜嗨一区二区三区| 亚洲高清中文字幕| 国产中文一区二区| 麻豆乱码国产一区二区三区| 欧美在线关看| 一区二区欧美日韩视频| 欧美三级视频在线| 欧美aaa级| 性欧美办公室18xxxxhd| 亚洲一区二区三区四区视频| 国产精品裸体一区二区三区| 国产精品一区三区| 欧美精品在线视频观看| 欧美日韩精品高清| 久久精品一区蜜桃臀影院| 久久久爽爽爽美女图片| 欧美国产视频日韩| 亚洲午夜国产成人av电影男同| 亚洲日本欧美日韩高观看| 在线综合亚洲欧美在线视频| 欧美 日韩 国产 一区| 在线观看国产欧美| 亚洲美女毛片| 欧美视频中文字幕| 一本色道久久综合亚洲91| 亚洲国产一区在线| 国产伦精品一区二区三区免费迷| 激情小说另类小说亚洲欧美| 亚洲国产精品黑人久久久| 亚洲欧洲在线免费| 国产午夜精品久久久| 国产精品女人网站| 国产精品电影网站| 欧美成人资源网| 国产精品亚发布| 国产精品99久久久久久久女警| 亚洲免费观看在线观看| 米奇777在线欧美播放| 国产精品视频久久久| 欧美在线电影| 亚洲精品小视频| 欧美激情精品久久久久久黑人| 欧美激情精品久久久久久久变态| 国产精品国产自产拍高清av| 欧美视频免费在线观看| 在线免费观看一区二区三区| 欧美精品情趣视频| 亚洲欧美视频一区| 免费观看成人网| 欧美女人交a| 蜜乳av另类精品一区二区| 欧美激情精品久久久久久久变态| 欧美日韩一区二区三区视频| 在线播放国产一区中文字幕剧情欧美| 亚洲视频一区二区| 麻豆成人在线播放| 裸体女人亚洲精品一区| 午夜在线视频一区二区区别| 亚洲视频在线二区| 国产一二三精品| 一区二区欧美在线| 欧美午夜电影完整版| 欧美三级欧美一级| 亚洲网址在线| 免费观看成人www动漫视频| 欧美α欧美αv大片| 狠狠色狠狠色综合系列| 欧美一区二区三区四区夜夜大片| 国产精品有限公司| 亚洲九九九在线观看| 欧美色精品在线视频| 亚洲一区二区免费视频| 国产性做久久久久久| 欧美精品尤物在线| 亚洲激情电影在线| 亚洲精品日韩综合观看成人91| 欧美日韩午夜在线| 在线精品视频免费观看| 国产精品影片在线观看| 亚洲激情在线播放| 久久亚洲春色中文字幕| 亚洲高清在线精品| 久久成人免费| 久久精品国产第一区二区三区| 快she精品国产999| 欧美三级日韩三级国产三级| 羞羞视频在线观看欧美| 一区二区三区在线观看欧美| 国内成+人亚洲+欧美+综合在线| 欧美日本亚洲韩国国产| 亚洲国产日韩欧美一区二区三区| 9久草视频在线视频精品| 欧美日韩国产区| 91久久精品国产91久久性色tv| 在线成人中文字幕| 国产精品视频区| 国产欧美一二三区| 欧美日韩免费高清一区色橹橹| 亚洲欧美一区二区三区久久| 国产日韩一区二区三区在线播放| 欧美激情一区二区三级高清视频| 久久精品免视看| 好吊日精品视频| 狠狠色噜噜狠狠狠狠色吗综合| 一区二区三区**美女毛片| 国产精品久久波多野结衣| 蜜桃精品久久久久久久免费影院| 狠狠狠色丁香婷婷综合激情| 久久高清免费观看| 免费一级欧美在线大片| 午夜亚洲视频| 国产日产精品一区二区三区四区的观看方式| 欧美网站在线| 国产精品视频免费一区| 国产午夜精品理论片a级大结局| 亚洲日本va午夜在线电影| 国产一区二区三区四区老人| 欧美视频在线不卡| 久久人人爽人人爽爽久久| 国产精品久久久亚洲一区| 国产情侣久久| 亚洲欧美欧美一区二区三区| 永久域名在线精品| 欧美日本久久| 欧美日韩一区二区视频在线观看| 国产精品久久久久久久9999| 黄色成人在线观看| 欧美另类综合| 亚洲精品永久免费精品| 亚洲性视频网站| 国产日韩成人精品| 欧美国产日韩免费| 亚洲一区二区久久| 91久久精品美女| 欧美一区午夜视频在线观看| 在线成人小视频| 亚洲国产精品久久久| 羞羞色国产精品| 国产精品一区在线观看| 亚洲激情一区二区三区| 欧美日韩黄色大片| 一本色道久久综合狠狠躁的推荐| 国内精品久久久久影院色| 国产精品美女久久福利网站| 久久人人爽国产| 麻豆精品国产91久久久久久| 亚洲午夜精品久久久久久app| 久久久精品国产99久久精品芒果| 欧美精品三区| 日韩午夜免费| 国产精品普通话对白| 国产日韩欧美一区二区三区在线观看| 久久综合九色九九| 亚洲一区二区成人在线观看| 欧美三日本三级少妇三2023| 亚洲一区在线视频| 欧美日韩一区三区| 国产日韩欧美91| 午夜亚洲一区| 日韩午夜免费| 久久久久天天天天| 国产精品久久久久9999吃药| 在线观看国产成人av片| 国产性猛交xxxx免费看久久| 亚洲第一二三四五区| 一本色道久久加勒比精品| 亚洲乱码国产乱码精品精可以看| 欧美天天在线| 久久婷婷丁香| 日韩一级黄色片| 亚洲电影免费在线| 在线精品一区二区| 午夜欧美大尺度福利影院在线看| 久久成年人视频| 性视频1819p久久| 日韩一二三在线视频播| 亚洲第一在线综合在线| 在线日韩日本国产亚洲| 欧美一级午夜免费电影| 欧美色综合天天久久综合精品| 狠狠色丁香婷综合久久| 性欧美xxxx大乳国产app| 乱中年女人伦av一区二区| 欧美美女日韩| 亚洲精品久久久久久一区二区| 亚洲欧美日韩久久精品| 亚洲精品乱码久久久久久久久| 亚洲欧洲在线看| 欧美诱惑福利视频| 久久精品亚洲一区二区三区浴池| 91久久精品国产91性色tv| 一区二区三区在线免费观看| 欧美一区二区三区的| 亚洲一级黄色片| 免费不卡中文字幕视频| 欧美午夜一区二区福利视频| 亚洲视频一起| 国产午夜精品全部视频在线播放| 欧美日本一道本在线视频| 国产美女高潮久久白浆| 欧美精品日本| 久久久青草青青国产亚洲免观| 久久精品亚洲国产奇米99| 久久国产一区二区| 亚洲欧美变态国产另类| 国产拍揄自揄精品视频麻豆| 狠狠干成人综合网| 久久久久久久久伊人| 午夜欧美不卡精品aaaaa| 国产一区二区无遮挡| 欧美日韩综合网| 久久蜜臀精品av| 国产精品久久久久aaaa樱花| 久久综合色天天久久综合图片| 欧美在线国产精品| 老司机免费视频一区二区三区| 亚洲第一黄色网| 亚洲日本欧美在线| 美女精品视频一区| 国产日韩欧美不卡在线| 亚洲一区二区av电影| 国产精品日韩在线| 国产亚洲成av人片在线观看桃| 欧美私人啪啪vps| 国产精品狼人久久影院观看方式| 韩国在线视频一区| 欧美a级在线| 欧美成人黑人xx视频免费观看| 日韩视频久久| 中文一区二区| 国产视频精品免费播放| 欧美日韩综合视频网址| 国产精品视频| 久久久无码精品亚洲日韩按摩| 亚洲精品日韩在线| 久久久精品欧美丰满| 欧美日韩成人网| 欧美成人精精品一区二区频| 亚洲在线观看| 快射av在线播放一区| 欧美夫妇交换俱乐部在线观看|