《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 神經網絡前向傳播在GPU上的實現
神經網絡前向傳播在GPU上的實現
來源:微型機與應用2011年第18期
劉進鋒,郭 雷
(西北工業大學 自動化學院,陜西 西安710129)
摘要: 基于CUDA架構在GPU上實現了神經網絡前向傳播算法,該算法利用神經網絡各層內神經元計算的并行性,每層使用一個Kernel函數來并行計算該層神經元的值,每個Kernel函數都根據神經網絡的特性和CUDA架構的特點進行優化。實驗表明,該算法比普通的CPU上的算法快了約7倍。研究結果對于提高神經網絡的運算速度以及CUDA的適用場合都有參考價值。
關鍵詞: 軟件 神經網絡 CUDA GPU
Abstract:
Key words :

摘  要: 基于CUDA架構在GPU上實現了神經網絡前向傳播算法,該算法利用神經網絡各層內神經元計算的并行性,每層使用一個Kernel函數來并行計算該層神經元的值,每個Kernel函數都根據神經網絡的特性和CUDA架構的特點進行優化。實驗表明,該算法比普通的CPU上的算法快了約7倍。研究結果對于提高神經網絡的運算速度以及CUDA的適用場合都有參考價值。
關鍵詞: 神經網絡;CUDA;GPU

    GPU(圖形處理器)是處理計算機圖形的專用設備。近十年來,由于高清晰度復雜圖形實時處理的需求,GPU發展成為高并行度、多線程、多核的處理器。目前主流GPU的運算能力已超過主流通用CPU,從發展趨勢上看將來差距會越來越大。GPU卓越的性能對開發GPGPU(使用GPU進行通用計算)非常具有吸引力。最初GPGPU需要將非圖形應用映射為圖形應用的方式,這個處理過程與圖形硬件緊密相關,程序實現非常困難。近年來,GPU的主要供應商NVIDIA提出了新的GPGPU模型,稱為CUDA(統一計算設備架構)[1]。
    CUDA是一種在NVIDIA公司的GPU上進行計算的新型的硬件和軟件架構,可以將GPU視為一個并行數據計算的設備,對所進行的計算給予分配和管理。在CUDA的架構中,這些計算不再像過去的GPGPU架構那樣必須將計算映射到圖形API中,開發者不需要去學習艱澀的顯示芯片的指令或是特殊的結構,因此開發門檻大大降低。CUDA的GPU編程語言基于標準的C語言,開發CUDA的應用程序較為方便。
    在CUDA架構下,一個程序分為兩個部分:host端和device端。host端是指在CPU上執行的部分,而device端則是在GPU上執行的部分。device端的程序又稱為Kernel。通常host端程序會將數據準備好后,復制到顯卡的內存中,再由GPU執行device端程序,完成后再由host端程序將結果從顯卡的內存中取回。
    在CUDA架構下,GPU執行時的最小單位是線程(thread)。幾個線程可以組成一個線程塊(block),每個線程都有自己的一份寄存器(register)和本地內存(local memory)空間。同一個線程塊中的每個線程則可以共享一份共享內存(shared memory)。此外,所有的線程都共享一份全局內存(global memory)、常量內存(constant memory)和紋理內存(texture memory)。
    自從CUDA發布以來,大量應用問題使用CUDA技術取得了令人驚奇的效果,加速十幾倍甚至上百倍的實例很多。參考文獻[2]對這些應用有一個綜合介紹。
    最適合利用 CUDA 處理的問題,是可以大量并行化的問題,這樣能有效利用顯示芯片上的大量執行單元。使用 CUDA 時,上千個線程同時執行是很正常的。如果問題不能大量并行化,使用 CUDA 就不能達到最好的效率。參考文獻[3]通過許多成功應用CUDA加速的實例探討了CUDA的高效實現策略及應用范圍問題。
1 本文使用的神經網絡簡介
    本文實驗選用的是一個較為復雜的用于手寫漢字識別的神經網絡[4-6]。該網絡是一種五層卷積神經網絡,結構如圖1所示。選擇這樣一個神經網絡基于兩點考慮:其一,過于簡單的神經網絡結構不易體現GPU計算的優勢;其二,此網絡的結構比較全面,在它上面實現的算法有一定的代表性,做一些修改就可以用在其他不同的神經網絡結構上。

    該神經網絡第一層輸入層是手寫數字的灰度圖像,圖像大小為29×29像素,這樣輸入層有29×29=841個神經元。第二層是卷積層,由6個特征圖組成,每個特征圖的尺寸是13×13個神經元,每個神經元的值是由輸入圖像的13×13個位置(輸入圖像水平和垂直方向的29個位置間隔選擇13個)上作5×5的卷積得到。一個特征圖的卷積核相同,各特征圖的卷積核不同。這樣第二層有13×13×6=1014個神經元,有(5×5+1)×6=156個權值(每個5×5多加一個偏向權值,后面各層中權值數量計算公式中+1都是加一個偏向權值)。另外,因為1 014個神經元每個都有26個與輸入層的連接,所以從輸入層到第二層共有1014×26=26364個連接。這里就能看出卷積神經網絡共享權值的好處了:雖然有26 364個連接,但只需要156個權值來控制。第三層也是一個卷積層,它有50個特征圖構成,每個特征圖是5×5大小,是從第二層的6個13×13的特征圖的相應區域作5×5卷積得到。這樣第三層就有5×5×50=1250個神經元,(5×5+1)×6×50=7800個權值,1250×26=32500個與第二層的連接。第四層是有100個神經元的全連接層,因為是全連接,本層的每個神經元都與第三層的全部1 250個神經元連接,這樣所有的連接就有100×(1250+1)=125100個,有125 100個權值。第五層是輸出層,該層有10個全連接的單元,每個單元都與第四層的所有100個神經元連接,這樣本層就有10×(100+1)=1010個連接,有1010個權值。這10個神經元對應10個數字 ,其中對應于識別結果的一個神經元的輸出值為+1,其他9個神經元的輸出值為-1。
    整個網絡總共有3 215個神經元,134 066個權值,184 974個連接。輸入層神經元數據和各層神經網絡的權值已知。

    GPU上神經網絡前向傳播算法基本過程是逐層計算各層的所有神經元的值。
    輸入層神經元值已知,其余每層有一個Kernel函數來計算該層的所有神經元的值,上述的神經網絡需要4個Kernel函數。并行計算只能體現在一層中,不同層之間沒有并行性。
    首先將輸入層的神經元值和每層的權值保存在5個數組中,并從host內存傳遞到device內存。由于每層的權值是不變的,所以可以將這些權值傳遞到device的常量內存中,由于常量內存有cache,這比放到全局內存的存取速度要快很多。在device中為第二到第五層的神經元值分配內存空間,第一個Kernel函數根據輸入層的神經元值和權值計算第二層神經元值,第二個Kernel函數根據第二層的神經元值和權值計算第三層神經元值,如此往下,第四個Kernel函數計算出第五層即輸出層的值,然后將該值從device內存傳遞到host內存。神經網絡的連接體現在每個Kernel函數處理計算過程里。
    計算第二層神經元值的基本Kernel函數的偽代碼如下:
    1:bid=blockIdx.x;
    2:tx=threadIdx.x;  ty=threadIdx.y;
    3:wt=ty*2*29+tx*2;   result=0;
    4:templet[25]={    0,  1,  2,  3,  4,
                    29, 30, 31, 32, 33,
                    58, 59, 60, 61, 62,
                    87, 88, 89, 90, 91,
                    116,117,118,119,120};
    5:for(i=0;i<25;++i)
    6: result+=Gn1[wt+templet[i]]*Gw1[bid*26+i+1];
    7:result=(1.7159*tanhf(0.66666667*result));
    8:Gn2[13*13*bid+ty*13+tx]=result;
    該函數的輸入為第一層的神經元值數組Gn1和權值數組Gw1,輸出為第二層的神經元值數組Gn2。
    因為第二層由6個特征圖構成,每個特征圖有13×13個神經元,所以這個函數在host端調用時,線程塊參數設置為6,線程參數設置為13×13,這樣一個線程塊處理一個特征圖,每個神經元值由一個線程處理,由第一層中取25個神經元乘以權值再加上一個偏向權值的累加得到。
    這個函數的第1、2行得到線程塊號和線程號,第4行的templet數組是為了在輸入層中選擇25個值的模版。第5、6行的循環計算出激活值,第7行對該值進行激活運算,第8行將結果送到第二層的神經元值數組Gn2。
    上述函數還可以修改的效率更高些,第4行的templet數組是默認分配在全局內存中的,而訪問全局內存需要相對較長的時間,因此有必要消除這種訪存時間消耗。通過將第5、6行的for循環展開,templet[i]的值直接寫在代碼里,就既可以在程序中不要templet數組,又減少了循環判斷的時間代價。
    對函數的4~6行進行修改,其他行不變。改變了的部分代碼如下:
    4:__shared__ float s1[29*29];
    5://將Gn1數組元素送到s1數組;
    6:result=s1[wt]*Gw1[bid*26+1]+
            s1[wt+1]*Gw1[bid*26+2]+
            s1[wt+2]*Gw1[bid*26+3]+…
    //其他省略,一共有25個乘累加
    第4行定義了一個在共享內存中的數組s1。將Gn1數組中的數據先傳到s1中,第6行就不再需要引用Gn1數組,而是使用數組s1。由于存取共享內存的速度比存取全局內存快得多,這種改進進一步提高了速度。
    計算第三層神經元值的Kernel函數,基本結構與上述的函數類似。也可以使用類似處理方式進一步提高速度。該函數在host端調用時,線程塊數參數設置為50,線程參數設置為5×5。一個線程塊處理一個特征圖,每個神經元值由一個線程處理。
    第三層到第四層是全連接層,計算第四層的Kernel函數可以有兩種實現方案。方案1:由于第四層有100個神經元,可以設計成有100個線程塊,每個線程塊只有一個線程,一個線程計算一個神經元的值。這樣一個線程計算量還是很大的,大約需要作1 250個乘法和加法。另外,每個線程塊只有一個線程,無法充分利用CUDA的Warps切換能力[1]。這種方案沒有完全發揮GPU的能力,因而效率不太高。方案2:還是有100個線程塊,每個線程塊有250個線程,250個線程計算一個神經元的值,每個線程作5次乘法和加法,最后由第一個線程將這些和累加,得到最終的值。這種方案效率較高。
    計算第五層的神經元值需要約1 010次浮點乘法和加法,實驗證明該層由于計算量相對較小,體現不出在Kernel端計算的優勢,計算時間甚至比在host端更長。
3 實驗結果
    本試驗使用機器的CPU是Intel Core 2 Duo E7400,時鐘頻率為2.8 GHz,內存為1 GB。GPU是NVIDIA GeForce GTX9800+,該GPU有128個頻率為1.836 GHz的流處理器,分為16個SM,512 MB顯存。
    GPU上算法實現采用上文描述的最優化的方案,即每層的權值放入device端的常量內存,函數中的循環展開,利用共享內存,計算第四層神經元值時采用方案2。
    試驗結果如表1所示,分別給出了使用CPU和GPU計算本文神經網絡前向傳播時各層所用時間對比,這是經過三次試驗求得的平均值。GPU實現采用最優化的方案,CPU上的實現方法就是通常的神經網絡前向傳播算法,這里不再贅述。CPU上計算整個神經網絡前向傳播需要1.851 ms,GPU計算需要0.272 ms,比CPU上計算快了約7倍。


    本文對神經網絡的前向傳播在GPU上計算進行了研究,得到了比較滿意的結果。使用本方法需要注意以下幾個方面:

 


    (1)GPU算法前期處理時要把一些數據從CPU裝入GPU,還需要在GPU上給一些數據分配內存空間,這些前期處理都要花費時間,所以如果只做一次神經網絡前向傳播運算,GPU上的實現可能比CPU上的還要慢,但由于前期處理只做一次,所以多次神經網絡前向傳播運算能體現出GPU運算的好處。這種情況可能出現在多個測試數據的驗證或計算神經網絡后向傳播時。
    (2)當神經網絡規模較小時,可能GPU方法會比CPU方法慢,比如本網絡的最后一層的規模。
    (3)有些應用問題在GPU上計算時速度能提高上百倍[3],而神經網絡在GPU上運算速度提高有限,這是因為神經網絡的并行性主要體現在同一層,總體并行性不太高。要想充分發揮GPU的運算能力,那些應用問題應該具有計算復雜度高、數據傳輸量少的特點,或者能修改原來的算法,使得計算-內存訪問比提高。
參考文獻
[1] NVIDIA Corporation.NVIDIA CUDA programming Guide Version 2.2[EB/OL],2009-04.http://developer.nvidia.com/cuda.
[2] RYOO S,RODRIGUES C I,BAGHSORKHI S S,et al. Optimization principles and application performance evaluation of a multithreaded GPU using CUDA[J].In Proceedings  of ACM SIGPLAN Symposium on Principles and Practice of  Parallel Programming,2008:73-82.
[3] HWU W M,RODRIGUES C,RYOO S,et al.Compute  unified device architecture application suitability[J].Computing in Science and Engineering,2009,11(3):16-26.
[4] LECUN Y,BOTTOU L,BENGIO Y,et al.Gradient-based learning applied to document recognition[J].Proceedings  of the IEEE,1998,86(11):2278-2324.
[5] SIMARD P Y,STEINKRAUS D,PLATT J.Best practices  for convolutional neural networks applied to visual document analysis[C].International Conference on Document Analysis and Recognition(ICDAR),IEEE Computer Society,Los Alamitos,2003:958-962.
[6] Mike O′Neill.Neural network for recognition of handwritten digits[EB/OL],2006-12.http://www.codeproject.com/KB/library/NeuralNetRecognition.aspx.

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          av不卡在线| 国产欧美日韩一区| 伊人久久大香线蕉综合热线| 欧美视频日韩视频| 在线日韩中文字幕| 久久久久久久一区二区三区| 99成人免费视频| 国内成+人亚洲+欧美+综合在线| 亚洲综合首页| 欧美日韩免费在线| 一区二区三区在线免费播放| 久久久久久999| 欧美日韩亚洲一区二区三区在线| 亚洲国产精品久久久久婷婷老年| 欧美精品91| 免费观看成人鲁鲁鲁鲁鲁视频| 久久久久久久999| 欧美精品久久久久久久久久| 美女啪啪无遮挡免费久久网站| 日韩视频精品在线观看| 老妇喷水一区二区三区| 亚洲丝袜av一区| 亚洲专区一区二区三区| 久久精品99| 一本色道久久综合精品竹菊| 国产精品色午夜在线观看| 欧美女人交a| 韩国精品久久久999| 久久久www成人免费毛片麻豆| 亚洲精选久久| 欧美国产日韩精品免费观看| 欧美精品日韩www.p站| 欧美日韩一区二区三区| 亚洲国产va精品久久久不卡综合| 欧美一区二区视频观看视频| 久久国内精品自在自线400部| 久久伊人免费视频| 国产精品一区二区久久久| 在线视频中文亚洲| 亚洲国产婷婷综合在线精品| 欧美激情精品久久久久久免费印度| 久久精品亚洲精品国产欧美kt∨| 亚洲综合成人在线| 欧美一区二区三区成人| 亚洲午夜黄色| 91久久精品网| 欧美一站二站| 欧美三级在线视频| 国产亚洲成av人在线观看导航| 欧美激情性爽国产精品17p| 欧美劲爆第一页| 久久久www成人免费毛片麻豆| 国产一区亚洲| 亚洲在线播放| 亚洲午夜精品在线| 在线看国产日韩| 亚洲日本中文字幕免费在线不卡| 欧美成人一区在线| 亚洲深爱激情| 久久国产欧美精品| 亚洲桃花岛网站| 亚洲精品乱码久久久久久久久| 激情亚洲一区二区三区四区| 99国产精品一区| 欧美午夜免费影院| 国产欧美日韩免费看aⅴ视频| 国产精品亚洲欧美| 久久琪琪电影院| 一区二区三区欧美在线观看| 欧美在线不卡视频| 久久这里只有精品视频首页| 亚洲一区二区三区四区视频| 国产日韩亚洲欧美精品| 精品av久久久久电影| 国产精品欧美精品| 久久精品二区亚洲w码| 免费观看日韩av| 国产精品午夜国产小视频| 午夜精品福利视频| 国产精品一国产精品k频道56| 一区精品在线| 洋洋av久久久久久久一区| 模特精品裸拍一区| 蜜臀av国产精品久久久久| 免费久久99精品国产自在现线| 91久久精品一区二区三区| 国产三级精品三级| 国产日韩精品视频一区二区三区| 老司机精品视频一区二区三区| 欧美色综合天天久久综合精品| 国产一区二区日韩精品欧美精品| 91久久精品国产| 99国产精品视频免费观看| 99国产精品自拍| 亚洲精品一区二区网址| 久久成人精品无人区| 国产日韩亚洲欧美| 红桃视频国产一区| 欧美精品在线一区二区| 国产老女人精品毛片久久| 黄色成人av网| 亚洲电影下载| 亚洲午夜久久久久久久久电影网| 欧美电影电视剧在线观看| 国产精品视频免费| 国产精品白丝jk黑袜喷水| 日韩网站在线| 欧美日韩国产丝袜另类| 欧美在线综合| 欧美一区二区免费| 亚洲福利小视频| 欧美精品一区二区高清在线观看| 欧美日韩另类一区| 国产精品一区在线观看| 先锋影音久久| 久久亚洲春色中文字幕久久久| 久久视频国产精品免费视频在线| 亚洲麻豆av| 性欧美video另类hd性玩具| 欧美一区三区三区高中清蜜桃| 欧美日韩网址| 在线观看一区欧美| 欧美黄色一区| 久久久精品免费视频| 最新中文字幕亚洲| 欧美日韩一区三区四区| 欧美在线一区二区三区| 国产精品视频yy9099| 美女视频一区免费观看| 一区二区国产精品| 久久久91精品| 欧美国产精品va在线观看| 亚洲自拍偷拍福利| 一本色道久久88亚洲综合88| 欧美高清视频在线| 亚洲电影第1页| 久久国产一区| 欧美三级电影一区| 欧美日韩国内自拍| 久久大香伊蕉在人线观看热2| 欧美国产精品专区| 久久精品夜夜夜夜久久| 亚洲小视频在线观看| 国产一区二区精品久久99| 亚洲视频一二三| 欧美在线视频在线播放完整版免费观看| 先锋影音国产一区| 久久成人免费日本黄色| 日韩一区二区精品| 夜夜爽夜夜爽精品视频| 午夜精品短视频| 亚洲免费在线视频| 欧美精品麻豆| 国产精品一区久久| 国产偷国产偷亚洲高清97cao| 亚洲日本中文字幕区| 久久久美女艺术照精彩视频福利播放| 久久嫩草精品久久久精品| 99亚洲一区二区| 久久久久久成人| 欧美日韩视频在线| 日韩视频专区| 海角社区69精品视频| 国产精品久久久久久久久久妞妞| 久久九九电影| 亚洲免费在线| 欧美视频精品在线| 亚洲免费观看高清完整版在线观看| 国产精品久久久久aaaa樱花| 欧美影院视频| 激情欧美国产欧美| 亚洲一区二区三区午夜| 亚洲日本理论电影| 亚洲视频福利| 日韩一级免费观看| 国产精品亚洲网站| 欧美日韩免费观看一区三区| 欧美国产精品va在线观看| 99精品免费视频| 国产综合亚洲精品一区二| 国产精品一区二区三区免费观看| 国产综合自拍| 欧美jizzhd精品欧美喷水| 榴莲视频成人在线观看| 欧美日韩另类综合| 亚洲一区二区三区欧美| 欧美综合77777色婷婷| 亚洲电影第1页| 亚洲最新合集| 亚洲国产毛片完整版| 国产一区二区三区的电影| 欧美日韩一区三区四区| 国产一级精品aaaaa看| 久久久久久国产精品mv| 另类春色校园亚洲| 毛片基地黄久久久久久天堂| 欧美一区综合| 国产欧美精品va在线观看| 影音国产精品| 国产精品久久久一本精品| 香蕉免费一区二区三区在线观看| 亚洲精选久久| 欧美精品18videos性欧美| 亚洲性视频网站| 国产精品入口夜色视频大尺度| 在线视频国内自拍亚洲视频| 久久亚洲欧美国产精品乐播| 久久精品99| 欧美专区一区二区三区| 亚洲天堂免费观看| 欧美日韩一二区| 久久精品国产清自在天天线| 国产一区再线| 亚洲欧美日韩久久精品| 先锋影音一区二区三区| 亚洲电影av在线| 欧美激情片在线观看| 欧美成人性网| 欧美一级艳片视频免费观看| 美国成人毛片| 久久久久久久久综合| 午夜一区二区三视频在线观看| 欧美视频在线看| 国产日韩在线亚洲字幕中文| 久久爱www.| 久久综合久久综合九色| 尤物精品国产第一福利三区| 欧美日韩少妇| 国产一区二区三区在线观看视频| 99国产精品视频免费观看一公开| 久久亚洲综合| 国产一区二区剧情av在线| 中日韩午夜理伦电影免费| 国内精品久久久久影院 日本资源| 久久青草久久| 亚洲麻豆av| 欧美午夜视频在线观看| 亚洲制服丝袜在线| 亚洲网站在线看| 欧美另类videos死尸| 欧美国产视频一区二区| 国产欧美一区二区精品性色| 一区视频在线播放| 国产一区二区日韩精品欧美精品| 亚洲精品看片| 一本色道久久88综合日韩精品| 性欧美1819sex性高清| 午夜在线不卡| 欧美吻胸吃奶大尺度电影| 一区二区亚洲精品国产| 在线日本高清免费不卡| 一本色道精品久久一区二区三区| 在线日韩av| 一区二区三区欧美视频| 日韩西西人体444www| 国产精品免费一区豆花| 亚洲人www| 国产精品一区二区在线观看| 欧美日韩一区在线播放| 午夜精品久久| 欧美精品自拍偷拍动漫精品| 久久国产精品免费一区| 麻豆av一区二区三区| 亚洲午夜国产成人av电影男同| 欧美日韩一区二区三区四区五区| 性18欧美另类| 久久亚洲午夜电影| 韩国v欧美v日本v亚洲v| 在线综合亚洲欧美在线视频| 欧美大片在线观看一区二区| 亚洲一区精品在线| 久久婷婷蜜乳一本欲蜜臀| 欧美国产乱视频| 欧美中文字幕在线播放| 欧美成人免费全部观看天天性色| 亚洲尤物在线| 欧美sm视频| 妖精视频成人观看www| 日韩一区二区精品葵司在线| 一区二区在线观看视频在线观看| 欧美激情小视频| 免费成人av在线看| 国产一区二区精品在线观看| 欧美性视频网站| 午夜精品久久久久影视| 久久国产精品99精品国产| 亚洲视频第一页| 久久亚洲私人国产精品va媚药| 香蕉成人久久| 久久久久久婷| 国产精品热久久久久夜色精品三区| 在线一区欧美| 一区二区三区www| 免费在线欧美黄色| 另类春色校园亚洲| 国产精品视频精品视频| 久久久久国产成人精品亚洲午夜| 久久久久久亚洲精品不卡4k岛国| 久久免费视频在线观看| 国产精品久久久爽爽爽麻豆色哟哟| 久久综合影视| 久久综合给合| 亚洲午夜激情免费视频| 国产精品一区在线播放| 1000部国产精品成人观看| 久久伊人精品天天| 亚洲欧美日韩精品一区二区| 欧美日韩精品一区视频| 欧美激情一区三区| 欧美一级一区| 久久精品亚洲一区二区| 亚洲国产精品成人综合色在线婷婷| 91久久在线观看| 欧美性事免费在线观看| 久久久久久久一区二区三区| 亚洲一区二区久久| 亚洲裸体在线观看| 欧美一区二区三区在线看| 一区二区三区在线免费观看| 国产精品久久久久999| 欧美日韩另类丝袜其他| 国产欧美精品在线| 欧美国产日本韩| 日韩午夜免费| 亚洲国产精品尤物yw在线观看| 一区二区动漫| 欧美福利视频一区| 极品尤物久久久av免费看|