《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于龍芯3B的H.264解碼器的向量化
基于龍芯3B的H.264解碼器的向量化
現代電子技術
裴曉航 何頌頌
中國科學技術大學
摘要: 本文實現了ffmpeg解碼器到龍芯3B平臺的移植,并針對龍芯3B所支持的向量擴展指令,對ffmpeg解碼器進行了向量化。實驗結果表明:實現向量化的ffmpeg解碼器,其性能比使用GCC向量化編譯得到的ffmpeg解碼器具有更好的性能,而且性能提升的比率比在一些商業平臺上更大。
Abstract:
Key words :

0 引言

當今社會已經步入信息時代,傳統的信息載體和通信方式已經無法滿足人們對信息的需求。而實驗表明:相比較語音和抽象數據,人類接受的信息更多是以圖片和視頻方式為載體的。其中視頻信息具有直觀、具體和高效的特點,這也就決定了視頻通信技術將成為信息時代的重要技術之一。

由于視頻的數據量巨大,而存儲視頻的資源通常是非常有限的,因而對視頻進行壓縮編碼,以減少存儲資源的消耗,非常必要。然而,通常情況下,使用的壓縮算法的復雜度越高,壓縮比率越高,視頻播放時的解碼速度就會越低。因而在提高編碼壓縮率的同時,也需要對解碼器進行相應的優化,以提高視頻解碼器在目標平臺上的性能。本文就實現了ffmpeg解碼器在龍芯3B上的移植與向量化,提高了該解碼器在龍芯3B上的性能。

1 視頻編/解碼與龍芯3B

1.1 視頻編/解碼

目前,成熟的壓縮編/解碼方法有很多。其中H.261、MPEG-1、MPEG-3和H.263采用了第一代壓縮編碼方法,如預測編碼、變換編碼、熵編碼以及運動補償;而MPEG-4和H.264采用了第二代的壓縮編碼方法,如分段編碼和基于模型或對象的編碼等。

視頻壓縮編碼的主要目的是減少存儲視頻所占用的資源,而解碼技術的目標則是提高解碼的速度,從而提高視頻播放的流暢性。常見的基于H.264編碼方法的軟解碼器包括CoreAVC、ffmpeg和JM等。其中JM是H.264官方網站提供的編/解碼器,集合了各種編/解碼算法,而且代碼的結構清晰,很適合應用于對視頻編/解碼技術的研究。而CoreAVC解碼器則主要用于商用,其解碼速率比ffmpeg快50%以上。ffmpeg是開源的解碼器,而且性能相對較好,很多開源項目都直接或間接地使用了ffmpeg,如mplayer播放器等。通過對性能以及開源特性的綜合考慮,本文選擇ffmlpeg作為移植和向量化對象。

1.2 龍芯3B體系結構

龍芯3B處理器在兼容了MIPS64指令集的同時,實現了針對多媒體應用的向量擴展指令,這對視頻編/解碼應用性能的提升有很大的幫助。

龍芯3B提供了256位的向量寄存器并實現包括256位向量訪存在內的向量擴展指令。使用向量指令可以一次完成32個字節寬度數據的操作。而這樣的結構和指令集設計,使得龍芯3B非常適合于實現大規模相同類型數據的相同運算,比如矩陣乘法運算和FFT運算,以及視頻編/解碼運算等。

不過由于ffmpeg并未實現對龍芯3B平臺的支持,因而需要完成ffmpeg到龍芯3B的移植工作。本文之前也有一些ffmpeg到其他平臺的移植工作和針對龍芯平臺的移植與優化工作,都取得了不錯效果。

2 基于龍芯3B的ffmpeg移植

2.1 ffmpeg的移植

ffmpeg解碼器提供了對不同目標平臺的支持,而與這些平臺相關的文件都保存在以該目標平臺命名的目錄下。例如,ffmpeg解碼器實現了對arm和sparc平臺,以及x86平臺的支持。

對于實現ffmpeg解碼器對龍芯3B的支持,主要完成以下5個步驟:

(1)修改configure配置文件,增加與龍芯體系結構相關的配置選項;

(2)新建龍芯專用文件夾godson,將龍芯體系結構相關的文件都存放于該文件夾中;

(3)將godson文件夾下新增的需要編譯的文件添加到Makefile中;

(4)增加與dsputil_init類似的新的初始化函數dsputil_init_godson;

(5)在頭文件中添加新增函數的聲明。

針對龍芯3B的ffmpeg移植工作相對比較簡單,因而本文重點介紹針對龍芯3B的向量化工作。

2.2 移植后的ffmpeg的性能比較

本節對移植后的ffmpeg解碼器進行了性能測試,對使用龍芯3B向量擴展指令和不使用龍芯3B擴展指令兩種情況下的性能進行了比較。測試時使用支持龍芯3B擴展指令集的GCC編譯器進行編譯,并且開啟-ftree-vectorize和-march=godson3b編譯選項來支持龍芯 3B擴展指令。使用的測試用例為視頻“walk_vag_640x480_qp26.264”,測試結果如表1所示。

從表1的測試結果中可以看出,使用龍芯3B的向量擴展指令可以提高ffmpeg解碼器在龍芯3B上的性能,用來測試的視頻的解碼時間減少了約466s。盡管如此,由于GCC編譯器本身自動向量化能力的限制,ffmpeg解碼器的性能提升還是比較有限的,因而針對龍芯3B的指令集對移植后的ffmpeg解碼器進行向量化,就成為了進一步提高性能的重要工作。

3 ffmpeg的向量化

3.1 ffmpeg的oprofile測試

使用oprofile對ffmpeg解碼視頻“問道武當002.mkv”的過程進行測試,測試結果如表2所示。表2列出了各個函數的調用過程以及運行時間所占的比重。而針對ffmpeg解碼器進行的向量化工作,則主要是針對oprofile測試結果中執行時間較長、運行比重較大的幾個函數的向量化。

上述函數的執行時間幾乎占據了ffmpeg解碼器執行時間的60%,因而針對上述幾個函數進行向量化,就完全可以達到提升ffmpeg整體解碼速度的目的。

3.2 針對龍芯3B的ffmpeg向量化

3.2.1 向量化方法

實現ffmpeg解碼器在龍芯3B上的向量化主要是使用龍芯3B擴展的向量指令來改進3.1節中oprofile測試結果中執行時間比重較大的幾個函數。而且在向量化的同時,同樣可以使用一些優化策略,來提高向量化后的函數的性能。主要使用到的優化方法包括:

(1)循環展開。循環展開是一種循環變換技術,將循環體中的指令復制多份,增加循環體中的代碼量,減少循環的重復次數。需要說明的是,循環展開本身并不能直接提升程序的性能。

使用循環展開的主要目的是充分挖掘指令或者數據間的并行性。其中向量擴展指令的使用就是利用了展開后的循環體內數據的并行性;而在展開后的循環內使用指令調度和軟件流水技術則是為了充分利用指令間的并行性。

(2)指令調度。循環展開后的循環體內的指令數目增多,因而可以進行指令調度,將不存在操作數相關性和不存在運算部件相關性的指令調度到一起,這樣可以充分發揮龍芯3B的流水線性能,從而提高代碼在龍芯3B上的執行速度。

除了使用龍芯3B的向量擴展指令和使用上述兩種優化方法以外,同樣還可以根據具體函數的特點,使用其他一些優化方法進行優化,比如使用邏輯運算和移位運算來代替乘法運算等。針對每個函數的向量化優化在3.2.2小節中介紹。

3.2.2 針對具體函數的向量化

3.2.1小節概述了向量化時用到的一些優化方法,本節則針對oprofile測試中比重較大的幾個函數進行有針對性的優化。

對于表2中的函數,我們可以根據函數名將其分類,函數命名類似的函數基本上都可以使用類似的優化方法。

(1)簡單向量化。對于1號和2號函數的優化,本文都采用了使用移位運算來代替乘法運算的策略,并且針對循環內部運算的有界特性,使用飽和向量運算來改進。不過對于2號函數的訪存操作,由于存在著數據非對齊的情況,因而使用額外的向量指令對數據進行打包和回寫。而3號函數則是1號和2號函數的混合,因而對1號和2號函數的優化間接提升了3號函數的性能。

而對于4號、5號和6號函數,本文僅對其內層循環使用了循環展開和指令調度策略,就能夠取得不錯的運算效果。

同樣,對于11和12號函數也可以比較直觀的進行向量化,在此就不做詳述了。

(2)間接向量化。而對于比較難于向量化的7號和8號函數,本文分別采用了使用掩碼和使用矩陣轉置運算的策略來間接實現向量化。

其中針對函數h264 v loop filter luma的C語言實現中有很多判斷語句的問題,本文使用構建掩碼的方式來消除這些判斷語句。

以圖1(a)中的循環為例介紹掩碼的構建。而圖1(b)所示為代替該循環的向量指令。具體的運算結果如圖1(c)所示:將p向量(數組)和q向量做飽和減法(結果為負的都置為0),得到的結果向量如Vsub所示。使用Vsub與零向量進行比較來設置掩碼:結果為真,掩碼值為0xFF;反之,結果為假,掩碼為0。最后將掩碼值與p向量進行與操作,就可以得到該循環的運算結果。

使用構建掩碼的方法來消除判斷語句,不但減少了由判斷引起的時間開銷,而且重要的是間接將循環進行了向量化,提高了函數性能。而對于9號和10號函數,可以使用同樣的方法來改進。

而對于8號函數,由于運算處理的是連續的數據,因而無法進行向量化。使用矩陣轉置的方式,將數據重新打包后,就可以進行相應的向量運算。

對于圖2(a)中的運算,原始計算是P向量內部的運算,因而無法向量化,我們用向量指令將p向量轉置為q,其中q0存放p中標號為1的數據,q1存放P中標號為2的數據,依此類推。轉置得到的q向量就可以用圖2(b)中的向量指令運算,得到的運算結果與原來的運算相同。

對于13~15號函數的優化,同樣使用到了上面的轉置方法。而4.1節的測試結果則說明了各個函數的優化效果。

4 實驗結果

4.1 ffmpeg各函數加速比

本文分別對向量化后的各個函數進行了測試,并且與未向量化之前的函數進行了比較,各個函數向量化優化后的加速比如圖3所示。其中圖中橫坐標所示函數序號與表2中的各個函數一一對應。

圖3中的函數的加速比所跨越的范圍較大,比如6號函數的加速比約有23.9左右,而最后一個函數的加速比只有1.2左右。之所以會出現上述情況,除了與改進后的函數所使用的向量指令的數量和修改代碼的比重有關以外,也與運算所使用的操作數的類型有關。對于6號函數,其循環內的運算所使用的操作數的類型為字節類型,因而僅僅使用向量指令進行優化,理論加速比就可以達到32,不過本文僅僅對該函數的內層循環進行了向量化,而向量化后的內層循環一次僅僅處理了 16個字節類型的數據,即并未充分使用256位的向量寄存器。因而理論的加速比應該為16,但是由于結合了循環展開和指令調度等其他優化策略,因而實際的加速比可以達到23.9左右。同樣,對4號、5號和6號這三個同類型的函數進行分析,我們也可以發現:后一個函數的加速比均約為前一個函數加速比的兩倍。這是因為對于4號函數,內層循環向量化后一次可以同時計算4個字節類型的數據,而5號函數可以同時計算8個字節類型的數據,因而理論上的加速比也應該是兩倍的等比數列形式,而實際結果與理論分析是一致的。

對于3.3.2小節中重點介紹的7號函數和8號函數,其原函數無法進行簡單向量化,而本文使用了掩碼以及矩陣轉置等優化方法,使其能夠使用龍芯3B的向量擴展指令,因而盡管性能提升不大,但是加速比也分別有3.2和5.5。

4.2 不同平臺上的向量化比較

本文同樣將ffmpeg解碼器分別在不同的平臺上進行了測試,使用的兩個測試視頻分別為是“問道武當002.mkv”(視頻A)和“walk_vag_ 640x480_qp26.264”(視頻B)。其中視頻A是問道武當視頻(720p)中截取的片段,而后者是通過x264對walk_vag.yuv(480p)編碼生成的,編碼時選用的qp值為26。而測試平臺則分別選擇了AMD和Intel處理器平臺。

從表3的測試結果可以看出對于視頻A,在龍芯3B上的性能提升比其他兩個平臺上都高很多;而對于視頻B,在龍芯3B上的性能提升也與其它兩個平臺接近。實驗結果表明:在龍芯3B上實現ffmpeg解碼器的向量化,對性能提升有很大幫助,而且解碼某些視頻時,性能的提升甚至高于性能優越的商用處理器。而通過與表1中使用GCC向量化編譯的結果進行比較,也可以看出:手工對ffmpeg解碼器進行向量化比使用GCC進行向量化,性能有更大的提升。

5 總結和展望

本文實現了ffmpeg解碼器到龍芯3B的移植,并針對龍芯3B實現了對向量擴展指令支持的特點,對ffmpeg解碼器進行了手工向量化。實驗結果表明:手工向量化后的ffmpeg解碼器的性能比使用GCC向量化編譯后的ffmpeg解碼器性能要好很多,而且性能的提升也比Intel和 AMD平臺更多。

本文僅僅從代碼級實現了針對龍芯3B的ffmpeg解碼器的向量化移植,為了進一步提高性能,還需要從整個算法層面上進行優化。另外,由于龍芯3B的多核特性,還可以考慮使用多核進行解碼。

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          99国产精品久久久| 欧美精品国产精品| 99在线精品视频在线观看| 国产精品社区| 亚洲第一精品电影| 免费久久99精品国产| 影视先锋久久| 欧美影院视频| 欧美无砖砖区免费| 欧美国产专区| 欧美日韩第一页| 欧美激情一区二区三区| 亚洲国产岛国毛片在线| 亚洲国产精品一区二区第一页| 国产综合色在线视频区| 国产主播一区二区| 亚洲第一天堂无码专区| 国内激情久久| 亚洲你懂的在线视频| 国产精品视频导航| 国产一区二区精品久久99| 亚洲欧美国产另类| 亚洲精选一区二区| 久久青青草综合| 国产欧美大片| 国产精品久久久久一区二区三区共| 欧美绝品在线观看成人午夜影视| 亚洲网站在线观看| 91久久夜色精品国产网站| 亚洲手机视频| 国产精品99久久久久久白浆小说| 亚洲成人在线免费| 国产精品狼人久久影院观看方式| 欧美日韩国产专区| 日韩视频永久免费观看| 亚洲视频免费在线观看| 欧美系列一区| 亚洲国产影院| 国产精品亚洲精品| 极品中文字幕一区| 欧美综合第一页| 麻豆精品视频| 亚洲天堂网站在线观看视频| 欧美高清在线视频| 欧美午夜女人视频在线| 国产伦精品一区二区三区| 亚洲欧洲精品一区二区精品久久久| 欧美高清影院| 国产人久久人人人人爽| 久久亚洲私人国产精品va| 欧美日韩一区二区视频在线观看| 亚洲国产精品精华液网站| 中文欧美字幕免费| 国产精品国产三级国产aⅴ入口| 国产精品ⅴa在线观看h| 亚洲无亚洲人成网站77777| 欧美日韩国产专区| 欧美在线播放视频| 亚洲精品免费在线播放| 欧美一区二区三区在线看| 亚洲国产精品精华液网站| 亚洲欧美国产77777| 午夜精品免费视频| 日韩系列欧美系列| 国产麻豆精品久久一二三| 欧美日韩另类丝袜其他| 99精品国产一区二区青青牛奶| 最新热久久免费视频| 欧美在线观看日本一区| 在线观看精品视频| 日韩视频三区| 亚洲精品在线一区二区| 在线观看欧美日韩| 国产精品地址| 国产精品成人在线观看| 国产日韩一区二区三区在线| 欧美午夜精品久久久久免费视| 欧美三级资源在线| 久久激情久久| 亚洲一区二区三区在线观看视频| 在线观看av不卡| 亚洲高清三级视频| 伊人久久亚洲热| 亚洲黄色在线视频| 欧美剧在线观看| 国产女同一区二区| 欧美另类视频在线| 99视频在线精品国自产拍免费观看| 久久久国产一区二区| 亚洲欧美精品| 久久综合一区二区三区| 欧美日韩美女一区二区| 小处雏高清一区二区三区| 亚洲精品中文字幕有码专区| 91久久综合亚洲鲁鲁五月天| 亚洲女同同性videoxma| 亚洲一区中文字幕在线观看| 久久久久88色偷偷免费| 欧美日本中文字幕| 欧美日韩专区在线| 正在播放亚洲| 亚洲欧美综合精品久久成人| 欧美亚洲视频在线看网址| 亚洲欧美影音先锋| 欧美大尺度在线| 久久久久久亚洲综合影院红桃| 欧美日韩1234| 久久综合给合久久狠狠狠97色69| 亚洲一区二区在线观看视频| 欧美sm极限捆绑bd| 亚洲欧美色婷婷| 国产精品户外野外| 久久精品视频在线免费观看| 久久久www免费人成黑人精品| 欧美大片在线看免费观看| 午夜亚洲精品| 亚洲激情国产精品| 欧美影院在线播放| 国产在线精品二区| 国产在线一区二区三区四区| 久久久一本精品99久久精品66| 国产区亚洲区欧美区| 欧美经典一区二区三区| 亚洲欧美国产精品va在线观看| 欧美一区二粉嫩精品国产一线天| 最新国产拍偷乱拍精品| 欧美不卡福利| 国产情人综合久久777777| 欧美日韩在线另类| 亚洲伊人伊色伊影伊综合网| 久久综合久久综合九色| 国内精品久久久久影院优| 亚洲午夜激情免费视频| 国产精品久久久久99| 国模大胆一区二区三区| 99国产精品久久| 欧美在线播放一区| 国产精品美女久久久久av超清| 久久中文精品| 国产精品一区2区| 国产日韩欧美自拍| 国产婷婷一区二区| 欧美日韩一区二区在线视频| 久久国产一区| 欧美日韩亚洲综合在线| 在线免费观看成人网| 亚洲综合第一页| 欧美丰满少妇xxxbbb| 国产日韩在线一区| 夜夜爽av福利精品导航| 久久这里有精品15一区二区三区| 看欧美日韩国产| 午夜在线精品| 欧美日韩亚洲高清一区二区| 欧美午夜精品| 欧美精品啪啪| 欧美在线一二三四区| 亚洲午夜电影| 亚洲一区二区高清| 国产精品每日更新在线播放网址| 久久久久国色av免费看影院| 99精品欧美一区| 久久成人一区二区| 久久亚裔精品欧美| 欧美人妖另类| 欧美成人资源| 亚洲黄网站在线观看| 欧美大片在线看免费观看| 久久这里有精品15一区二区三区| 在线看视频不卡| 久久国产直播| 国语自产精品视频在线看一大j8| 日韩天天综合| 极品少妇一区二区三区精品视频| 国产精品区一区二区三| 欧美激情一二三区| 国产婷婷色综合av蜜臀av| 久久精品国亚洲| 欧美日韩不卡合集视频| 99国产精品久久久久久久| 亚洲电影在线| 亚洲免费大片| 亚洲国产精品久久久久婷婷884| 国产一区二区三区在线观看免费| 国产欧美一二三区| 亚洲精品国偷自产在线99热| 樱桃成人精品视频在线播放| 99精品免费视频| 欧美日韩免费观看一区| 久久久五月天| 久久久久国产免费免费| 日韩亚洲视频| 欧美激情一区二区三区蜜桃视频| 久久狠狠亚洲综合| 国产一区二区日韩精品欧美精品| 欧美一区二区播放| 国产精品国产三级国产aⅴ9色| 国产精品久久久久aaaa樱花| 欧美精品一区二区三区四区| 久久久999| 在线不卡中文字幕| 99在线热播精品免费| 国产日韩精品一区二区三区在线| 亚洲精品免费在线| 国产香蕉久久精品综合网| 欧美日韩裸体免费视频| 亚洲国产欧美一区| 欧美日韩精品在线播放| 免费av成人在线| 亚洲精品国产品国语在线app| 国产精品福利片| 欧美一级黄色录像| 亚洲精品国产精品国自产在线| 国产一区二区三区日韩欧美| 欧美日韩人人澡狠狠躁视频| 亚洲国产成人在线播放| 午夜精品亚洲一区二区三区嫩草| 欧美激情一区二区三级高清视频| 亚洲精品一区二区网址| 欧美精品一区二区高清在线观看| 国产精品亚洲不卡a| 国产精品美女主播| 国产女同一区二区| 欧美日韩免费高清| 亚洲午夜精品一区二区三区他趣| 久久成人羞羞网站| 久久国产精品亚洲77777| 国产欧美 在线欧美| 一区二区激情小说| 性欧美大战久久久久久久久| 久久久久成人网| 99re66热这里只有精品3直播| 欧美精品www在线观看| 蜜桃av噜噜一区| 性做久久久久久免费观看欧美| 亚洲成人自拍视频| 国产嫩草一区二区三区在线观看| 欧美一区国产在线| 国产亚洲精品一区二区| 免费中文日韩| 永久91嫩草亚洲精品人人| 欧美在线免费播放| 亚洲美女视频在线观看| 国产日韩欧美一区二区三区四区| aa成人免费视频| 日韩一级黄色大片| aa级大片欧美| 欧美日韩国产色视频| 国产精品乱码一区二区三区| 欧美二区在线播放| 国产精品伦一区| 亚洲免费观看高清在线观看| 亚洲一区二区三区精品视频| 欧美激情综合五月色丁香| 欧美小视频在线| 国产日韩精品一区二区浪潮av| 亚洲国产欧美在线人成| 欧美日韩精品免费| 免费一级欧美片在线播放| 玖玖视频精品| 国产精品视频网址| 狠狠色狠狠色综合日日小说| 麻豆国产精品一区二区三区| 国产精品你懂得| 欧美精品久久久久久久久久| 国产精品一区二区久久精品| 亚洲免费精彩视频| 亚洲精品裸体| 国产精品国产成人国产三级| 噜噜噜在线观看免费视频日韩| 夜夜爽www精品| 欧美激情91| 欧美日韩中文字幕| 国产老女人精品毛片久久| 一区二区三区精品视频| 午夜免费在线观看精品视频| 在线观看视频一区二区欧美日韩| 日韩视频精品在线观看| 欧美怡红院视频一区二区三区| 欧美一区二区三区四区在线| 伊人成人开心激情综合网| 欧美一区二区三区免费观看视频| 亚洲欧美精品在线观看| 国产欧美成人| 欧美国产在线视频| 在线播放豆国产99亚洲| 日韩视频中午一区| aⅴ色国产欧美| 亚洲免费一在线| 亚洲第一在线| 国产精品毛片一区二区三区| 亚洲精品女人| 99视频在线观看一区三区| 在线观看av一区| 久久夜色精品国产| 中文日韩在线视频| 亚洲精品国产系列| 亚洲图中文字幕| 欧美高清自拍一区| 亚洲第一综合天堂另类专| 久久久免费精品视频| 国产精品一二三视频| 久久久精品999| 欧美日韩在线免费视频| 欧美刺激午夜性久久久久久久| 欧美日韩在线观看一区二区| 久久天堂国产精品| av成人天堂| 亚洲国产婷婷综合在线精品| 亚洲国产精品久久久久秋霞影院| 欧美一区二区三区视频在线观看| 亚洲性视频网站| 亚洲国产精品va在线观看黑人| 亚洲国产精品悠悠久久琪琪| 久久久久久尹人网香蕉| 国产精品午夜在线| 亚洲综合电影| 欧美日韩亚洲一区二区| 欧美日韩专区| 欧美电影在线播放| 欧美色区777第一页| 韩曰欧美视频免费观看| 亚洲高清免费视频| 一区二区三区回区在观看免费视频| 欧美一区二区三区婷婷月色| 一本久道综合久久精品| 9i看片成人免费高清| 亚洲图色在线|