《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于改進SALS算法的大數據挖掘效率優化探究
基于改進SALS算法的大數據挖掘效率優化探究
2015年微型機與應用第12期
黃少卿,胡立強
(中國移動通信集團設計院有限公司 河北分公司,河北 石家莊 050021)
摘要: 移動互聯網時代,各類移動網絡終端的使用在為移動用戶帶來便利的同時,也為運營商提供了海量的可供挖掘數據來源。運用大數據技術對非結構、半結構、結構化數據進行數據挖掘,可以有效提高挖掘效率,幫助運營商找到潛在商機、提升用戶體驗、進行精確營銷。針對大數據挖掘中存在的效率問題,提出了基于改進SALS算法的Hadoop推測調度,從而減少異構環境下的資源浪費,提高大數據挖掘效率。
Abstract:
Key words :

  摘  要: 移動互聯網時代,各類移動網絡終端的使用在為移動用戶帶來便利的同時,也為運營商提供了海量的可供挖掘數據來源。運用大數據技術對非結構、半結構、結構化數據進行數據挖掘,可以有效提高挖掘效率,幫助運營商找到潛在商機、提升用戶體驗、進行精確營銷。針對大數據挖掘中存在的效率問題,提出了基于改進SALS算法的Hadoop推測調度,從而減少異構環境下的資源浪費,提高大數據挖掘效率。
  關鍵詞: 大數據挖掘;Hadoop;推測調度;SALS

0 引言
  移動互聯網時代,隨著3G/4G的普及,網絡建設速度的加快,以及大規模的數碼設備的使用,移動運營商業務和數據規模的擴張呈幾何級增長[1]。以某省的基本數據量為例,其語音通話記錄每天入庫2.5 TB,SMS話單記錄每天入庫800 GB以上,MC口信令數據每天20 TB,GN口信令數據每天8 TB,警告、性能等數據每天約3 TB。再計算通過機器設備、服務器、軟件自動產生的各類非人機會話數據,以非結構和半結構化形式呈現的數據已經遠遠超過了傳統關系型數據處理的能力范疇。
  傳統的RDBMS可以處理結構化數據,其缺點是系統孤立、處理數據量小,面對移動互聯網時代數據暴增的特點,IT系統的可擴展性、成本控制、數據有效性挖掘均需要通過低成本的通用設備,通過構建“池化資源”并結合“大數據挖掘”能力來推進業務進展。
  池化資源指通過運用虛擬化技術,將單個物理機器資源進行分割或者將多臺物理機器資源進行整合,充分利用物理機的處理能力,實現物理機的高效分配和利用[2]。大數據挖掘則針對具有4 V特點的海量數據進行壓縮、去重、整理、交叉分析和對比,并結合關聯、聚合等傳統數據挖掘技術對非結構化和半結構化的數據進行分析[3]。本文通過對現有大數據挖掘技術的分析比對,就其中涉及的數據查詢的可優化部分進行深入討論。
1 現行的大數據挖掘技術
  自大數據概念誕生以來,陸續出現了多種大數據挖掘處理技術,如果以處理的實時性來分類,可以將大數據挖掘處理技術分為兩類:實時類處理技術和批處理技術。實時類大數據挖掘處理技術有Storm、S4[4]等,而批處理技術或者稱為線下處理技術的典型代表則是MapReduce。對于移動運營商來講,實時處理能力固然重要,但是通過大批量的線下數據處理找到潛在的商業契機、提升用戶體驗、實施決策分析、精準營銷推薦、運營效能提升、創新商業模式等對于運營商來說更為重要。本文關注大數據批處理中現有技術的性能提升。
  1.1 MPP架構新型數據庫技術
  MPP(Massive Parallel Processing)從構成上來講,是由多個SMP服務器橫向擴展組成的分布式服務器集群[5]。但MPP架構并不是一種池化資源的大數據處理架構,集群中的每個節點均可訪問本地資源,采用Share Nothing結構,集群節點之間并不存在共享及互訪問的問題,而是通過統一的互聯模塊來調度、平衡節點負載和并行處理過程。其架構如圖1所示。

Image 001.png

  1.2 大數據一體機
  大數據一體機是商業公司專門為處理大數據而設計的軟硬件一體機,由集成服務器、存儲、操作系統、數據庫軟件、其他數據分析軟件等統一封裝在機箱內,經過運營商對數據處理流程進行優化,從而形成高性能的大數據處理能力。
  1.3 Hadoop開源大數據技術
  Hadoop技術框架是以MapReduce為核心的一個開源大數據處理框架,其架構如圖2所示。其中,最底層的HDFS為分布式文件系統,底層使用廉價x86進行冗余備份;MapReduce分為map、shuffle和reduce階段[6],map階段對處理數據進行分解映射,分開處理,shuffle階段拽取map階段數據到reduce端,reduce階段對處理子集進行歸約合并,得到處理結果;HBase不同于傳統的關系型數據庫,是一種基于列的分布式數據庫。

Image 002.png

  1.4 小結
  三種大數據挖掘處理技術各有特點,綜合比較如下:根據CAP理論,在兼顧分區性、一致性和分區可容忍性的情況下,MPP擴展能力有限,目前最多可以橫向擴展至500個節點,并且MPP成本較高,以處理結構性重要數據為主。大數據一體機環境封閉,例如Oracle的ExtData,技術實現細節不清晰,在處理性能上難以做出橫向對比,且成本高,這里暫不做討論。Hadoop以處理非結構化和半結構化數據為主,橫向擴展能力達到    1 000個節點以上,并且支持廠家和社區龐大,成本低廉,是一項較好的大數據挖掘框架技術。
  2 現行的Hadoop推測調度對大數據挖掘的影響
  采用Hadoop開源框架進行大數據挖掘,具有較多的便利條件:Hive的使用可以簡化數據挖掘程序的編寫,只需要掌握普通SQL操作即可進行程序編寫;基于HDFS和MapReduce的分布式特點,數據挖掘任務可以在多臺機器、不限地域的情況下實施,縮短了挖掘時間,提高了挖掘效率。但是,Hadoop對分布式任務進行推測調度的算法上存在效率問題[7],下面對該調度進行概要分析。
 ?。?)為防止任務因機器故障、程序意外中斷引起的任務執行時間過長,Hadoop啟用了推測調度,即啟用新節點對卡殼任務進行重新執行;
 ?。?)對于每一個運行在節點上的Task,其執行剩余時間=(1-當前進度)/任務平均計算速度,其中任務平均計算速度=當前進度/執行時間;
 ?。?)根據(2)對所有Task執行剩余時間進行排序,選出最大的Task,若其平均計算速度<其他任務平均速度,則對該任務進行推測,啟用新節點執行該節點的任務;
 ?。?)當推測節點任務執行完畢后,強制結束執行同任務節點進程。
  上述過程在同構環境且多任務運行的情況下,可以一定程度地避免硬件故障及程序bug對整個MapReduce的影響。但其存在如下可能的推測調度缺陷:(1)由于啟動新節點重復執行某任務,會造成同時存在兩個以上節點執行同樣任務,造成資源浪費;(2)當在異構環境下(硬件機器廠商不同、運行操作系統差異、機器性能差異等),任務節點的資源性能并不等同,以上述標準判斷是否需要啟動推測調度,會出現較大誤差,形成無效的調度,從而使新任務得不到節點來執行任務;(3)Hadoop針對Reduce階段任務劃分為復制、排序、歸并,并規定每一階段占據1/3進度;然而,統計表明,復制階段最消耗時間和資源,明顯存在不合理調度。
  針對這些問題,本文在SALS算法基礎上進行改進,從而提高Hadoop的推測調度效率,減少重復任務,加快MapReduce的執行。
3 采用改進SALS算法對Hadoop推測調度調優
  SALS算法原本用于鄰近節點搜索,首先確定節點集合,然后根據權重與節點間舉例建立聯系圖。這里,選取節點集合節點的判定,在第二階段根據Hadoop的推測調度進行修改。
  (1)對所有運行Task節點進行排隊,形成TaskQueue,該隊列保存Slave節點任務的索引,以節省空間;
 ?。?)根據歷史平均速率,對空閑節點進行排隊,速率高節點在隊列頭部,從未運行過節點速率為所有空閑節點平均速率,插入到隊列中,形成FreeQueue;
  (3)對TaskQueue進行動態排隊,每1分鐘1次,并對隊尾節點進行判定:
 ?。╝)運行時間超過其他節點運行時間的1.5倍;
 ?。╞)若為非Reduce任務,任務進度與上次更新差別在10%以內;
 ?。╟)若為Reduce任務,根據shuffle數據量更新進度,任務進度與上次更新差別在10%以內。
 ?。?)符合(3)-(a)且符合(3)-(b)或(3)-(c)時,對隊尾任務啟動新節點進行執行,立即結束當前節點并做標記,形成BugQueue以備檢查節點狀態。
4 實驗驗證
  為檢驗上述算法的有效性,啟用1臺機器作為主節點(2 GB內存,80 GB存儲,Ubuntu OS),4臺機器作為從屬節點(分別為1 GB、256 MB、256 MB、512 MB內存,兩個Ubuntu OS,兩個Red Hat OS)進行試驗。先后部署Hadoop環境和改進推測調度的Hadoop環境進行驗證,結果如圖3所示。

Image 003.png

  實驗表明,基于改進的SALS推測調度相較于基礎Hadoop推測調度能提高40%左右的時間,達到了改進目的。采用該改進的SALS算法后,可以減少重復任務的執行數量并及時釋放可能存在問題的節點以備檢查。合理更新Reduce任務進度,減少出現活躍任務節點被關閉現象。加強推測調度的準確性,對節點資源進行高效利用,提高了大數據挖掘的效率。
5 結論
  移動互聯網時代,大數據技術在數據挖掘方面所起的作用越來越重要。針對其中可以優化改進的流程和技術環節還有許多可以深究之處。基于改進的SALS算法優化的推測調度,在流程方面優化了大數據挖掘,提高了Hadoop推測調度的準確性和有效性。除此之外,大數據查詢優化、大數據不同架構之間的融合使用等均值得進一步研究。
  參考文獻
  [1] 馬建光,姜巍.大數據的概念、特征及其應用[J].國防科技,2013,34(2):10-17.
  [2] 葛中澤,夏小翔.基于資源池的數據訪問模式的探討[J].科學技術與工程,2012,12(33):9066-9060.
  [3] 吉根林,趙斌.面向大數據的時空數據挖掘綜述[J].南京師大學報,2014,37(1):1-7.
  [4] 孫朝華.基于Storm的數據分析系統設計與實現[D].北京:北京郵電大學,2014.
  [5] 辛晃,易興輝,陳震宇.基于Hadoop+MPP架構的電信運營商網絡數據共享平臺研究[J].電信科學,2014(4):135-145.
  [6] 張常淳.基于MapReduce的大數據連接算法的設計與優化[D].合肥:中國科學技術大學,2014.
  [7] 周揚.Hadoop平臺下調度算法和下載機制的優化[D].長沙:中南大學,2012.

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          亚洲无毛电影| 国产精品成人av性教育| 欧美电影专区| 榴莲视频成人在线观看| 欧美激情一区二区| 一区二区电影免费观看| 欧美fxxxxxx另类| 欧美日韩一区二| 国产精品美女www爽爽爽| 久久都是精品| 国产精品久久久久久久久久久久| 欧美精品电影在线| 亚洲日本中文字幕区| 欧美日本久久| 国产精品av免费在线观看| 欧美成人资源网| 欧美精品福利| 99精品免费视频| 国产精品中文字幕欧美| 一区二区不卡在线视频 午夜欧美不卡'| 欧美日韩系列| 国产精品一区免费视频| 国产一区二区三区精品久久久| 亚洲国产精品久久久久婷婷884| 亚洲福利在线视频| 国产精品久久午夜| 日韩亚洲国产欧美| 欧美国产精品v| 欧美日韩极品在线观看一区| 一区二区三区精品视频在线观看| 99国产麻豆精品| 好看不卡的中文字幕| 亚洲欧美日韩另类| 午夜精品成人在线视频| 免费短视频成人日韩| 欧美日韩极品在线观看一区| 一区在线视频| 麻豆av一区二区三区久久| 亚洲综合大片69999| 欧美日韩亚洲91| 午夜在线视频观看日韩17c| 国产精品亚洲精品| 亚洲愉拍自拍另类高清精品| 久久久激情视频| 亚洲欧美日韩在线综合| 国产午夜精品理论片a级大结局| 午夜视频在线观看一区二区三区| 国产精品久久久久77777| 欧美日本不卡高清| 久久av一区二区三区亚洲| 亚洲美女诱惑| av成人激情| 黄色工厂这里只有精品| 91久久极品少妇xxxxⅹ软件| 中日韩美女免费视频网站在线观看| 欧美华人在线视频| 欧美一区二区福利在线| 一区二区三区四区五区视频| 欧美a级片一区| 亚洲欧美国产制服动漫| 亚洲一区精彩视频| 国产精品视频久久一区| 亚洲视频一区在线| 久久综合99re88久久爱| 亚洲国产美女| 亚洲在线观看免费视频| 黄色成人在线网站| 亚洲美女区一区| 娇妻被交换粗又大又硬视频欧美| 国产精品入口| 欧美在线亚洲综合一区| 激情久久五月| 蜜臀久久99精品久久久画质超高清| 亚洲小说欧美另类社区| 欧美成人情趣视频| 亚洲免费黄色| 国产精品久久久久免费a∨大胸| 久久精品国产精品亚洲| 欧美视频在线一区二区三区| av72成人在线| 国产精品国色综合久久| 久久久久一区二区| 亚洲久色影视| 欧美日韩在线播| 亚洲精品在线观| 久久久国产亚洲精品| 亚洲精品欧美日韩| 欧美**人妖| 欧美一区二区三区免费在线看| 久久国产精品久久精品国产| 在线视频免费在线观看一区二区| 欧美日韩日本国产亚洲在线| 国产精一区二区三区| 免费成人你懂的| 夜夜嗨网站十八久久| 欧美人成在线视频| 欧美影院精品一区| 久久露脸国产精品| 香蕉久久国产| 国模 一区 二区 三区| 国产欧美一区二区三区在线看蜜臀| 久久亚洲美女| 红桃视频国产精品| 国产伦精品一区二区三区在线观看| 久久久成人精品| 日韩亚洲欧美综合| 亚洲区一区二区三区| 亚洲裸体视频| 夜夜狂射影院欧美极品| 国产精品有限公司| 可以免费看不卡的av网站| 久久久久久国产精品一区| 国产精品福利影院| 国产精品久久毛片a| 国产精品大片wwwwww| 久久在线免费观看视频| 亚洲第一页中文字幕| 欧美a级理论片| 快播亚洲色图| 国产精品久久久久毛片软件| 亚洲理论在线| 在线观看国产一区二区| 久久亚洲图片| 99精品国产一区二区青青牛奶| 欧美女同在线视频| 亚洲精品一二三| 9色porny自拍视频一区二区| 美女国产一区| 欧美精选午夜久久久乱码6080| 亚洲综合色噜噜狠狠| 亚洲精品美女久久久久| 在线不卡视频| 国产精品久久二区二区| 亚洲人成亚洲人成在线观看| 久久精品免费播放| 欧美激情性爽国产精品17p| 亚洲国产精品久久久久秋霞蜜臀| 日韩手机在线导航| 91久久精品一区| 欧美日韩专区| 久久久精品国产一区二区三区| 国产精品一区二区三区四区五区| 亚洲精品色图| 国产女同一区二区| 国产精品国产自产拍高清av王其| 在线观看亚洲精品| 狠狠色综合色区| 亚洲一级一区| 欧美激情久久久久久| 午夜亚洲性色视频| 亚洲一区国产视频| 亚洲欧美国产另类| 亚洲宅男天堂在线观看无病毒| 国产精品美女久久久久av超清| 亚洲午夜一区二区| 亚洲激情在线播放| 亚洲乱码国产乱码精品精98午夜| 韩国一区电影| 樱桃成人精品视频在线播放| 亚洲婷婷免费| 久久久九九九九| 国产精品爱啪在线线免费观看| 欧美成人官网二区| 国产一区二区三区精品欧美日韩一区二区三区| 国产精品久久久久久久一区探花| 小辣椒精品导航| 国产一区二区三区电影在线观看| 欧美亚日韩国产aⅴ精品中极品| 99国产精品视频免费观看一公开| 国产精品天美传媒入口| 极品尤物一区二区三区| 欧美一级久久| 久久综合色一综合色88| 亚洲在线成人精品| 国产精品99免费看| 麻豆成人综合网| 99国内精品| 亚洲激情一区二区| 韩国福利一区| 欧美一区二区三区在线观看视频| 亚洲视频碰碰| 欧美在线视频二区| 在线看片欧美| 亚洲一级二级在线| 欧美在线黄色| 国产精品永久免费视频| 国产精品视频不卡| 亚洲精品字幕| 亚洲国产欧美一区二区三区同亚洲| 欧美激情中文字幕乱码免费| 韩国久久久久| 91久久国产综合久久蜜月精品| 狠狠噜噜久久| 99国产成+人+综合+亚洲欧美| 欧美午夜精品久久久久久人妖| 你懂的视频一区二区| 一本色道久久综合亚洲精品高清| 亚洲国产成人一区| 亚洲乱码国产乱码精品精可以看| 久久婷婷影院| 黄页网站一区| 欧美淫片网站| 老**午夜毛片一区二区三区| 欧美精品999| 宅男噜噜噜66一区二区66| 另类天堂av| 欧美一区二区视频在线观看2020| 亚洲夫妻自拍| 欧美三级乱人伦电影| 亚洲欧美综合精品久久成人| 国产精品国产三级国产aⅴ9色| 国产欧美一区二区精品性| 午夜精品久久久久久久99热浪潮| 中文在线资源观看视频网站免费不卡| 欧美成人伊人久久综合网| 亚洲激情在线观看| 136国产福利精品导航网址应用| 久久一二三国产| 99精品视频网| 精东粉嫩av免费一区二区三区| 欧美日韩国产色综合一二三四| 久久久亚洲人| 欧美日韩精品免费在线观看视频| 亚洲日本成人在线观看| 美脚丝袜一区二区三区在线观看| 日韩网站在线看片你懂的| 亚洲二区三区四区| 欧美阿v一级看视频| 亚洲国产精品成人综合色在线婷婷| 欧美三级不卡| 在线精品观看| 在线观看日韩av电影| 亚洲欧美日韩综合| 午夜精品福利在线观看| 久久久精品tv| 国产日韩专区| 亚洲一区免费观看| 欧美成年人视频网站欧美| 久久夜色精品国产| 蜜桃av噜噜一区| 国产精品普通话对白| 国产精品视频免费在线观看| 国产欧美大片| 亚洲国产视频a| 黄色一区二区三区四区| 亚洲一级片在线观看| 好看不卡的中文字幕| 麻豆av一区二区三区久久| 国产欧美一区视频| 宅男噜噜噜66一区二区66| 欧美成人一区二区三区片免费| 国产精品一级在线| 国产精品久久久久久久久久久久| 国产精品嫩草99av在线| 性做久久久久久久久| 国产永久精品大片wwwapp| 国产精品一区二区久久| 亚洲电影专区| 久久成人久久爱| 尤妮丝一区二区裸体视频| 国产精品免费福利| 激情文学综合丁香| 国产精品男gay被猛男狂揉视频| 国产精品综合色区在线观看| 久久久久亚洲综合| 久久久久久久久久久久久女国产乱| 欧美视频一区二区三区…| 亚洲一区免费视频| 国产欧美日韩亚州综合| 久久久精品国产99久久精品芒果| 最新亚洲激情| 欧美日韩 国产精品| 毛片精品免费在线观看| 中文欧美在线视频| 激情欧美亚洲| 在线视频国内自拍亚洲视频| 亚洲中无吗在线| 99pao成人国产永久免费视频| 性欧美超级视频| 亚洲片国产一区一级在线观看| 欧美高清视频在线播放| 欧美成人在线免费视频| 久久精品国产第一区二区三区| 国产精品v片在线观看不卡| 欧美影院成年免费版| 亚洲理论在线| 欧美成人性生活| 99精品热6080yy久久| 久久精品72免费观看| 国产精品久久久久9999高清| 欧美国产日产韩国视频| 国产欧美日韩精品a在线观看| 欧美日韩午夜激情| 韩国精品在线观看| 国内精品久久久久影院薰衣草| 亚洲丶国产丶欧美一区二区三区| 在线观看日韩av| 欧美日韩亚洲一区三区| 亚洲麻豆国产自偷在线| 韩日精品视频一区| 亚洲高清网站| 欧美区在线观看| 欧美日韩精品一区二区在线播放| 久久精品国产精品亚洲| 亚洲乱码国产乱码精品精98午夜| 国产精品试看| 欧美激情一区二区三区全黄| 国产精品久久久久7777婷婷| 免费视频一区| 欧美一区二区三区精品| 伊人蜜桃色噜噜激情综合| 国产精品高潮在线| 一区二区三区波多野结衣在线观看| 欧美性猛交xxxx免费看久久久| 国产精品久久久久久久电影| 亚洲视频高清| 国产精品超碰97尤物18| 国产人久久人人人人爽| 欧美理论大片| 午夜欧美不卡精品aaaaa| 亚洲激情女人| 99re8这里有精品热视频免费| 99精品黄色片免费大全| 亚洲高清成人| 在线亚洲电影| 国产日韩精品电影| 久久综合色婷婷| 亚洲裸体视频|