《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于MapReduce框架下的復雜網絡社團發現算法
基于MapReduce框架下的復雜網絡社團發現算法
2014年微型機與應用第22期
于靜雯1, 楊 冰2
(1.遼寧師范大學 計算機與信息技術學院,遼寧 大連 116081; 2.大連醫科大學 附屬第一醫院,遼寧 大連 116011)
摘要: 隨著社會網絡數據的增加,社團發現獲得來自學術界和工業界的大量關注,是因為它在現實世界中有許多的實際應用。格文-紐曼(Girvan-Newman,GN)是現今最流行的算法之一,但在大型網絡上由于需要計算網絡中每對節點之間的最短路徑而產生了相應的局限性。為此,利用MapReduce模型,提出了一種并行版本的GN算法來支持大規模網絡的新方法,稱之為最短路徑之間的MapReduce算法(Shortest Path Betweenness MapReduce Algorithm,SPB-MRA)。此外,還提出了一個近似技術,進一步加快社區檢測過程。在Hadoop上利用開源平臺MapReduce框架實現了SPB-MRA算法。結果表明,隨著reducer數量的增加時間呈線性減小,并且引入了一種近似技術可以忽略誤差。
Abstract:
Key words :

  摘  要: 隨著社會網絡數據的增加,社團發現獲得來自學術界和工業界的大量關注,是因為它在現實世界中有許多的實際應用。格文-紐曼(Girvan-Newman,GN)是現今最流行的算法之一,但在大型網絡上由于需要計算網絡中每對節點之間的最短路徑而產生了相應的局限性。為此,利用MapReduce模型,提出了一種并行版本的GN算法來支持大規模網絡的新方法,稱之為最短路徑之間的MapReduce算法(Shortest Path Betweenness MapReduce Algorithm,SPB-MRA)。此外,還提出了一個近似技術,進一步加快社區檢測過程。在Hadoop上利用開源平臺MapReduce框架實現了SPB-MRA算法。結果表明,隨著reducer數量的增加時間呈線性減小,并且引入了一種近似技術可以忽略誤差。

  關鍵詞: Hadoop;MapReduce;社區檢測;GN算法;SPB-MRA

0 引言

  社會網絡服務(SNS網站),如Facebook和Twitter,在實際生活中變得越來越流行。因此分析社會網絡數據就成為各領域面對的最重要的問題之一。在這些分析工作中,社會網絡數據的社團發現在社會生活中有著實際的應用,因此獲得來自學術界和各行業的廣泛關注。由格文和紐曼[1]提出格文-紐曼(GN)算法引入邊介數的概念,用來衡量中心性和網絡中邊緣的影響度。雖然GN算法被廣泛應用,但當它支持大型網絡時,由于需要計算每對節點之間的最短路徑而具有局限性,而且節點對的數量也是有限制的。在大數據時代,可用的數據量空前增長,因此,數據分析是一種良好的可擴展方法,可以用來處理大型數據集。MapReduce是一個用于處理大數據集的并行編程模型,分布式聚類算法在MapReduce中可擴展性和易于使用的性質[2-4]而得到廣泛的應用,這也是近年來在背后驅動分析大數據的動力。本文提出了一個并行版本的GN算法,即SPB-MRA算法來支持大規模的網絡,并且提出了一種近似技術來進一步加快社區檢測過程。

1 背景

  1.1 MapReduce和Hadoop[5]

  MapReduce并行的方式是一個加工大規模數據的編程模型[2]。用戶可以輕松地通過編寫map和reduce兩個函數實現分布式并行處理的功能。map函數處理數據輸入和鍵值對<key,value>,reduce函數是把具有相同key的value值進行合并后輸出。

  1.2 GN算法

  GN算法是分裂的分層聚類算法,利用邊界數[1]的概念。在提出的三種計算邊界數的方法中計算最短路徑的結果是最好的。邊界數是指經過兩個節點之間的最短距離的值。由于社團是由一些“組間”邊界松散地鏈接而成的,在不同社團之間所有最短路都必須經過這些“組間”邊,這些邊連接起來的社團的邊界數將會很大,因此,社團可以通過不斷檢測來排除這些邊。從每對節點中最獲得最短路徑,所以GN算法的代價是非常高的。

2 算法

  SPB-MRA經歷了4個并行計算的階段,每個階段執行自己的map和reduce任務。在每次迭代中,第一階段會執行多次,而其他階段只執行一次。運行這4個階段直到結果的質量不再有所改進。在社團發現中每對節點由7個元素組成的元組構成,元組中包含網絡結構(例如鄰接表),這時最短路徑通過元組獲得。

  targetid表示一個目的節點的最短路徑且最初設置為sourceid。sourceid表示最短路徑源節點且最初設置為targetid。distance表示最短路徑的長度,初值為0,每次迭代過程中更新第一階段的distance值。status表示一個特定的路徑的狀態。a表示積極的(active);i表示不積極的(inactive),意味著最短的路徑已檢測到。weight表示從sourceid到targetid最短路徑的數目且最初設置為1。pathinfo表示最短路徑經過的節點的列表,初始值為空。adjlist表示targetid中相鄰的節點的列表。

  2.1 第一階段:找到所有節點對之間的最短路徑

  在第一階段,采取Zeng Zengfeng等人[6]提出的由一種多源消息傳遞模型的方法來計算每對節點之間的最短路徑。在map階段中輸入一個元組,若它的status是i,無需后續操作;若status是a,則改成i,距離加1并將targetid增加到pathinfo中;該元組被送到reduce階段。通過給在鄰接表中的每個點分配targetid即可生成新的元組。這些新生成的元組其status被設置為a,鄰接表被設置為空,并且其他元素被設定為那些發送前的元組的狀態,如圖1所示。

001.jpg

  2.2 第二階段:計算邊界數

  在第二階段,計算網絡中每對節點之間的邊界數。在map階段,整體根據最短路徑的sourceid和targerid的數目(即權重)被劃分成某條最短路徑上的邊。在reduce階段,每個邊由每個最短路徑的分量相加得到,如圖2所示。

002.jpg

  2.3 第三階段:選擇要刪除的邊緣

  在第三階段,kiter邊按邊界數選擇。kiter是由用戶作為調節參數而指定的。在map階段,不需要進行后續操作。在reduce階段,邊按照邊界數的遞減順序排序,并且top-kiter邊緣被選定。只要運行一個reducer即可得到一個整體的排序結果,如圖3所示。

003.jpg

  2.4 第四階段:刪除邊

  在第四階段,把網絡中在第三階段選擇的邊刪除,但在下一次迭代中,一個新的元組集合的生成表明需要重新計算刪除邊的邊界數。注意,如果一個最短路徑包含被去除邊,邊界值就會改變,那么邊界數將會發生變化。在map階段,如果第二階段分組中的targetid影響到第三階段邊緣的選擇,如果刪除相應節點來表示新的網絡結構,則它的鄰接表就會更新,其他的元組在下一次迭代中初始化,如圖4所示。在reduce階段,在鄰接表里的元組都會有一個更新的值,這些元組將作為下一次第一階段中的輸入而提供數據,如圖5所示。

004.jpg

3 性能試驗

  3.1 數據和環境

  采用來自于Stanford Large Network Dataset Collection[7]上的ca-GrQc和ca-HepTH兩組數據集,使用Java 1.6.0和Hadoop 1.0.4實現SPB-MRA。在亞巴遜彈性計算(Amazon EC2)利用m1.xlarge進行性能測試。Amazon EC2是由亞馬遜公司提供的Web服務,用戶可以租用其云電腦運行時所需要的相應系統。

  3.2 可擴展性

  為了顯示SPA-MRA的可擴展性,經過一次迭代的同時reducer的數量從1變為32,結果如圖6和圖7所示。

  隨著reducer的數量增加到8,所用的時間呈線性減少。對于這些數據集來說,reducer的數量是足夠的,過多的reducer就會變得無效。可以看出,CA-HepTh數據集的大小是CA-GrQc數據集的兩倍,而圖7中的曲線要比圖6中的曲線率先變得平緩。

005.jpg

006.jpg

  為了顯示SPA-MRA近似值的精度,在不同的kiter值下測量F-score[8]的值,如表1所示。其中,kiter表示一次迭代中要刪除邊緣的數量。在表1中,雖然一次性刪除40條邊F-score值只減少了10%,但是它證明4次提速卻只有10%的誤差。

4 結論

  本文提出了一個并行版本的GN算法即SPB-MRA來支持大規模的網絡,并利用MapReduce模型在Hadoop平臺上得到了實現。在亞馬遜的EC2上進行了實例SPB-MRA性能試驗,結果表明,隨著reducer數量的增加時間呈線性減少,并且逼近值技術的錯誤率可以忽略不計。未來的工作是進一步提高SPB-MAR的性能,引入額外的近似技術。

參考文獻

  [1] NEWMAN M E, GIRVAN M. Finding and evaluating community structure in networks[J]. Physical Review E, 2004,69(2):026113-1-026113-15.

  [2] DEAN J, GHEMAWAT S. MapReduce: simplified data processing on large clusters[C]. Communications of the ACM, 2008,51(1):107-113.

  [3] CHAIKEN R, JENKINS B,  LARSON P.-A°, et al. Scope: easy and efficient parallel processing of massive data sets[C].Proceedings of the VLDB Endowment, 2008,1(2):1265-1276.

  [4] COHEN J, DOLAN B, DUNLAP M, et al. Mad skills: new analysis practices for big data[C]. Proceedings of the VLDB Endowment, 2009,2(2):1481-1492.

  [5] Hadoop Apache. Software Foundation.(2013-08-01)[2014-07-01].http://hadoop.apache.org.

  [6] Zeng Zengfeng, Wu Bin, Zhang Tiantian. A multi-source message passing model to improve the parallelism efficiency of graph mining on MapReduce[C]. Proceedings of 2012 IEEE International Parallel and Distributed Processing Symposium Workshops & PhD Forum(IPDPSW),2012:2019-2025.

  [7] Stanford large network dataset collection[EB/OL].[2013-08-01]. http://snap. stanford.edu/data.

  [8] Han Jiamei, KAMBER M, Pei Jian. Data mining: concepts and techniques(2nd edition). Morgan Kaufmann, 2006.


此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美日韩色综合| 欧美日韩精品一区二区三区四区| 欧美特黄视频| 亚洲欧美中文日韩在线| 欧美电影在线观看| 亚洲一区二区三区中文字幕| 校园春色国产精品| 亚洲欧美成人综合| 亚洲精品乱码久久久久久蜜桃麻豆| 欧美一区二区播放| 欧美电影在线免费观看网站| 国产欧美欧美| 亚洲国产高清自拍| 亚洲人线精品午夜| aaa亚洲精品一二三区| 欧美日韩亚洲系列| 亚洲国产精品一区二区www| 亚洲在线观看视频| 欧美日韩亚洲一区二区| 亚洲无亚洲人成网站77777| 欧美在线网址| 欧美激情视频给我| 午夜在线观看欧美| 老色鬼久久亚洲一区二区| 欧美国产先锋| 蜜桃精品久久久久久久免费影院| 日韩一区二区电影网| 亚洲国产精品视频一区| 欧美日韩精品免费观看视频| 在线看欧美日韩| 在线视频日韩| 欧美精品在欧美一区二区少妇| 国产婷婷色一区二区三区在线| 在线视频国产日韩| 午夜亚洲视频| 欧美国产精品人人做人人爱| 在线亚洲国产精品网站| 免费亚洲网站| 国产综合在线视频| 一区二区欧美在线观看| 日韩亚洲精品在线| 欧美精品日韩一区| 国产日本亚洲高清| 欧美日韩免费区域视频在线观看| 国产精品毛片va一区二区三区| 亚洲国产欧美不卡在线观看| 噜噜爱69成人精品| 久久先锋资源| 中文日韩在线视频| 今天的高清视频免费播放成人| 看欧美日韩国产| 亚洲国产精品va在线看黑人动漫| 欧美午夜宅男影院在线观看| 欧美高清视频在线| 国产一区二区三区免费不卡| 欧美三级午夜理伦三级中文幕| 国产日韩一区| 小黄鸭精品aⅴ导航网站入口| 国产精品xnxxcom| 国产精品一区免费视频| 国产精品久久久久久久浪潮网站| 欧美日韩日本国产亚洲在线| 国产亚洲精品久久久久久| 亚洲午夜在线观看| 91久久精品国产91久久性色tv| 老司机午夜精品视频在线观看| 久久一区二区三区超碰国产精品| 国产人成精品一区二区三| 欧美日韩精品伦理作品在线免费观看| 一本色道**综合亚洲精品蜜桃冫| 亚洲午夜视频在线观看| 久久成人免费电影| 六十路精品视频| 午夜视频一区在线观看| 在线观看三级视频欧美| 亚洲国产精品va在看黑人| 久久久久久久一区| 中文无字幕一区二区三区| 欧美一级片久久久久久久| 久久精品一级爱片| 免费久久久一本精品久久区| 久久久久99| 日韩视频精品在线| 亚洲免费成人av电影| 欧美视频一区| 久久精品久久综合| 欧美日韩一区二区高清| 欧美精品在线一区| 国产精品久久999| 欧美欧美在线| 国产精品久久波多野结衣| 精品电影在线观看| 欧美成人久久| 免费日韩成人| 欧美日韩精品中文字幕| 亚洲综合国产激情另类一区| 亚洲在线免费| 99精品欧美一区| 欧美午夜不卡影院在线观看完整版免费| 国产欧美日韩另类一区| 亚洲国产裸拍裸体视频在线观看乱了中文| 一区二区三区毛片| 亚洲精品一区二区三区四区高清| 亚洲综合欧美日韩| 久久久久久电影| 欧美三级黄美女| 亚洲视频观看| 欧美三级免费| 久久网站热最新地址| 亚洲一区二区三区免费在线观看| 欧美日韩在线看| 国产精品中文字幕在线观看| 免费一级欧美片在线播放| 欧美日韩高清区| 亚洲第一精品福利| 亚洲午夜精品网| 午夜在线精品偷拍| 亚洲一级片在线观看| 国产精品一卡二| 亚洲永久精品大片| 久久精品国产视频| 一区二区三区在线视频播放| 久久久久久久久久久久久女国产乱| 亚洲欧美一区二区三区久久| 激情久久婷婷| 欧美国产成人在线| 欧美日韩成人一区二区| 久久亚洲精品网站| 欧美国产日本高清在线| 久久精品亚洲一区二区| 久久久久久黄| 欧美女同视频| 欧美韩国日本一区| 欧美乱妇高清无乱码| 欧美国产高清| 午夜精品久久久| 国产日韩一区在线| 欧美日韩亚洲高清一区二区| 在线精品亚洲| 99在线热播精品免费| 最新69国产成人精品视频免费| 在线观看成人av电影| 久久精品成人一区二区三区| 国产精品色网| 9l视频自拍蝌蚪9l视频成人| 亚洲午夜精品17c| 久久婷婷久久| 久久久人成影片一区二区三区观看| 久久久久九九视频| 亚洲欧美高清| 欧美a级一区二区| 亚洲一区图片| 国产精品综合视频| 国产精品视频999| 1769国产精品| 亚洲国产天堂久久综合网| 国产亚洲成av人片在线观看桃| 欧美三级视频在线观看| 狠狠色狠狠色综合人人| 欧美日韩国产综合一区二区| 亚洲精品老司机| 久久精品国产欧美激情| 亚洲欧美综合另类中字| 国内成人精品一区| 久久精品免费电影| 99视频国产精品免费观看| 亚洲欧洲免费视频| 欧美日韩精品一区二区在线播放| 久久久不卡网国产精品一区| 欧美激情第1页| 国产精品区一区二区三区| 久久躁日日躁aaaaxxxx| 亚洲电影在线播放| 亚洲美女在线一区| 黄色成人在线网址| 亚洲欧美在线视频观看| 亚洲国产日韩在线| 一区二区三区欧美激情| 在线播放精品| 久久夜色精品国产亚洲aⅴ| 欧美日韩精品伦理作品在线免费观看| 在线午夜精品自拍| 亚洲在线国产日韩欧美| 国产伦精品一区二区三区视频孕妇| 国产视频丨精品|在线观看| 欧美午夜精品久久久久免费视| 国产午夜精品美女视频明星a级| 国产精品女同互慰在线看| 99ri日韩精品视频| 欧美福利影院| 国产乱码精品1区2区3区| 久久伊人亚洲| 亚洲毛片在线观看.| 国产中文一区二区| 亚洲日本精品国产第一区| 欧美日韩视频在线一区二区| 亚洲一区制服诱惑| 亚洲欧美中文日韩v在线观看| 欧美日韩一区视频| 欧美精品在欧美一区二区少妇| 日韩视频精品在线| 亚洲深夜影院| 亚洲一区二区三区免费视频| 欧美精品久久天天躁| 欧美日韩国产专区| 亚洲在线免费观看| 久久精品夜夜夜夜久久| 久久久久国产一区二区| 久久久久久久久蜜桃| 欧美伊人久久久久久午夜久久久久| 亚洲电影免费| 亚洲天堂成人在线视频| 午夜综合激情| 欧美人与禽猛交乱配视频| 亚洲国产另类久久精品| 国产一区二区三区在线免费观看| 亚洲精品网站在线播放gif| 欧美jjzz| 欧美日韩中文在线| 午夜亚洲视频| 在线观看91精品国产入口| 国产精品手机在线| 国产精品视屏| 亚洲永久字幕| 欧美在线一级视频| 午夜一级在线看亚洲| 日韩视频欧美视频| 欧美亚日韩国产aⅴ精品中极品| 一区二区三区产品免费精品久久75| 亚洲精品在线电影| 欧美精品三级在线观看| 欧美成人午夜视频| 国产一区二区三区久久精品| 久久九九热re6这里有精品| 免费成人激情视频| 亚洲精品一区二区三区婷婷月| 久久精品视频va| 亚洲精品视频在线| 欧美性片在线观看| 国产精品毛片在线| 欧美精品日韩一本| 久久成人18免费网站| 欧美黑人国产人伦爽爽爽| 欧美福利精品| 免费人成精品欧美精品| 国产一区二区三区日韩欧美| 欧美一区二区在线观看| 国产精品九九| 欧美一二三区在线观看| 午夜激情一区| 亚洲精品免费一区二区三区| 亚洲一区二区高清视频| 欧美午夜免费影院| 国产一区二区三区直播精品电影| 国产精品99一区二区| 亚洲综合久久久久| 午夜精品理论片| 国产精品亚洲视频| 国内精品久久久久久久果冻传媒| 日韩视频亚洲视频| 亚洲国产网站| 久热爱精品视频线路一| 在线精品视频一区二区三四| 99视频精品全国免费| 久久超碰97中文字幕| 欧美一区二粉嫩精品国产一线天| 99在线观看免费视频精品观看| 国产视频在线观看一区二区| 激情成人亚洲| 精品va天堂亚洲国产| 亚洲日本一区二区三区| 欧美日韩在线免费视频| 在线观看欧美精品| 欧美日韩另类丝袜其他| 亚洲激情黄色| 亚洲精品一区二区三区在线观看| 国产一区二区成人久久免费影院| 亚洲午夜精品17c| 夜夜嗨av色综合久久久综合网| 久久久免费观看视频| 日韩一二三区视频| 亚洲丶国产丶欧美一区二区三区| 欧美日韩国产天堂| 午夜精品久久久久久久久久久久| 亚洲欧洲一区二区三区久久| 国内精品写真在线观看| 国内精品国语自产拍在线观看| 亚洲免费精品| 欧美区二区三区| 欧美三级电影大全| 99re热这里只有精品免费视频| 欧美日韩国产综合新一区| 欧美午夜电影一区| 国产精品视频久久久| 国产精品久久久久久模特| 欧美激情一区二区三区| 韩国亚洲精品| 午夜精品久久久久久久99热浪潮| 欧美黄色小视频| 亚洲一二三区视频在线观看| 亚洲国产综合在线看不卡| 亚洲视频中文| 国产精品看片你懂得| 国产亚洲精品久久久久婷婷瑜伽| 国产精品综合网站| 国产精品久久久久9999吃药| 一本色道久久综合| 夜夜爽99久久国产综合精品女不卡| 欧美视频在线不卡| 99riav久久精品riav| 欧美日韩免费区域视频在线观看| 欧美激情视频一区二区三区不卡| 国产欧美短视频| 海角社区69精品视频| 国产精品久久婷婷六月丁香| 日韩午夜在线观看视频| 亚洲午夜精品| 一区二区欧美精品| 欧美一级午夜免费电影| 亚洲夫妻自拍| 美国十次成人| 亚洲综合色在线| 午夜精品成人在线视频| 欧美日韩不卡在线| 亚洲欧美日韩一区二区三区在线观看| 欧美久久视频| 欧美激情一区二区三区高清视频| 亚洲免费av片|