《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于MapReduce的序列規則在推薦系統中的研究
基于MapReduce的序列規則在推薦系統中的研究
來源:微型機與應用2014年第6期
元二菊1,2,郭進偉1,2,皮建勇1,2
(1.貴州大學 計算機科學與信息學院,貴州 貴陽550025; 2.貴州大學 云計算與物聯網研究中心
摘要: 目前常用的個性化推薦系統模型通常是基于協同過濾或者是基于內容的,也有部分基于關聯規則的。這些算法沒有考慮事務間的順序,然而在很多應用中這樣的順序很重要。文章提出了一種簡易的基于序列模式的推薦模型,并且考慮到大規模數據的處理,結合了MapReduce編程模型。這種簡易的推薦模型可以用來輔助通常的個性化推薦系統。
Abstract:
Key words :

摘  要: 目前常用的個性化推薦系統模型通常是基于協同過濾或者是基于內容的,也有部分基于關聯規則的。這些算法沒有考慮事務間的順序,然而在很多應用中這樣的順序很重要。文章提出了一種簡易的基于序列模式的推薦模型,并且考慮到大規模數據的處理,結合了MapReduce編程模型。這種簡易的推薦模型可以用來輔助通常的個性化推薦系統。
關鍵詞: 推薦系統;序列規則;MapReduce

    21世紀以來,隨著互聯網的飛速發展,人類已經進入信息社會的時代?;ヂ摼W對人們的生活影響越來越大,越來越多的人通過互聯網發布和查找信息,網絡成為了人們生活中必不可少的一部分,也成為信息制造、發布、處理和加工的主要平臺?,F如今,互聯網已經逐漸參與到人們工作、生活、學習的各個方面,成為人們獲取所需信息、進行學習工作和信息交流的主要場所,并對人們的生活和社會的發展產生了巨大影響。
    個性化推薦系統是一種以海量數據挖掘為基礎的智能平臺,這個平臺借助于電子商務網站來為顧客提供因人而異的個性化決策支持和信息服務。個性化推薦系統逐漸地被應用于各種商業網站,它因人而異地根據每個用戶的喜好主動地為其預測、推薦符合需求的商品,從這一點上彌補了信息系統的不足。隨著個性化推薦系統的不斷完善,各種算法被深入研究。目前最常用的推薦模型是以協同過濾為基礎的。盡管基于協同過濾算法的應用比較成熟,但它有著自身固有的缺點[1],這使得它需要與其他方法結合使用。
    本文第1部分介紹了MapReduce編程模型,第2部分描述了一種簡易的基于序列模式的推薦系統的框架,第3部分介紹該框架在MapReduce模型下的實現,最后在總結部分提出了該框架的不足及需要改進的地方。
1 MapReduce編程模型
    2004 年,谷歌發表論文向全世界介紹了GFS[2]和MapReduce[3]等模型,為大規模并行數據的計算和分析提供了重要的參考。MapReduce編程模型通過顯式的網絡拓撲結構盡力保留網絡帶寬,并盡量在計算節點上存儲數據,以實現數據的本地快速訪問,從而帶來了良好的整體性能。
    MapReduce的設計靈感來自于Lisp等函數式編程語言中的map和reduce原語,相應的map和reduce函數由用戶負責編寫,它們通常遵循如下常規格式:
    Map:(K1,V1)→list(K2,V2)
    Reduce:(K2,list(V2))→list(K3,V3)
    具體的MapReduce操作流程如圖1所示。

    對圖1中的流程可以描述如下:
    (1)用戶程序利用MapReduce相關接口先把輸入文件劃分為若干份,每一份的大小根據其分布式文件系統的塊的大小進行設定,然后使用fork在系統中創建主控進程(master)和工作進程(worker)。
    (2)主控進程負責調度,為空閑worker分配作業(Map作業或者Reduce作業)。主控進程根據輸入文件的劃分分配相應的Map作業,同時,主控進程還將分配若干個Reduce作業。
    (3)被分配了Map作業的worker,開始讀取對應分片的輸入數據,Map作業數量由輸入文件的劃分決定,與split一一對應;Map作業從輸入數據中抽取出鍵值對,每一個鍵值對都作為參數傳遞給map函數,map函數產生的中間鍵值對被緩存在內存中。
    (4)緩存的中間鍵值對會定期寫入本地磁盤,而且被分為R個區,R的大小由用戶定義,將來每個區會對應一個Reduce作業;這些中間鍵值對的位置會通報給master,master負責將信息轉發給Reduce worker。
    (5)主控節點通知分配了Reduce作業的worker它負責的分區在什么位置,當Reduce worker把所有負責的中間鍵值對都讀過來后,先對它們進行排序,使得相同鍵的鍵值對聚集在一起。因為不同的鍵可能會映射到同一個分區也就是同一個Reduce作業,所以排序是必須的。
    (6)Reduce worker遍歷排序后的中間鍵值對,對于每個唯一的鍵,都將鍵與關聯的值傳遞給reduce函數,reduce函數產生的輸出會添加到這個分區的輸出文件中。
    (7)當所有的Map和Reduce作業都完成了,master將會喚醒用戶程序,用戶程序對MapReduce平臺的調用由此返回。
    MapReduce是一個簡便的編程模型,編程人員只需要實現其中的Map函數和Reduce函數即可。
2 框架描述
    序列模式挖掘[4]是指找出所有滿足用戶指定的最小支持讀的序列,每個這樣的序列成為一個頻繁序列,或者一個序列模式。本文描述的算法基于序列模式挖掘,但是不考慮最小支持度,并且經過一次循環即可挖掘出模式,所以不存在產生候選項集。
    通常個性化推薦系統分為3個階段:數據預處理階段、模式發現階段和推薦階段。其中數據預處理階段和模式發現階段都是推薦系統定期執行的(即離線部分),而推薦階段是實時的(即在線部分),因為系統需要通過用戶訪問的信息及時生成推薦信息。

 



    在推薦階段,需要對用戶瀏覽過的頁面實時地進行分析,并預測用戶要點擊的頁面,動態地為用戶推薦可能要瀏覽的頁面,因此在本階段引入活動窗口。如果根據用戶最新瀏覽的兩個網頁進行推薦,則窗口大小為2。為便于理解,暫時討論活動窗口為3的情況。例如用戶u的活動窗口為〈A,B,C〉,假設用戶u下一個頁面點擊了頁面D,則活動窗口改為〈B,C,D〉,在此基礎上用戶u下一個頁面點擊了頁面D,則活動窗口改為〈B,D,C〉。如圖3所示。系統根據用戶的活動窗口,在已經挖掘到的模式中進行查詢,如果查詢到結果頁面,并且不止一個結果頁面,則可以根據模式比值進行相應處理,可以將比值最高的作為推薦頁面返回給用戶,也可以將比值排名前幾的作為推薦頁面返回給用戶。


3 MapReduce算法設計
    在MapReduce算法設計[5]中,定義活動窗口的大小為2,并且默認數據經過預處理并保存在文本文件中,文本文件的一行為一個用戶的事務,一個單詞表示為一個項,項與項之間用空格隔開。
3.1 Map階段
    Map階段輸入數據的鍵值對,Key為文本的行標,在本文中沒有實際意義,Value為文本中的一行數據。Map階段的偽代碼如下:
    輸入:(key, value)
    輸出:(word, one)
    方法:map
    {
    line = value.toString();
    pages = line.split(“ ”);
    length = pages.length();
    //通過三層循環發現模式
    for(i=0; i<length-2; i++)
    {
        for(j=i+1; j<length-1; j++)
        {
        for(k=j+1; k<length; k++)
        {
          word=pages[i]+“ ”+pages[j];
          one=pages[k];
          //輸出結果
          output.collect(word,one);
        }
        }
      }
    }
3.2 Reduce階段
    在Reduce階段,Reduce工作節點從遠程Map工作節點讀取中間結果。在此階段中,統計出模式出現的頻率,并得出與事務總數的比值,最后輸出結果鍵值對。
    輸入:(word, values)
    輸出:(word, sum)
    方法:reduce
    {
       //通過循環發現模式出現的頻率
       while(values.hasNext())
       {
        value=values.next().get();
        result=resultMap.get(value);
        if(null != result)
       {
        result += 1;
        resultMap.put(value,result);
       }
       else
       {
        resultMap.put(value, 1);
       }
     }
     itr=map.keySet().iterator();
     //根據頻率得出與事務總數的比值
     while(itr.hasNext())
     {
       key=itr.next();
       ratio=map.get(key)/sumt;
       resultBuffer.append(key+“:”+ratio);
     }
     //輸出結果
     output.collect(word, resultBuffer);
    }
    本文提出了一種簡易的基于序列模式的推薦模型,并結合MapReduce,實現了在大數據條件下進行模式挖掘的系統,彌補了常見的個性化推薦系統缺少時序的缺點,可以作為輔助的個性化推薦系統的應用。但本文缺少實驗數據,沒有進行實現分析,從而略顯遺憾。并且存在以下問題需要在以后的工作中繼續研究:
    (1)個性化推薦的研究是基于用戶行為的研究,尤其是用戶Web瀏覽行為[6],用戶對不同類別的Web瀏覽習慣存在較大的差別。本文在用戶事務和活動窗口中均沒有考慮重復頁面的情況,并且活動窗口固定大小,因此在后續工作中應加入特定條件下用戶行為的研究。
    (2)在事務中的項較多的情況下,可以考慮對項進行分類的策略,但是不同類別的項之間也可能存在關聯,在活動窗口中也可引入類別的概念,可以考慮同類別項之間的前后順序,而不像本文只單純地考慮瀏覽頁面的順序,這也將在后續工作中進行研究。
參考文獻
[1] SARWAR B,KARYPIS G,KONSTAN J,et al.Item-based collaborative filtering recommendation algorithms[C].In Proceedings of the Tenth International. World Wide Web Conference on World Wide Web,2001.
[2] GHEMAWAT S,GOBIOFF H,LEUNG S-T.The Google file system[C].Procedings of 19th ACM Symposium on Operating System Principles,2003:29-43.
[3] DEAN J,GHEMAWAT S.MapReduce: simplified data processing on large clusters[J].Communications of the ADM 50th Anniversary lssue:1958-2008,2008,51(1):107-113.
[4] AGRAWAL R,SRIKANT R.Mining sequential patterns[C]. In Proc. of the Intl.conf.on Data Engineering,1995:3-15.
[5] WHITE T.Hadoop:the definitive guide[M].Yahoo Press,2010.
[6] MOBASHER B,DAI H,LUO T,et al.Effective personalization based on association rule discovery from web usage data[C].Proceedings of the 3rd International Workshop on  Web Information and Data Management,2001:9-15.

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美精品18| 黑人操亚洲美女惩罚| 国产精品腿扒开做爽爽爽挤奶网站| 国产一区二区三区高清在线观看| 女同性一区二区三区人了人一| 国产精品综合网站| 亚洲精品国产精品国自产在线| 黄色免费成人| 国产精品久久午夜夜伦鲁鲁| 日韩视频专区| 亚洲视频香蕉人妖| 久久久久久精| 欧美在线视频一区二区| 国产精品成人观看视频国产奇米| 一区二区三区在线观看欧美| 欧美日韩国产123| 1769国产精品| 久久久久久999| 国产精品一区在线观看| 国产精品一区在线播放| 久久久噜噜噜久久人人看| 国产精品免费一区豆花| 欧美激情第六页| 精久久久久久久久久久| 欧美综合第一页| 91久久久在线| 久久精品在线观看| 欧美黄色aa电影| 国产精品一卡二| 榴莲视频成人在线观看| 久久亚洲综合网| 久久香蕉国产线看观看av| 国产欧美日韩在线播放| 国产精品高潮呻吟久久av黑人| 欧美国产一区视频在线观看| 亚洲日韩欧美一区二区在线| 久久成人资源| 欧美久久精品午夜青青大伊人| 一本大道久久a久久精品综合| 国产女人精品视频| 国产一区二区激情| 国内精品福利| 中国成人亚色综合网站| 狠狠色噜噜狠狠狠狠色吗综合| 欧美亚洲一区二区在线| 欧美gay视频| 国产精品男人爽免费视频1| 一区二区国产在线观看| 一区二区不卡在线视频 午夜欧美不卡在| 亚洲欧美日韩综合国产aⅴ| 精久久久久久久久久久| 亚洲精品一区二区在线| 麻豆久久久9性大片| 亚洲第一级黄色片| 欧美在线首页| 国产视频一区在线观看| 欧美四级剧情无删版影片| 亚洲精品久久久久久久久久久久| 国内精品久久久| 欧美日韩成人网| 久久久999精品视频| 亚洲永久免费观看| 国产欧美精品久久| 91久久精品日日躁夜夜躁欧美| 欧美日韩免费观看一区二区三区| 精品不卡视频| 国产精品美女久久久久aⅴ国产馆| 99视频+国产日韩欧美| 免费中文字幕日韩欧美| 欧美一区二区三区视频免费播放| 欧美成年人网| 国产一区二区三区黄视频| 欧美极品aⅴ影院| 悠悠资源网久久精品| 在线免费观看日本一区| 91久久精品国产| 国产婷婷色综合av蜜臀av| 欧美夫妇交换俱乐部在线观看| 久久久99久久精品女同性| 国际精品欧美精品| 国产精品二区影院| 久久国产一区二区三区| 欧美人牲a欧美精品| 樱桃视频在线观看一区| 久久久一本精品99久久精品66| 亚洲第一综合天堂另类专| 久久国产夜色精品鲁鲁99| 一区二区三区在线免费观看| 欧美日韩亚洲视频| 亚洲国产日韩美| 在线观看欧美黄色| 欧美日韩一区在线视频| 欧美色网一区二区| 91久久精品www人人做人人爽| 久久国产精品久久精品国产| 国产精品久久福利| 一区二区三区免费看| 欧美日韩一区二区三区| 午夜精品美女自拍福到在线| 最新日韩欧美| 黄色小说综合网站| 欧美电影免费观看高清完整版| 欧美日韩免费观看一区=区三区| 一本久道久久综合婷婷鲸鱼| 六月婷婷久久| 亚洲综合欧美| 亚洲五月六月| 亚洲精品偷拍| 国产精品卡一卡二卡三| 欧美日韩在线综合| 久久久噜噜噜久噜久久| 国产午夜精品理论片a级探花| 欧美新色视频| 国产精品羞羞答答xxdd| 欧美日韩精品国产| 久久久久免费视频| 国产精品99久久久久久久久| 欧美成人免费在线观看| 伊人色综合久久天天五月婷| 欧美久久久久久久| 一区二区三区免费看| 伊大人香蕉综合8在线视| 欧美顶级少妇做爰| 欧美成人午夜视频| 国产精品超碰97尤物18| 亚洲一区www| 香蕉久久夜色| 欧美性大战xxxxx久久久| 欧美激情aaaa| 欧美日韩国产黄| 亚洲国产欧美精品| 国产一区二区三区在线观看免费视频| 午夜在线视频观看日韩17c| 狠狠色综合播放一区二区| 亚洲午夜一区| 午夜在线成人av| 亚洲欧洲日本mm| 欧美资源在线观看| 日韩视频一区二区三区| 欧美久久久久久久久久| 亚洲自拍偷拍麻豆| 国产一区二区三区高清在线观看| 国产精品一区二区男女羞羞无遮挡| 日韩午夜av在线| 久久精品视频va| 欧美极品aⅴ影院| 久久成人精品视频| 国产日韩在线看| 亚洲欧洲在线视频| 国产一区二区主播在线| 欧美日韩直播| 性欧美在线看片a免费观看| 欧美电影免费观看高清| 亚洲一级免费视频| 日韩午夜免费视频| 欧美日韩三级电影在线| 亚洲国产欧美一区二区三区同亚洲| 激情成人综合网| 国产欧美精品| 最新精品在线| 国产精品午夜久久| 激情成人亚洲| 欧美大香线蕉线伊人久久国产精品| 欧美日韩国产三区| 激情亚洲成人| 日韩一区二区电影网| 每日更新成人在线视频| 亚洲人成毛片在线播放| 国产精品午夜av在线| 亚洲电影免费在线观看| 日韩网站在线看片你懂的| 性色av香蕉一区二区| 国产精品草莓在线免费观看| 欧美日韩成人综合天天影院| 国产精品国产三级国产专播品爱网| 欧美精品日韩综合在线| 欧美电影在线播放| 欧美小视频在线| 国产欧美日韩视频一区二区| 亚洲第一区在线| 久久精品视频免费观看| 亚洲成人在线网| 蜜臀av国产精品久久久久| 一区免费视频| 性欧美大战久久久久久久免费观看| 亚洲美女在线看| 午夜精品久久久久影视| 亚洲午夜视频在线| 久久亚洲欧美国产精品乐播| 国产精品久久久久久久app| 亚洲精品乱码久久久久久蜜桃91| 久久av一区二区| 亚洲第一精品福利| 国产精品资源在线观看| 欧美+亚洲+精品+三区| 国产精品va| 欧美日韩国产综合网| 亚洲第一二三四五区| 国产在线观看精品一区二区三区| 国产精品免费一区二区三区在线观看| 国产精品爱久久久久久久| 亚洲精品影视在线观看| 国产欧美精品在线播放| 国内精品伊人久久久久av一坑| 国产精品久久久久一区二区三区| 一区二区福利| 欧美中文字幕在线播放| 国产精品99一区| 欧美激情国产日韩精品一区18| 亚洲日本黄色| 在线精品视频在线观看高清| 亚洲伦理精品| 国产精品亚洲综合| 亚洲女ⅴideoshd黑人| 国产欧美日韩亚洲精品| 亚洲国产99| 国产美女精品| 久久av资源网站| 欧美自拍偷拍| 欧美中文字幕视频在线观看| 欧美 日韩 国产在线| 国产综合一区二区| 99在线精品免费视频九九视| 欧美日韩国产综合视频在线观看中文| 欧美日韩中文在线观看| 亚洲久久一区| 亚洲国产成人在线播放| 亚洲国产成人tv| 欧美尤物一区| 国产精品久久福利| 曰韩精品一区二区| 亚洲自拍偷拍网址| 国产精品美女视频网站| 久久综合亚州| 先锋影音久久久| 久久精品夜色噜噜亚洲aⅴ| 激情亚洲一区二区三区四区| 亚洲一级二级在线| 亚洲国产精品一区制服丝袜| 影音先锋日韩精品| 国产一区二区三区奇米久涩| 久久夜色精品| 羞羞视频在线观看欧美| 欧美影院视频| 亚洲第一在线视频| 亚洲欧美日韩在线高清直播| 美女999久久久精品视频| 玉米视频成人免费看| 亚洲精品在线观看免费| 久久伊人一区二区| 国产精品欧美一区二区三区奶水| 亚洲美女中文字幕| 欧美一级专区免费大片| 亚洲国产一区二区三区高清| 国产一区二区高清视频| 国产欧美日韩一区二区三区| 欧美三级视频在线播放| 欧美激情精品久久久久| 在线看欧美视频| 狠狠网亚洲精品| 久久久久国产精品厨房| 蜜桃av一区二区在线观看| 久久精品中文字幕一区| 国产精品久久毛片a| 欧美国产高潮xxxx1819| 国产香蕉久久精品综合网| 亚洲欧洲在线免费| 一色屋精品视频在线看| 久久久噜噜噜久久中文字免| 狠狠色综合一区二区| 亚洲国产精品久久| 欧美在线3区| 91久久综合亚洲鲁鲁五月天| 国产主播在线一区| 精品不卡一区二区三区| 欧美日韩国产123| 欧美在线播放一区二区| 国产精品永久在线| 亚洲午夜激情网页| 国产精品国产三级国产普通话99| 老司机亚洲精品| 久久久亚洲一区| 亚洲二区视频在线| 亚洲福利视频二区| 欧美一区二区三区的| 亚洲精品国产视频| 久久夜色精品国产亚洲aⅴ| 免费观看在线综合| 亚洲国产精彩中文乱码av在线播放| 欧美亚洲一区在线| 在线免费一区三区| 欧美一级片久久久久久久| 久久久青草婷婷精品综合日韩| 欧美在线日韩在线| 美女国产精品| 亚洲日本va午夜在线电影| 国产乱码精品一区二区三区不卡| 蜜桃伊人久久| 欧美国产日本高清在线| 销魂美女一区二区三区视频在线| 欧美日本中文字幕| 日韩一区二区高清| 国产精品一二三视频| 精品999久久久| 久久偷看各类wc女厕嘘嘘偷窃| 国外成人性视频| 日韩午夜在线播放| 中日韩午夜理伦电影免费| 韩国欧美一区| 欧美午夜激情在线| 亚洲女同在线| 久久在精品线影院精品国产| 欧美三级乱人伦电影| 欧美人牲a欧美精品| 亚洲国产精品一区二区第一页| 国产欧美一区二区精品秋霞影院| 韩日精品中文字幕| 亚洲成人在线视频播放| 欧美视频在线观看视频极品| 欧美一级久久久| 国产亚洲精品高潮| 亚洲人成人77777线观看| 欧美性猛片xxxx免费看久爱| 欧美日韩综合网| 国产啪精品视频| 亚洲品质自拍| 亚洲黄色一区二区三区| 国产在线不卡视频|