《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于樸素貝葉斯的EM缺失數據填充算法
基于樸素貝葉斯的EM缺失數據填充算法
來源:微型機與應用2011年第16期
鄒 薇,王會進
(暨南大學 信息科學技術學院,廣東 廣州510632)
摘要: 實際應用中大量的不完整的數據集,造成了數據中信息的丟失和分析的不方便,所以對缺失數據的處理已經成為目前分類領域研究的熱點。由于EM方法隨機選取初始代表簇中心會導致聚類不穩定,本文使用樸素貝葉斯算法的分類結果作為EM算法的初始使用范圍,然后按E步M步反復求精,利用得到的最大化值填充缺失數據。實驗結果表明,本文的算法加強了聚類的穩定性,具有更好的數據填充效果。
Abstract:
Key words :

摘  要:實際應用中大量的不完整的數據集,造成了數據中信息的丟失和分析的不方便,所以對缺失數據的處理已經成為目前分類領域研究的熱點。由于EM方法隨機選取初始代表簇中心會導致聚類不穩定,本文使用樸素貝葉斯算法的分類結果作為EM算法的初始使用范圍,然后按E步M步反復求精,利用得到的最大化值填充缺失數據。實驗結果表明,本文的算法加強了聚類的穩定性,具有更好的數據填充效果。
關鍵詞:數據填充;EM算法;樸素貝葉斯算法

 在數據泛濫的今天,迫切地需要一種將數據轉換成有用的信息和知識的數據挖掘技術。然而,由于信息無法獲取或者在操作過程中被遺漏等原因,現實中的數據往往存在大量的缺失[1]。數據缺失對數據挖掘的過程和結果有嚴重的影響:首先,系統丟失了大量有用的信息;其次,系統中所表現出的不確定性更加顯著,系統中蘊涵的確定性成分更難把握[2];第三,包含空值的數據會使挖掘過程陷入混亂,導致不可靠的輸出;第四,可能直接影響到數據挖掘模式發現的準確性和運行性能,甚至導致錯誤的挖掘模型[3]。因此,在數據預處理過程中,缺失數據的處理是一個重要的環節。
    目前,國外對數據缺失問題的研究取得了很多成果,提出了最近似值替換方法、隨機回歸填補法、神經網絡、貝葉斯網絡等理論來解決缺失數據填充問題。國內對填充缺失數據的研究還處在一個開始的階段,只有銀行、保險業等在針對其自身具體的應用進行了缺失數據處理的研究。
    總體上說,對缺失值的處理分為三大類:刪除元組、數據填充和不處理[4]。其中,處理數據缺失最簡單的方法是刪除元組,當缺少類標號時通常這樣做(假定挖掘任務設計分類),但是當每個屬性缺少值的百分比變化很大時,該方法性能特別差[5]。處理數據缺失的有效方法是使用最可能的值填充缺失值,可以用回歸、貝葉斯形式化的基于推理的工具或決策樹歸納確定[6]。近年來,學術界提出了很多數據填充算法。宮義山提出了基于貝葉斯網絡的缺失數據處理方法[7],彭紅毅針對數據之間存在相關性且為非高斯分布這種情況提出了ICA-MDH數據估計方法[8],Hruschkaetal.使用貝葉斯算法對實例中的缺失值進行估計[9]。
    在眾多算法中,EM算法能通過穩定、上升的步驟可靠地找到全局最優值,算法適應性更強。盡管Gibbs抽樣(Gibbs samplig)[10]、GEM(Generalized EM)算法、Monte Carlo EM算法都改進了EM算法,但EM算法收斂速度慢的缺點仍然沒有得到很好的解決?;诖?,本文提出結合樸素貝葉斯分類改進傳統EM算法的方法填充缺失數據的新算法。給EM初始值界定了范圍,提高了EM算法的收斂速度和算法的穩定性,克服了邊緣值造成EM算法結果偏差大的缺點,實現了良好的缺失數據填充效果。
1 樸素貝葉斯分類的EM數據填充算法及其改進
1.1 符號定義

    首先對算法中使用到的符號進行定義,如表1。

1.2 傳統EM算法介紹
    EM(期望最大化)算法是一種流行的迭代求精算法,它的每一步迭代都由一個期望步(expectation step)和一個最大化步(maximization step)組成。其基本思想是,首先估計出缺失數據初值,計算出模型參數的值,然后再不斷迭代執行E步和M步,對估計出的缺失數據值進行更新,直到收斂。EM算法的具體描述如下:

1.3 EM算法改進
    EM算法隨機選擇對象作為簇的中心,會導致EM算法聚類結果的不穩定性,以及邊緣數據對整個算法影響過大,使得填充數據正確率偏低。本文提出了基于樸素貝葉斯的EM缺失數據填充算法。本算法使用樸素貝葉斯算法對源數據進行分類,將分類結果作為EM算法使用范圍,在每個類中反復執行E步M步直至收斂,充分利用了EM算法容易達到局部最優的優點,使得EM算法更好地聚類,更快地收斂,從而得到更準確的數據填充值。本文算法的具體描述如下:
  
  

 


    實驗設計具體步驟如下:
    (1) 將原始數據集準備二份,一份作為原始集,一份作為測試集。用MCAR(missing completely at random,完全隨機缺失)方法隨機去掉測試集的不同比率的屬性值,并剔除原有類標;
    (2) 使用本文算法對(1)后的測試集的屬性值和類標進行預測,填充缺失值和類標志;
    (3) 反復進行試驗20次;
    (4) 本文使用填充數據與真實數據的平均絕對離
     由上述三表可以看出,在缺失率不同的情況下與經典EM算法相比,本文算法穩定,且減少了與真實數值的偏差,這樣使得實際運用中的填充數據值更真實地反映數據信息。EM算法提出較早,GEM算法、Monte Carlo EM算法和界定折疊法等都改進了EM算法,相比較于這些算法,本文充分利用了EM算法容易實現局部最優的特點,將EM初始范圍界定在一個類內,使得EM算法很好地聚類和收斂,使得填充值更接近于真實數值。
    數據缺失是數據預處理中亟須解決的問題,本文為填充缺失數據提出了基于樸素貝葉斯的EM數據填充算法。該算法使用樸素貝葉斯分類算法的結果作為EM算法的初始范圍,然后按E步M步反復求精,利用得到的最大化值填充缺失數據。該算法充分利用了EM算法容易實現局部最優的特點,使得EM算法更好地聚類,更快地收斂,從而得到更準確的數據填充值。實驗結果表明,該算法得到了預期的效果。由于本論文主要是針對數值型屬性進行分析,下一步的研究是考慮非數值型屬性缺失問題。
參考文獻
[1] GRZYMALA-BUSSE J W. Rough set approach to incomplete data. In:LNAI 3070,2004:50~55.
[2] (加)Han Jiawei, KAMBER M. 數據挖掘概念與設計[M]. 北京:機械工業出版社,2008.
[3] LAKSHMINARAYAN K,(1999).Imputation of missing data  in industrial databases[J],Applied Intelligence 11:259-275.
[4] HUANG X L.A pseudo-nearest-neighbor approach for  missing data recovery on Gaussian random data sets[J].Pattern Recognition Letters,2002(23):1613-1622.
[5] GRZYMALA-BUSSE J W,FU M,(2000).A comparison of  several approaches to missing attribute values in data mining[C].In:Proc of the 2nd Int’Conf on Rough Sets and  Current Trends in Computing.Berlin:Springer-Verlag, 2000:378-385.
[6] ZHANG S C,QIN Y S,ZHU X F,et al.Optimized parameters for missing data imputation.PRICAI06,2006:1010-1016.
[7] 宮義山,董晨.基于貝葉斯網絡的缺失數據處理[J].沈陽工業大學學報,2010,32(1):79-83.
[8] 彭紅毅,朱思銘,蔣春福.數據挖掘中基于ICA的缺失數據值的估計[J].計算機科學,2005,32(12):203-205.
[9] HRUSCHKA E R,EBECKEN N F F.Missing values prediction with K2[J].Intelligent Data Analysis,2002,6(6):557-566.
[10] GEMAN S,GEMAN D.Stochastic relaxation,Gibbs distribution and the Bayesian restoration of images[J].IEEE Trans onPattern Analysis and Machine Intelligence, 1984(6):721.

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          亚洲一二三区在线观看| 欧美日韩中文字幕在线视频| 久久综合久久综合久久| 欧美精品一区二区精品网| 久久久国产一区二区三区| 国产精品色一区二区三区| 亚洲午夜性刺激影院| 欧美有码在线观看视频| 欧美aaaaaaaa牛牛影院| 久久视频精品在线| 欧美精品大片| 久久精品人人爽| 国产精品永久免费观看| 在线视频亚洲一区| 欧美在线免费观看视频| 男人天堂欧美日韩| 亚洲精品久久久一区二区三区| 欧美中文字幕不卡| 在线观看成人av电影| 国产日韩欧美亚洲一区| 国产日韩欧美精品一区| 亚洲国产aⅴ天堂久久| 国产伦精品一区二区三区视频黑人| 激情综合色综合久久| 国产精品理论片在线观看| 久久久久看片| 西西裸体人体做爰大胆久久久| 亚洲激情一区二区三区| 伊人精品久久久久7777| 国产日韩欧美日韩| 国产精品theporn88| 一本久久知道综合久久| 欧美日韩精品一区| 在线成人欧美| 午夜在线a亚洲v天堂网2018| 亚洲欧美综合网| 国产视频综合在线| 欧美日韩国产麻豆| 亚洲视频精选在线| 久久久精彩视频| 亚洲欧美日韩精品一区二区| 蜜臀av在线播放一区二区三区| 亚洲视屏在线播放| 一区二区三区回区在观看免费视频| 99精品欧美一区二区三区| 国产精品免费一区二区三区在线观看| 欧美激情欧美狂野欧美精品| 国产精品国产自产拍高清av王其| 亚洲福利专区| 欧美精品久久久久a| 久久婷婷丁香| 亚洲第一中文字幕在线观看| 老司机免费视频久久| 久久国产精品久久久久久| 国产欧美日韩精品专区| 激情亚洲成人| 亚洲精品久久久久久久久| 亚洲免费久久| 欧美日韩伦理在线| 国产精品一区久久久| 欧美精品粉嫩高潮一区二区| 欧美日韩在线观看视频| 国产精品人人做人人爽人人添| 国产综合欧美| 免费观看欧美在线视频的网站| 性欧美18~19sex高清播放| 国产精品porn| 亚洲美女毛片| 中文高清一区| 久久久久久夜精品精品免费| 国产精品久久久久久久久免费桃花| 久久久www成人免费无遮挡大片| 欧美午夜不卡在线观看免费| 亚洲色诱最新| 久久久精品一区二区三区| 欧美视频在线观看一区二区| 欧美成人资源| 免费影视亚洲| 精品动漫3d一区二区三区| 一区二区三区四区五区视频| 日韩一级黄色av| 久久精品视频导航| 一区二区三区国产精品| 在线观看91精品国产麻豆| 国产手机视频一区二区| 欧美电影美腿模特1979在线看| 免费看黄裸体一级大秀欧美| 亚洲欧美日韩精品一区二区| 久久精品综合一区| 亚洲人成在线观看一区二区| 亚洲天天影视| 国产人成精品一区二区三| 在线观看视频欧美| 亚洲国产中文字幕在线观看| 亚洲激情在线视频| 中文久久精品| 亚洲国产精彩中文乱码av在线播放| 欧美激情二区三区| 欧美午夜精品理论片a级按摩| 韩国视频理论视频久久| 久久久中精品2020中文| 欧美日韩一区二区国产| 欧美激情按摩| 麻豆91精品91久久久的内涵| 亚洲一级电影| 欧美日韩中文精品| 久久婷婷麻豆| 国产女人水真多18毛片18精品视频| 欧美日韩不卡| 国产精品裸体一区二区三区| 欧美一区中文字幕| 亚洲最新视频在线播放| 亚洲欧美国产va在线影院| 欧美成人综合在线| 国产精品实拍| 亚洲黄色在线视频| 欧美在线看片a免费观看| 亚洲激情影视| 夜夜嗨av一区二区三区网站四季av| 亚洲区一区二| 在线看片一区| 1000部精品久久久久久久久| 欧美中文字幕第一页| 激情av一区二区| 榴莲视频成人在线观看| 136国产福利精品导航| 国产九区一区在线| 性做久久久久久免费观看欧美| 午夜精品久久久久久久| 欧美色视频一区| 狂野欧美性猛交xxxx巴西| av不卡在线| 国产在线播放一区二区三区| 国产亚洲精品资源在线26u| 欧美日韩一区二区三区高清| 亚洲高清二区| 欧美不卡一卡二卡免费版| 久久九九免费视频| 国产精品magnet| 在线观看成人av电影| 99视频精品全国免费| 国产精品影片在线观看| 久久不射中文字幕| 亚洲精品日韩激情在线电影| 国产亚洲精品久久久久婷婷瑜伽| 欧美另类变人与禽xxxxx| 欧美一区二区三区视频免费| 99精品欧美一区二区三区| 欧美高清视频一区二区三区在线观看| 久久久国产精品一区二区三区| 欧美国产一区在线| 亚洲国产日韩欧美一区二区三区| 亚洲欧美日韩在线播放| 国产色爱av资源综合区| 欧美精品三级日韩久久| 国产精品久久婷婷六月丁香| 一区二区三区www| 欧美久久一区| 在线看日韩av| 欧美日韩国产高清| 国产在线拍偷自揄拍精品| 美女在线一区二区| 久热精品视频在线| 国产精品视屏| 国产午夜精品美女视频明星a级| 免费91麻豆精品国产自产在线观看| 欧美日韩高清在线| 久久综合婷婷| 欧美大成色www永久网站婷| 国产精品黄页免费高清在线观看| 亚洲免费av观看| 久久久xxx| 在线观看日韩av电影| 久久综合色婷婷| 久久er99精品| 欧美在线免费观看亚洲| 久久伊伊香蕉| 国产精品福利在线观看| 99精品国产福利在线观看免费| 美国十次了思思久久精品导航| 久久久久久久一区二区| 在线看成人片| 亚洲欧美一区二区三区在线| 午夜欧美大片免费观看| 性欧美超级视频| 国产精品一区二区在线| 亚洲免费高清视频| 老**午夜毛片一区二区三区| 亚洲欧美一区在线| 中文国产成人精品久久一| 一区二区三区日韩精品| 欧美日韩一区二区三区在线| 久久精品女人的天堂av| 久久久精品国产一区二区三区| 亚洲视频www| 亚洲免费综合| 黄色成人av网站| 亚洲欧洲在线视频| 欧美精品一区二区三区久久久竹菊| 午夜亚洲影视| 亚洲永久视频| 国产精品亚洲不卡a| 欧美激情国产日韩| 亚洲免费在线观看视频| 亚洲欧美日韩国产一区二区三区| 久久精品国产清高在天天线| 亚洲欧美视频一区| 这里只有精品视频| 欧美伊人精品成人久久综合97| 国产精品女人久久久久久| 欧美xxxx在线观看| 亚洲欧美国产另类| 久久电影一区| 亚洲免费观看高清完整版在线观看熊| 精品91视频| 亚洲欧洲日产国码二区| 国产一区二区在线免费观看| 日韩视频精品| 欧美不卡一卡二卡免费版| 国产一区91精品张津瑜| 国产精品video| 国产麻豆精品视频| 欧美日一区二区三区在线观看国产免| 久久激情综合网| 中文国产亚洲喷潮| 亚洲私人影吧| 欧美日韩一区二区在线播放| 国产精品视频不卡| 欧美日韩日日夜夜| 国产亚洲欧美另类中文| 欧美午夜视频网站| 午夜精品福利电影| 99精品国产热久久91蜜凸| 欧美一区二区三区啪啪| 久久久噜噜噜久久| 亚洲老司机av| 在线看欧美日韩| 亚洲视频一起| 欧美激情精品久久久久久免费印度| 国产亚洲人成网站在线观看| 噜噜噜在线观看免费视频日韩| 欧美高清视频在线观看| 激情综合激情| 欧美午夜电影一区| 国产精品老牛| 欧美激情一区二区三级高清视频| 久久婷婷蜜乳一本欲蜜臀| 欧美在线免费视频| 欧美顶级艳妇交换群宴| 国产主播一区二区三区四区| 亚洲国产导航| 亚洲在线观看| 国产精品欧美一区二区三区奶水| 一区二区三区久久精品| 久久精品99国产精品日本| 在线观看日产精品| 日韩一区二区精品| 精品动漫3d一区二区三区免费版| 久久国产精品亚洲va麻豆| 欧美日韩国产精品专区| 国产精品扒开腿做爽爽爽软件| 亚洲午夜免费福利视频| 亚洲砖区区免费| 麻豆av一区二区三区久久| 狠狠噜噜久久| 欧美与欧洲交xxxx免费观看| 韩国三级电影久久久久久| 亚洲女女女同性video| 国产精品一区二区三区四区五区| 国产日韩av高清| 美日韩丰满少妇在线观看| 国产精品免费久久久久久| 中国成人在线视频| 欧美视频在线视频| 可以看av的网站久久看| 久久xxxx精品视频| 国产丝袜美腿一区二区三区| 久久久久久一区二区| 欧美午夜久久久| 久久国产精品第一页| 一区二区三区在线看| 欧美激情综合网| 久久精品人人爽| 欧美阿v一级看视频| 久久久久久免费| 一区二区三区三区在线| 亚洲视频999| 亚洲一区二区视频| 久久九九热免费视频| 亚洲精品影视在线观看| 国产精品伦一区| 亚洲综合视频1区| 国产三区二区一区久久| 午夜精品视频一区| 亚洲欧美日韩在线播放| 久久久激情视频| 欧美理论在线播放| 久久精品视频免费观看| 亚洲免费av网站| 亚洲精品一区二区三区蜜桃久| 欧美激情亚洲国产| 在线综合欧美| 欧美激情一区二区三区不卡| 欧美精品福利在线| 欧美不卡视频| 久久精品女人天堂| 国产农村妇女毛片精品久久莱园子| 日韩午夜电影| 99精品国产在热久久婷婷| 亚洲自拍偷拍福利| 在线观看av不卡| 在线看日韩欧美| 亚洲精品国产精品国自产观看浪潮| 国产日韩欧美一二三区| 国产精品99久久久久久www| 久久久综合激的五月天| 久久久久久日产精品| 亚洲人成人一区二区在线观看| 亚洲一级特黄| 亚洲国产精品欧美一二99| 国产亚洲电影| 国产主播喷水一区二区| 国产精品99久久不卡二区| 久久久精品日韩欧美| 国产精品入口尤物| 免费h精品视频在线播放| 日韩亚洲综合在线| 欧美色视频日本高清在线观看|