《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 一種改進的K-means聚類算法
一種改進的K-means聚類算法
來源:微型機與應用2011年第21期
周愛武,崔丹丹,肖 云
(安徽大學 計算機科學與技術學院,安徽 合肥 230039)
摘要: K-means算法是最常用的一種基于劃分的聚類算法,但該算法需要事先指定K值、隨機選擇初始聚類中心等的缺陷,從而影響了K-means聚類結果的穩定性。針對K-means算法中的初始聚類中心是隨機選擇這一缺點進行改進,利用提出的新算法確定初始聚類中心,然后進行聚類,得出最終的聚類結果。實驗證明,該改進算法比隨機選擇初始聚類中心的算法性能得到了提高,并且具有更高的準確性及穩定性。
Abstract:
Key words :

摘  要: K-means算法是最常用的一種基于劃分的聚類算法,但該算法需要事先指定K值、隨機選擇初始聚類中心等的缺陷,從而影響了K-means聚類結果的穩定性。針對K-means算法中的初始聚類中心是隨機選擇這一缺點進行改進,利用提出的新算法確定初始聚類中心,然后進行聚類,得出最終的聚類結果。實驗證明,該改進算法比隨機選擇初始聚類中心的算法性能得到了提高,并且具有更高的準確性及穩定性。
關鍵詞: 歐氏距離;K-means;優化初始聚類中心

 聚類分析[1](clustering)是數據挖掘研究的重要領域,借助聚類分析將大量的數據對象聚成不同的類簇,使不同簇之間的相似度低,簇內的相似度高,它是一種無監督的學習算法。為了實現對數據對象的聚類,人們提出了不同的聚類算法。聚類算法主要分成基于劃分、基于密度、基于分層、基于網格和基于模型的五大類[2]。K-means(均值)聚類算法是典型的基于劃分的聚類算法,同時也是應用最廣泛的一種聚類算法。K-means聚類算法[3]主要針對處理大數據集,不但處理快速簡單,而且算法具有高效性以及可伸縮性。但是K-means聚類算法存在K值需要事先指定、隨機選擇初始聚類中心等的局限性。人們針對K-means聚類算法的這些局限性提出了不同的改進算法。劉濤等人[4]提出了基于半監督學習的K-means聚類算法的研究,用粒子群算法以及迭代搜索的思想找到優質的聚類中心進行聚類;李飛等人[5]提出了基于遺傳算法的全局搜索能力來解決初始聚類中心選擇的敏感性問題。
 K-means聚類算法由于初始聚類中心是隨機選擇的,容易造成算法會陷入局部最優解甚至是無解的情況,而聚類結果的好壞直接取決于初始聚類中心的選擇。因此初始聚類中心的選擇十分重要。本文主要針對隨機選擇初始聚類中心這一缺點,提出了一種新的改進的K-means聚類算法。
1 傳統的K-means聚類算法
 K-means聚類算法是解決聚類問題的一種經典算法,該算法具有簡單、快速并且能夠有效處理大數據集的特點。K-means聚類算法首先從n個數據對象中任意選取k個對象作為初始聚類中心;而對于所剩下的其他對象,則根據它們與這些聚類中心的相似度(距離),分別將它們分配給與其最相似的類簇;然后計算該類簇中所有對象的均值;不斷重復這一過程直到標準準則函數開始收斂為止。具體步驟如下[6]:
輸入:k,data[n];輸出:k個簇的集合,滿足聚類準則函數收斂。

 

 

2.2 改進算法的思想及基本步驟
 影響K-means聚類算法性能的主要原因有:樣本集中孤立點以及隨機選擇初始聚類中心而造成聚類結果的不穩定以及不準確。針對K-means的這種不足,本文提出了一種新的思想:首先將樣本點中影響聚類結果的孤立點去除,然后利用坐標平移的思想來確定初始聚類中心,利用K-means算法進行聚類,最終得到可以滿足平方誤差準則函數收斂的聚類結果。
算法具體步驟:
 首先排除樣本點中的孤立點:
 (1)輸入樣本點,利用unique函數排除樣本點中重復的數據;
 (2)計算每個樣本點與其余樣本點之間的距離存入矩陣cid中;
 (3)指定孤立點的個數acnodenum,執行孤立點查找程序,即計算每個點與其余點的距離之和,找出距離最大的前acnodenum個點,即為孤立點;排除孤立點,將孤立點存入集合acnode中,并將這些點從原始數據集中刪除得到新的數據集datanew,即為本文算法第一次去除孤立點之后的樣本點集合。在第一次去除了孤立點之后,可以得到新的樣本點集合datanew。
其次對datanew樣本進行處理,從中找出k個初始聚類中心:
 (4)求出樣本點集合datanew中的兩兩之間的距離存入矩陣D中;
 (5)從矩陣D中找出距離最大的兩個點A和B,其最大距離記為maxinD,根據式(2)計算其中心center和半徑(r=maxinD/2);
 (6)第二次去除孤立點:求datanew中的每個樣本點與center的距離,將大于r的樣本點加入到集合acnode中并將其從datanew中去除得到第二次去除孤立點之后的樣本點datanewsec;
 (7)利用坐標平移的思想求解初始聚類中心:
?、賹⒉襟E(5)中求出的A、B中的任一點加入初始聚類中心集合nc中作為第一個初始聚類中心;
?、谘hk-1次實現以center為參照點,將A坐標順時針移動圓心角等于2×pi/k的度數;
 ③最終得到包含A在內的k個點,將這個k個點作為初始的聚類中心存入矩陣nc中;
 (8)利用步驟(7)中求得的初始的聚類中心nc,用K-means算法進行聚類得出滿足聚類準則函數收斂的聚類結果。
 (9)計算acnode中的每個點與每個初始聚類中心的距離,將acnode中的點加入到距離初始聚類中心最近的簇中。
3 實驗結果及分析
3.1 實驗數據及實驗環境

 為了便于對比分析與計算,本實驗采用的是二維數據,并且數據類型是數值型的。實驗采用了兩組測試數據:一組是隨機數據,一組是UCI數據庫中的標準數據集Iris數據集。實驗工具采用MATLAB環境編程實現。
3.2 實驗方案
3.2.1 采用隨機數據

 采用傳統的隨機選擇初始聚類中心的K-means算法將本文的改進算法對隨機產生的80個樣本進行聚類,聚類的簇數設為k=4,比較其聚類結果圖。
 傳統K-means算法隨機選取4組初始聚類中心對同一樣本集進行聚類,其聚類結果圖如圖1所示。

 第1組:(0.660 2,0.207 1)、(0.342 0,0.607 2)、(0.289 7, 0.629 9)、(0.341 2,0.370 5)。
 第2組:(0.767 6,0.274 6)、(0.261 0,0.193 1)、(0.719 7,0.827 6)、(0.315 8,0.620 6)。
 第3組:(0.580 8,0.104 6)、(0.815 8,0.400 6)、(0.211 4,0.445 7)、(0.623 2,0.807 5)。
 第4組:(0.568 1,0.846 9)、(0.781 2,0.575 2)、(0.211 4,0.445 7)、(0.628 6,0.122 5)。
 采用改進算法選出的初始聚類中心為(0.231 1,  0.956 8)、(0.999 6,0.795 7)、(0.838 5,0.027 2)和(0.070 0, 0.188 3),其聚類結果如圖2所示。

 由圖1、圖2可以看出,利用本文改進算法選出的初始聚類中心進行聚類,其聚類結果比較接近數據分布。
3.2.2 采用Iris數據集
Iris數據集是UCI數據庫中的一個標準數據集,包含有4個屬性,150個數據對象,可分為3類。選用Iris數據集 中間二維的數據進行聚類,分別用原算法和改進算法進行實驗。對實驗結果從運行時間以及準確度上進行分析,實驗結果匯總以及分析如表1所示。   
 從表1可以看出,改進算法的運行時間比傳統K-means算法的運行時間要小,尤其當數據集比較大時,其運行時間小得多。從圖3中可以看出,采用改進算法其準確度明顯提高。

 本文提出的改進算法雖然在查找孤立點以及計算樣本點之間的距離方面,會增加時間消耗,但是改進算法準確度較高,聚類效果較好。實驗證明該算法是切實可行的,與傳統的K-means算法相比較,有較好的聚類結果。
參考文獻
[1] Han Jiawei, KAMBER M. Data mining concepts and  techniques, second  edition[M]. Elsevier(Singapore)Pte Ltd,2006:251-263.
[2] 張建輝.K-means聚類算法的研究與應用[D].武漢:武漢理工大學,2007:10-14.
[3] 馮超.K-means聚類算法的研究[D].大連:大連理工大學,2007:15-19.
[4] 劉濤,尹紅健.基于半監督學習的K-均值聚類算法的研究[J].計算機應用研究,2010,27(3):913-917.
[5] 李飛,薛彬,黃亞樓.初始中心優化的K-Means聚類算法[J].計算機科學,2002,29(7):94-96.
[6] Shi Na, Liu Xumin, Guan Yong. Research on k-means clustering algorithm[C]. Third International Symposium on Intelligent Information Technology and Security Informatics, 2010:63-67.

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          国产精品成人一区二区三区吃奶| 久久久免费精品| 欧美日韩免费观看一区二区三区| 夜夜嗨av一区二区三区网页| 欧美日韩精品欧美日韩精品一| 欧美日韩伦理在线免费| 欧美在线播放一区二区| 亚洲精品色婷婷福利天堂| 在线欧美福利| 国产视频一区在线| 亚洲视频中文字幕| 国产日韩欧美高清免费| 久久久高清一区二区三区| 国产一区二三区| 激情成人综合| 国产美女精品在线| 欧美二区不卡| 99国产精品国产精品毛片| 在线播放中文一区| 久久久国产成人精品| 亚洲高清在线精品| 欧美一区视频在线| 欧美日韩视频在线一区二区| 欧美激情按摩在线| 亚洲与欧洲av电影| 国产精品美女999| 精品福利免费观看| 国产无一区二区| 一区二区三欧美| 国产精品视频男人的天堂| 狠狠爱成人网| 欧美亚洲免费| 国产在线视频不卡二| 亚洲伊人伊色伊影伊综合网| 亚洲国产精品久久精品怡红院| 国产精品盗摄一区二区三区| 国产精品日韩欧美综合| 免费看成人av| 午夜精品一区二区三区在线播放| 久久久久青草大香线综合精品| 欧美刺激性大交免费视频| 欧美激情一区在线| 久久精视频免费在线久久完整在线看| 欧美一级成年大片在线观看| 亚洲高清视频的网址| 狠狠色香婷婷久久亚洲精品| 国产亚洲成精品久久| 亚洲国产视频一区| 亚洲高清av| 国产欧美视频一区二区三区| 亚洲欧美区自拍先锋| 久久久av水蜜桃| 国产在线国偷精品产拍免费yy| 国产欧美日韩亚洲| 欧美久久婷婷综合色| 亚洲免费影视| 久久在线精品| 欧美日韩mp4| 欧美福利视频一区| 亚洲黄色有码视频| 久久综合给合久久狠狠狠97色69| 亚洲一级免费视频| 99国产精品国产精品毛片| 国产在线高清精品| 最新日韩在线视频| 欧美精品久久一区| 香蕉久久一区二区不卡无毒影院| 国产日韩精品一区观看| 欧美成人精品不卡视频在线观看| 亚洲精品欧美日韩专区| 国产精品大片免费观看| 亚洲黄网站在线观看| 国产农村妇女毛片精品久久莱园子| 欧美日韩伊人| 亚洲制服欧美中文字幕中文字幕| 日韩一级大片| 在线观看国产成人av片| 一本大道久久精品懂色aⅴ| 欧美性事免费在线观看| 亚洲一区三区电影在线观看| 一区二区三区在线视频免费观看| 国产欧美日韩激情| 欧美日韩在线直播| 91久久在线播放| 91久久精品国产| 91久久久久| 在线免费不卡视频| 欧美区视频在线观看| 欧美亚州韩日在线看免费版国语版| 欧美激情中文不卡| 国产精品一区亚洲| 国产亚洲精品美女| 99精品国产热久久91蜜凸| 欧美日韩亚洲网| 伊人色综合久久天天五月婷| 亚洲国产精品专区久久| 国产精品自在欧美一区| 亚洲午夜精品17c| 国内不卡一区二区三区| 加勒比av一区二区| 亚洲国产精品久久91精品| 一区二区三区日韩| 性色av一区二区三区红粉影视| 欧美激情aaaa| 在线成人免费观看| 在线日韩欧美| 欧美精品在线观看播放| 国产欧美日韩视频| 亚洲第一网站免费视频| 亚洲激情另类| 国产精品专区第二| 国产精品九九久久久久久久| 国产欧美精品va在线观看| 久久在精品线影院精品国产| 日韩视频永久免费| 国产麻豆综合| 制服丝袜激情欧洲亚洲| 国产精品白丝黑袜喷水久久久| 国产亚洲视频在线| 国产精品中文字幕在线观看| 欧美日韩一区二区在线播放| 美女精品国产| 国产精品少妇自拍| 亚洲精品少妇30p| 亚洲国产精品免费| 久久久亚洲成人| 亚洲国产mv| 一区二区三区欧美日韩| 在线观看成人av电影| 久久中文久久字幕| 久久成人精品电影| 欧美激情综合色综合啪啪| 欧美日韩国产一中文字不卡| 最新中文字幕一区二区三区| 欧美日韩一区二区在线视频| 亚久久调教视频| 亚洲国产精品成人综合色在线婷婷| 国产一区成人| 久久久久久夜| 欧美在线观看日本一区| 国产农村妇女毛片精品久久莱园子| 欧美三级韩国三级日本三斤| 欧美一区二区三区在线播放| 国产欧美精品在线播放| 国产精品久久久久一区二区| 久久精品夜色噜噜亚洲aⅴ| 一区二区日韩欧美| 国产美女在线精品免费观看| 久热精品在线视频| 国产自产在线视频一区| 亚洲国产另类 国产精品国产免费| 欧美激情a∨在线视频播放| 一区二区三区日韩精品视频| 1024亚洲| 欧美成人精精品一区二区频| 国产精品任我爽爆在线播放| 亚洲高清视频一区| 蜜月aⅴ免费一区二区三区| 欧美一区二区三区久久精品茉莉花| 欧美www视频在线观看| 国产欧美欧洲在线观看| 亚洲制服欧美中文字幕中文字幕| 欧美日本亚洲| 免费一级欧美片在线播放| 久久亚洲欧洲| 欧美在线免费播放| 久久久精品一品道一区| 亚洲私人影院| 欧美日韩中文字幕在线视频| 欧美精品少妇一区二区三区| 欧美视频一区二区三区在线观看| 一二三四社区欧美黄| 激情欧美一区二区三区在线观看| 亚洲日产国产精品| 国产日本欧美在线观看| 国产精品日韩久久久久| 欧美日韩成人在线播放| 国产精品一区二区三区观看| 在线欧美影院| 国产精品日本欧美一区二区三区| 国内精品久久久久久| 国产欧美日韩精品丝袜高跟鞋| 正在播放欧美一区| 一区二区欧美激情| 久久在线免费| 99精品国产高清一区二区| 欧美日韩精品一区二区三区| 亚洲性图久久| 国产三级精品三级| 国内精品美女av在线播放| 亚洲免费在线观看视频| 欧美一级二级三级蜜桃| 日韩亚洲欧美一区二区三区| 国产精品久久久久久久久久免费看| 欧美日韩成人在线| 国产精品入口麻豆原神| 欧美精品一区二区三区高清aⅴ| 99视频精品全部免费在线| 久久久精品tv| 亚洲国产高清视频| 欧美日韩精品一区二区天天拍小说| 国产亚洲欧美日韩在线一区| 免费看黄裸体一级大秀欧美| 亚洲日本视频| 欧美日韩国产系列| 欧美人妖在线观看| 欧美高清视频在线观看| 久久亚洲国产精品一区二区| 欧美波霸影院| 午夜精品在线观看| 国产日韩欧美综合在线| 久久国产精品一区二区| 欧美精品一区二区三区蜜桃| 欧美性猛交99久久久久99按摩| 欧美特黄a级高清免费大片a级| 欧美激情精品久久久久久久变态| 免费观看国产成人| 欧美午夜一区二区| 欧美日韩精品中文字幕| 国产伦精品一区二区三区视频孕妇| 午夜精品亚洲| 国产日韩欧美综合在线| 先锋影音久久| 99国产精品视频免费观看一公开| 欧美**字幕| 欧美成人午夜| 亚洲网址在线| 亚洲午夜国产一区99re久久| 欧美一区永久视频免费观看| 在线观看av一区| 久久一区视频| 亚洲三级毛片| 欧美一区二区在线免费播放| 亚洲精品欧美日韩专区| 这里只有精品在线播放| 久久国产精品久久国产精品| 亚洲一区二区三区激情| 国产视频在线观看一区二区三区| 国产午夜精品在线观看| 亚洲伦理自拍| 欧美日韩123| 开元免费观看欧美电视剧网站| 韩日精品视频一区| 亚洲日本成人网| 欧美激情一区二区三区| 欧美美女bbbb| 欧美精品性视频| 日韩一区二区电影网| 亚洲一区网站| 久久精品视频免费| 久久精品欧美日韩| 欧美精品福利视频| 99国内精品久久久久久久软件| 欧美不卡视频一区发布| 国产午夜久久久久| 亚洲欧洲视频| 国产欧美一区二区三区在线老狼| 黄色国产精品一区二区三区| 欧美一级在线播放| 噜噜噜91成人网| 亚洲国产精品va| 欧美色视频在线| 米奇777在线欧美播放| 欧美日韩一区二区免费在线观看| 欧美午夜美女看片| 亚洲一区二区成人| 亚洲欧美日韩另类精品一区二区三区| 亚洲欧美日韩成人高清在线一区| 狠狠色综合色综合网络| 欧美福利一区二区| 午夜免费日韩视频| 国产精品自拍视频| 国产女同一区二区| 欧美激情一区二区三区四区| 欧美大片va欧美在线播放| 亚洲欧美在线aaa| 亚洲中字黄色| 伊人久久婷婷色综合98网| 久久美女性网| 欧美精品在线观看播放| 在线观看亚洲| 国产欧美视频一区二区| 亚洲精品色婷婷福利天堂| 一区二区三区欧美在线观看| 午夜免费久久久久| 亚洲人成在线观看| 在线综合亚洲欧美在线视频| 国产伦精品一区二区三区视频黑人| 这里只有精品在线播放| 久久久久成人网| 亚洲精品一区二区三区福利| 国产婷婷色一区二区三区四区| 欧美性事免费在线观看| 亚洲激情在线观看视频免费| 老色鬼精品视频在线观看播放| 亚洲精品国产日韩| 欧美亚洲日本国产| 国产精品久久久久av免费| 亚洲欧洲日本mm| 日韩亚洲欧美精品| 欧美在线视频免费| 欧美剧在线免费观看网站| 免费观看一区| 欧美精品123区| 亚洲精品视频免费观看| 国产主播一区二区三区| 亚洲精品欧美极品| 亚洲高清视频在线| 亚欧成人精品| 久久精品三级| 日韩视频中文| 欧美精品国产一区二区| 亚洲精品九九| 美女视频一区免费观看| 亚洲一区二区动漫| 欧美成人午夜激情视频| 亚洲激情校园春色| 欧美大片国产精品| 欧美亚洲免费在线| 亚洲欧美激情视频在线观看一区二区三区| 国产精品麻豆欧美日韩ww| 在线精品视频一区二区| 欧美精品免费在线观看| 激情五月***国产精品| 国产亚洲视频在线观看| 午夜精品一区二区三区在线| 国产亚洲福利社区一区| 欧美精品在线观看91|