《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于改進平衡Winnow算法的短信過濾系統
基于改進平衡Winnow算法的短信過濾系統
來源:微型機與應用2010年第19期
閆紅靜1,邸書靈2
(1.石家莊鐵道大學 研究生學院,河北 石家莊 050043;2.石家莊鐵道大學 信息科學與技術學院
摘要: 將黑白名單技術與Balanced Winnow算法相結合,實現對垃圾短信的過濾。采用CHI特征提取算法并對權重計算方法進行改進,同時提出了去除訓練樣本中野點的想法,通過判定去除野點,減緩在訓練過程中出現的抖動現象。實驗表明這種改進對于提高訓練速度及提高短信過濾的性能均有很好的作用。
Abstract:
Key words :

摘  要: 將黑白名單技術與chinaaet.com/search/?q=Balanced Winnow" title="Balanced Winnow">Balanced Winnow算法相結合,實現對垃圾短信的過濾。采用CHI特征提取算法并對權重計算方法進行改進,同時提出了去除訓練樣本中野點的想法,通過判定去除野點,減緩在訓練過程中出現的抖動現象。實驗表明這種改進對于提高訓練速度及提高短信過濾的性能均有很好的作用。
關鍵詞: balanced Winnow;短信過濾;CHI;野點

    手機短信以其短小、迅速、簡便、價格低廉等優點成為一種重要的通信和交流方式,受到眾多人士的青睞。然而,手機短信與郵件一樣存在著垃圾信息問題。
 目前,垃圾短信過濾主要有黑名單過濾、關鍵詞過濾和基于文本分類的內容過濾等方式。黑名單過濾和關鍵詞過濾方式能快速過濾垃圾短信,但這兩種過濾方式實質是基于規則的過濾,雖然在一定程度上阻擋了一些垃圾短信,但規則的方法需要更多的用戶自定義設置,很容易被反過濾?;谖谋痉诸惖亩绦胚^濾采用常見的分類算法,如樸素貝葉斯、SVM、神經網絡等。黎路[1]等人將貝葉斯分類應用到J2ME模擬環境中成功地過濾了中獎短信和祝福短信。浙江大學的金展、范晶等[2]將樸素貝葉斯和支持向量機結合,解決了傳統垃圾短信過濾系統短信特征和內容未能得到及時更新而導致過濾性能降低的問題。王忠軍[3]將基于樸素貝葉斯短信過濾算法與基于最小風險貝葉斯算法進行了實驗分析和比較,結論是基于最小風險的短信過濾算法具有較好的性能。然而,短信過濾的準確率依賴于其訓練樣本的數量及質量,這些分類算法需要經過訓練學習建立分類器模型,因此在速度上不能很好地滿足短信過濾實時性的要求。從現有技術上來說,垃圾短信的過濾在準確率和效率方面仍然不能滿足現實需要。
 本文針對現有短信過濾技術的不足,設計了在手機終端的短信過濾系統,根據垃圾短信的特點將黑白名單和基于內容過濾相結合。這種過濾方式要求能夠快速地對短信進行分類,并且能夠實現用戶對短信過濾的個性化要求,使垃圾短信過濾系統具有更好的過濾性能。
 Winnow算法是在1987年由Nick Littlestone提出并對可行性做了嚴格證明的線性分類算法[4]。當時的目標是想找到一種時空復雜度僅僅與分類對象相關屬性相關的數量呈線性相關的算法。平衡Winnow算法是對基本Winnow算法的一種改進,該算法具有過濾速度快、性能好、支持反饋更新的優點,在信息過濾領域有很好的應用前景,尤其適合于對實時性要求較高的短信過濾系統。
 本文設計并實現了一個基于平衡Winnow算法的短信內容過濾系統,對該算法在短信過濾系統上的應用進行了詳細分析。分類器的訓練過程分成預處理、訓練、分類和反饋四個部分。
1 預處理模塊
 預處理模塊包括中文分詞、特征提取以及短信的向量表示子模塊。
1.1 中文分詞
 中文分詞是漢語所特有的研究課題。英語、法語等印歐語種詞與詞之間存在著自然的分割,一般不存在分詞的問題。本系統采用了目前國內較多使用的中科院計算所開發的漢語詞法分析系統ICTCLAS[5](Institute of Computing Technology,Chinese Lexical Analysis System)。ICTCLAS 3.0分詞速度單機996 Kb/s,分詞精度98.45%,API不超過200 KB,各種詞典數據壓縮后不到3 MB,是當前相對較好的漢語詞法分析器。

2 構造分類器
    訓練分類器是研究的重點,采用Balanced Winnow算法并對其進行改進。
2.1 Winnow分類算法
     Winnow算法是二值屬性數據集上的線性分類算

    在平衡Winnow算法中,一旦參數α、β和閾值θ確定下來后,將在訓練過程中不斷更新權重向量w+和w-至最適合這組參數。因此對參數的依賴較小,需要手工調整的參數不多。
2.3 去除野點
    在短信過濾中,短信樣本是由手動或自動方式收集的,收集的過程中難免會出錯,因此短信樣本集中可能存在一些被人為錯分的樣本點,即野點。這些野點在訓練時,會使得分類器產生嚴重的抖動現象,降低分類器的性能。因此,好的分類器應具有識別野點的能力[11]。
    對于Winnow算法,若樣本中存在野點,則野點在訓練時以較大的概率出現在兩分類線之外,且分類錯誤。這些野點對分類器的訓練過程產生很大的影響,可能會造成分類器的“過度學習”。因此引入損失函數,按照損失函數的定義,這些野點損失較大,因此可以通過給損失函數設置一個上界函數來處理線性分類器中的野點問題,如圖1所示。

    圖1所示為兩類線性可分情況,圖中實心點和空心點分別表示兩類訓練樣本,H為兩類樣本沒有被錯誤地分開的分類線,H1和H2分別為平行于分類線H且與分類線H的距離為單位距離的兩條直線。直線G(t)為平衡Winnow算法中第t輪迭代后損失函數的上界線。該上界線是關于迭代次數t的函數,因此可以將該上界線G(t)對應的上界函數記為g(t)。從圖1可知,在直線G(t)左下側誤分樣本的損失較少,可以認為這些誤分樣本是由于當前分類器的性能較低而誤分的;在直線G(t)右上側誤分的樣本由于在第t輪迭代后損失仍較大,則可以認為這些誤分的樣本是野點。根據線性分類器和野點的性質可知,上界函數g(t)具有以下性質:
    (1)隨著Winnow算法中迭代次數t的增加,上界函數g(t)單調遞減,并且遞減的速率也隨著t的增加而遞減,即上界函數的導數g(t)為單調遞減函數;

    在每一輪訓練中,若該樣本的G(t)值大于分類線的值,并且超過一定的閾值,且不屬于該類,則判定該樣本具有野點的性質,應當在訓練集中將該樣本去除,以便提高下一輪訓練的準確性。這樣不僅有效削弱了分類器的抖動現象,而且提高了分類器的性能。
3 系統反饋
    Winnow是一種在線學習的、以錯誤為驅動的分類器,適于結合增量式學習來解決自適應問題,實現用戶的個性化要求。平衡Winnow算法是基本Winnow算法的另外一種形式,同樣具有在線更新能力。在分類器訓練過程中,對錯分的短信通過α和β更新類別權重向量,實現對分類器的更新,平衡Winnow算法中w+和w-的雙向調節,使算法的訓練速度更快,適合于對分類實時性要求較高的短信過濾系統。
4 實驗資源及分析與評價
    本文在自建短信語料庫的基礎上完成對比實驗,其中正常短信1 892條,垃圾短信270條,將短信語料庫隨機分成5等份,其中4份用于訓練樣本,1份作為測試樣本。
4.1 評價指標
    分類系統評價指標如下,包括兩類短信各自的準確率(precision)和召回率(recall),由于系統目標是垃圾短信過濾,于是增加了針對垃圾短信的綜合評價指標(F1):F1=(2×準確率×召回率)/(準確率+召回率)。
4.2 實驗結果分析
   (1)實驗1:探討改進的特征權重計算方法對實驗結果的影響。實驗結果如表1所示。

 其中測試樣本中正常短信被誤分為垃圾短信條數為22條,正常短信召回率為94.2%;垃圾短信被誤分為正常短信8條,準確率僅為67.7%。

 其中測試樣本中正常短信被誤分為垃圾短信條數為18條,正常短信召回率為96.1%;而測試用的垃圾短信正確識別了44條,準確率為71.0%。由此可見,參數對實驗結果的影響不大。
    (3)實驗3:去除野點對實驗結果的影響。實驗結果如表3所示。


    從實驗結果分析,僅有12條正常短信和8條垃圾短信被錯誤分類。通過去除野點,發現不僅緩減了抖動現象,而且提高了分類器的分類性能及正常短信的召回率。
    Balanced Winnow在訓練速度和分類速度上具有較大優勢,所以具有更高的實用價值,非常適合短信過濾的要求。另外,Winnow作為一種在線學習方法,在訓練集合不斷擴大的情況下能夠快速對分類器進行更新。正是基于Winnow不斷學習、不斷調整的機制,使其非常適合用戶自己定制需要的分類標準。隨著用戶不斷地反饋調整,整個系統會表現出越來越好的效果。
參考文獻
[1] 黎路,秦衛平.淺析貝葉斯分類方法在手機垃圾短信過濾系統中的應用[J].科技廣場,2007(7):76-78.
[2] 金展,范晶.基于樸素貝葉斯和支持向量機的自適應垃圾短信過濾系[J].計算機應用,2008,28(3):714-718.
[3] 王忠軍.文本分類在短信過濾中的應用[D].遼寧:大連理工大學,2006.
[4] LITTLESTONE N. Learning quickly when irrelevant attributes abound: a new linear threshold algorithm. Machine Learning, 1988(2):285-318.
[5] YANG YI MING, PEDERSEN JAN. A comparative study on feature selection in text categorization proceedings of the 14th international conference on machine learning[C]. Nashville: Morgan Kaufmann, 1997:412-420.
[6] 周志軍.中文郵件分類系統的研究及其實現[D].蘇州:蘇州大學,2005.
[7] 潘文峰,王斌.Winnow算法在垃圾郵件過濾中的應用[C].第一屆全國信息檢索與內容安全學術會議論文集,上海,2004.

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          国产欧美欧洲在线观看| 欧美视频中文字幕在线| 国产一区二区三区四区| 欧美不卡视频一区| 在线视频国内自拍亚洲视频| 午夜精品久久99蜜桃的功能介绍| 日韩天天综合| 欧美日韩午夜在线视频| 欧美日韩国产页| 老司机一区二区| 久久久久久久综合色一本| 亚洲在线视频免费观看| 国内精品模特av私拍在线观看| 久久久久久91香蕉国产| 欧美激情一级片一区二区| 亚洲精选视频在线| 国产亚洲精品bt天堂精选| 日韩午夜免费视频| 国产在线国偷精品产拍免费yy| 免费久久99精品国产| 久久久久成人精品免费播放动漫| 欧美成人四级电影| 亚洲品质自拍| 99国产精品久久久久老师| 噜噜噜久久亚洲精品国产品小说| 国产精品国产三级国产普通话蜜臀| 亚洲国产视频一区二区| 欧美色欧美亚洲另类七区| 国产精品久久久久久福利一牛影视| 欧美精品在线播放| 欧美一区二区在线免费观看| 榴莲视频成人在线观看| 欧美激情1区2区| 亚洲免费在线观看视频| 欧美日韩精品免费观看视一区二区| 欧美大片免费| 浪潮色综合久久天堂| 一区精品在线| 亚洲欧美一级二级三级| 亚洲综合日韩在线| 欧美一区日本一区韩国一区| 亚洲国产精品欧美一二99| 国内揄拍国内精品少妇国语| 91久久国产自产拍夜夜嗨| 一本久久知道综合久久| 亚洲女同在线| 国内精品国语自产拍在线观看| 亚洲精品一区二区三区樱花| 国产日韩欧美精品在线| 久久亚洲私人国产精品va媚药| 久久午夜影视| 欧美日韩国产一区二区| 欧美在线不卡| 欧美日韩精品免费在线观看视频| 欧美人在线观看| 欧美电影打屁股sp| 国产精品免费观看视频| 久久久久免费视频| 在线播放中文一区| 久久一区二区三区国产精品| 裸体丰满少妇做受久久99精品| 国产一区免费视频| 欧美国产日韩免费| 久久精品男女| 亚洲欧美国产视频| 先锋影音国产精品| 久久久久成人精品免费播放动漫| 99国产一区| 国产一区二区三区不卡在线观看| 国产精品扒开腿做爽爽爽视频| 欧美日本在线一区| 国产一区欧美日韩| 国产精品最新自拍| 欧美在线视频观看免费网站| 国产精品久久久亚洲一区| 免费成人在线视频网站| 久久国产精品一区二区三区四区| 国产日产欧美a一级在线| 亚洲欧美99| 亚洲免费av观看| 亚洲精品国产精品国自产观看浪潮| 亚洲日本中文字幕| 1024精品一区二区三区| 欧美一区视频在线| 免费试看一区| 国产一区二区三区黄| 欧美日韩日本视频| 亚洲影视在线| 欧美网站在线观看| 亚洲肉体裸体xxxx137| 亚洲美女视频在线观看| 国产精品麻豆成人av电影艾秋| 亚洲欧美区自拍先锋| 午夜日韩电影| 欧美大片免费| 国产视频一区二区三区在线观看| 亚洲精品国久久99热| 欧美一级片久久久久久久| 亚洲一区亚洲二区| 欧美体内谢she精2性欧美| 久久精品成人一区二区三区蜜臀| 99精品国产一区二区青青牛奶| 国产精品国产三级国产普通话三级| 亚洲字幕一区二区| 国产欧美1区2区3区| 亚洲一区二区三区视频| 国产精品久久夜| 亚洲图片欧洲图片日韩av| 激情综合视频| 国产精品久久777777毛茸茸| 国产精品二区影院| 在线成人欧美| 亚洲一区精品电影| 国产精品看片你懂得| 久久久欧美精品sm网站| 久久综合成人精品亚洲另类欧美| 久久久久91| 久久亚洲午夜电影| 亚洲免费成人| 亚洲欧美美女| 狠狠色狠狠色综合系列| 欧美一级在线播放| 亚洲精品美女在线观看播放| 欧美大片在线观看| 欧美aⅴ99久久黑人专区| 国内精品久久久久久影视8| 亚洲精品免费在线| 欧美成人中文字幕在线| 免费久久99精品国产自| 亚洲精品一区二区三区蜜桃久| 国产一区二区主播在线| 性欧美激情精品| 一区二区三区四区精品| 精品1区2区| 国产一区二区剧情av在线| 国产伊人精品| 亚洲狠狠丁香婷婷综合久久久| 美女视频网站黄色亚洲| 亚洲免费在线看| 99riav久久精品riav| 欧美日韩日日夜夜| 欧美在线视频a| 午夜国产欧美理论在线播放| 狠狠v欧美v日韩v亚洲ⅴ| 亚洲国产成人精品久久| 亚洲国产天堂网精品网站| 欧美日韩少妇| 女生裸体视频一区二区三区| 亚洲黄色免费| 欧美亚洲日本一区| 国产精品久久久久久久电影| 性欧美暴力猛交69hd| 欧美日韩免费视频| 国产女人精品视频| 香蕉国产精品偷在线观看不卡| 免费成人网www| 午夜精品一区二区三区在线| 国产精品呻吟| 国产精品久久久久7777婷婷| 国产真实乱偷精品视频免| 久久激情一区| 欧美另类极品videosbest最新版本| 男人的天堂亚洲| 亚洲精品一品区二品区三品区| 国产精品久久久久婷婷| 欧美精彩视频一区二区三区| 欧美日韩国产综合网| 久久午夜激情| 先锋影院在线亚洲| 国产精品一区2区| 精品成人a区在线观看| 亚洲一区二区三区精品在线观看| 午夜欧美精品| 国产精品最新自拍| 91久久线看在观草草青青| 日韩视频免费在线观看| 亚洲手机成人高清视频| 亚洲美女在线看| 久久久久综合一区二区三区| 午夜精品久久久久久久久久久| 欧美在线视频一区二区三区| 亚洲精品欧美日韩专区| 亚洲欧美春色| 中文日韩在线| 9i看片成人免费高清| 亚洲愉拍自拍另类高清精品| 久久一区二区三区四区五区| 欧美国产日韩精品| 国产精品一区二区三区免费观看| 国产综合欧美在线看| 国产伦精品一区二区三区| 亚洲香蕉网站| 亚洲国产天堂久久综合| 妖精成人www高清在线观看| 久久久精品国产免费观看同学| 久久久久成人精品免费播放动漫| 亚洲中字在线| 亚洲日韩欧美一区二区在线| 亚洲国产一区二区视频| 国产精品分类| 欧美日韩国产首页在线观看| 黄色一区二区三区| 久久蜜桃av一区精品变态类天堂| 国产午夜精品视频免费不卡69堂| 国产精品试看| 欧美精品免费视频| 国产精品99久久久久久有的能看| 国产精品综合色区在线观看| 欧美亚日韩国产aⅴ精品中极品| 亚洲一区二区精品| 久久国产夜色精品鲁鲁99| 亚洲福利视频一区二区| 在线天堂一区av电影| 久久婷婷麻豆| 亚洲另类自拍| 欧美国产综合| 欧美xart系列在线观看| 欧美一区在线看| 蜜桃av综合| 午夜精品福利一区二区蜜股av| 国产精品久久久久久久久果冻传媒| 99re热这里只有精品免费视频| avtt综合网| 亚洲电影视频在线| 亚洲一区二区三区在线| 亚洲欧美在线播放| 亚洲高清精品中出| 日韩特黄影片| 国产女主播在线一区二区| 久久精品成人一区二区三区| 狠狠狠色丁香婷婷综合激情| 久久男女视频| 欧美日韩在线播放三区四区| 亚洲无限乱码一二三四麻| 日韩亚洲国产精品| 久久久免费精品| 久久精品国产视频| 欧美成人中文字幕在线| 久久久久网站| 国产精品日日摸夜夜摸av| 日韩视频一区二区在线观看| 亚洲欧美激情在线视频| 欧美在线观看一二区| 午夜国产精品视频免费体验区| 亚洲精品123区| 在线成人激情黄色| 久久乐国产精品| 亚洲精品乱码久久久久久蜜桃91| 亚洲人成欧美中文字幕| 欧美午夜精品一区二区三区| 国产精品无码专区在线观看| 亚洲韩国一区二区三区| 久久伊人亚洲| 欧美成年人视频| 欧美电影专区| 91久久精品日日躁夜夜躁欧美| 亚洲三级免费| 国产精品亚洲一区二区三区在线| 欧美激情黄色片| 一本久道久久综合婷婷鲸鱼| 欧美视频中文字幕在线| 老牛嫩草一区二区三区日本| 久久不射中文字幕| 嫩草影视亚洲| 国产一区二区你懂的| 尤物在线观看一区| 精品动漫3d一区二区三区| 国内精品久久久久影院 日本资源| 狠狠狠色丁香婷婷综合激情| 亚洲深夜影院| 国产精品卡一卡二| 欧美区二区三区| 日韩午夜视频在线观看| 欧美性猛交xxxx乱大交退制版| 国产精品乱码妇女bbbb| 国产精品激情偷乱一区二区∴| 免费不卡亚洲欧美| 亚洲精品美女久久久久| 国产精品av久久久久久麻豆网| 欧美久久久久免费| 欧美日韩福利在线观看| 欧美人在线观看| 国产女主播一区二区| 国产精品久久久久一区二区三区共| 91久久在线播放| 国产精品观看| 欧美激情精品久久久久久变态| 亚洲国产日韩一区| 欧美专区18| 精品va天堂亚洲国产| 欧美在线一二三四区| 欧美电影免费观看| 亚洲国产91精品在线观看| 国产亚洲人成网站在线观看| 国产噜噜噜噜噜久久久久久久久| 亚洲精品123区| 国产精品看片资源| 狠狠色综合播放一区二区| 欧美高清视频在线| 欧美一级视频免费在线观看| 99香蕉国产精品偷在线观看| 欧美精品日韩www.p站| 国产色产综合色产在线视频| 国产精品99久久不卡二区| 亚洲精品日韩在线| 亚洲一区二区三区四区五区午夜| 久久国产精彩视频| 欧美午夜电影完整版| 国产一区二区精品久久99| 久久精品成人一区二区三区蜜臀| 99国产一区二区三精品乱码| 亚洲午夜日本在线观看| 亚洲免费视频观看| 久久久久久有精品国产| 欧美日韩黄色一区二区| 欧美日韩综合在线| 亚洲日本aⅴ片在线观看香蕉| 在线精品国产成人综合| 亚洲精品免费一二三区| 亚洲成人自拍视频| 亚洲国产成人av好男人在线观看| 在线日韩成人| 国产精品高清一区二区三区| 国产精品影视天天线| 国产精品久久久久一区二区| 亚洲最新色图| 国产亚洲欧美色| 亚洲国产裸拍裸体视频在线观看乱了中文|