《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于隱馬爾科夫模型的語義傾向性研究
基于隱馬爾科夫模型的語義傾向性研究
來源:微型機與應用2010年第17期
章棟兵,姚寒冰,顏 昕
(武漢理工大學 計算機學院,湖北 武漢 430063)
摘要: 以網絡評論為研究對象,試圖把隱馬爾科夫模型從已經成功應用的模式識別領域推廣到語義傾向性分析系統。與傳統傾向性識別系統不同的是,此理論通過建立隱馬爾科夫分類模型,將未知文本進行狀態序列化,得到文本中所有的詞語所對應的傾向性,然后選定多數詞的傾向性來作為文本的總體語義傾向。實驗表明,當訓練數據越全面、規模越大時,識別率越高。
Abstract:
Key words :

摘  要: 以網絡評論為研究對象,試圖把隱馬爾科夫模型從已經成功應用的模式識別領域推廣到語義傾向性分析系統。與傳統傾向性識別系統不同的是,此理論通過建立隱馬爾科夫分類模型,將未知文本進行狀態序列化,得到文本中所有的詞語所對應的傾向性,然后選定多數詞的傾向性來作為文本的總體語義傾向。實驗表明,當訓練數據越全面、規模越大時,識別率越高。
關鍵詞: 語義傾向性;隱馬爾科夫模型;序列化

    網絡媒體被公認為是繼報紙、廣播、電視之后的“第四媒體”,成為反映社會輿情的主要載體之一。人們希望能快速高效地在浩如煙海的網絡信息中提取對于諸如人物、事件、傳媒、產品等有價值的評價信息。如何有效地提取文本信息,推斷其語義傾向,已經成為當前自然語言與信息安全研究領域的熱點問題[1]。
    當前流行的語義傾向性分析系統可以分為兩個步驟:首先是識別詞匯的語義(短語)傾向性[2],然后利用不同的策略根據詞匯(短語)的傾向性給出整個文本的語義傾向評價。目前主要有三種研究思路:(1)對所有詞匯的傾向性評分進行統計求和,根據最終的得分正負來評價文本的傾向性[3]。(2)采用機器學習的方式根據詞匯的傾向性訓練出語義傾向分類器[4],這是目前比較流行的思路,總體效果比統計求和要好。這兩種思路是基于概率統計的,領域性限制小。(3)基于“格語法”分析的思路。該思路很難全面反應樣本空間規律,具有一定的領域限制性。
    本文利用隱馬爾科夫模型HMM(Hidden Markov Models)在文本處理方面的優勢,首先對其理論進行介紹,然后根據現有學者對HMM在文本分類中的應用和文本分類技術在傾向性分析中應用的研究結果,提出將HMM應用于文本傾向性研究的理論,并用實驗證明此理論的可行性。
1 理論基礎
1.1 隱馬爾科夫模型

    隱馬爾可夫模型[5]作為一種統計模型,非常適合處理時變信號,用于動態過程時間序列建模并具有強大的時序模式分類能力,理論上可處理任意長度的時序。HMM是一個雙重隨機過程,其中之一是Markov鏈,其基本隨機過程為描述狀態的轉移;另一個隨機過程描述狀態與觀察值之間的統計對應關系,只能看到觀察值,而不能看到狀態,即通過一個隨機過程去感知狀態的存在及其特性。
1.2 HMM在文本分類中的應用
    羅雙虎[6]把待分類文本描述成一系列狀態演化的隱Markov過程,其中狀態以特定的概率產生代表文本的特征項。用序列模式來描述文本類,文本序列通過與隱Markov模型的匹配,求出其對應狀態序列和最大輸出概率,以比較各個文本類的結果,達到文本分類的目的。
    龍麗君[7]對關鍵字所在的句子構成的詞序列建立HMM,以判斷句子所屬的類別。為了建立HMM,將詞語所屬的類別理解為狀態,將所選擇的關鍵字理解為輸出值。這樣就把要判定一個觀測序列(一個句子)的整體所屬的類別轉換為己知模型和觀測序列,求出全局最優的整體序列。觀測序列的整體所屬類別即為關鍵字所屬類別,或者說觀測序列的整體類別即為狀態序列中居多數的狀態對應的類別。
1.3 文本分類技術在傾向性分析中的應用
    1997年,Hatzivassiloglou和McKeown嘗試使用監督學習的方法對詞語進行語義傾向判別,通過對訓練語料的學習進行語義傾向判別,準確率約82%,在加入篇章中形容詞之間的接續信息后,準確率提升到約90%[2]。2003年,Turney在其論文[8]中提出了利用統計信息對單詞進行語義傾向判斷的新方法。文本的語義傾向判別也可被看作一個褒貶的分類問題,因此,文本分類中的方法同樣被應用到了語義傾向判別研究中。
2 HMM在語義傾向性研究的應用
    本文是針對網絡評論,判斷其表達的是支持(褒義)、反對(貶義)還是中立(中性)的語義傾向性。

    (4)A為狀態轉移概率矩陣,即從一種詞語類別轉移
2.2 實驗系統框架
    系統整體框架如圖1所示,整個系統分為訓練階段和識別階段。

2.2.1 語料庫準備
    訓練語料庫是國內還沒有公開的文本傾向語料庫。本實驗全部由人工收集,然后對所提取的所有的句子進行分詞、標注之后,去掉連詞、助詞和代詞等不具傾向性的無用詞,得到最終的語料庫。
    否定詞表:帶否定意義的詞,如:不、不是、非等。
2.2.2 訓練階段
    首先根據初始參數建立初始模型,然后使用Baum-Welch算法[5]對參數進行訓練,得出最終分類模型。
2.2.3 識別階段
    將未知評論文本經預處理得到字串(W1,W2,W3,…,Wn)作為上文中訓練得到的HMM分類模型的觀察序列,通過維特比(Viterbi)算法[5]得到最優狀態序列S,然后使用以下算法得出整個語句的語義傾向性,如圖2所示。

    Array<Word> W;//字串
    Array<State> S;//最優狀態序列
    Dictionary Deny;//否定詞表
    Integer Length;//字串長度,即字串中詞語的數目
    Procedure getOrientation ()
      //句子傾向性為狀態序列中具有傾向(非中立)的狀態占多數的狀態所對應的傾向
      //由于網絡評論中作者的傾向多數是在句首,取首個具有語義傾向的狀態對應的傾向為整個句子的語義傾向性
      Orientation orientation=“中性”;
      Integer numP=0;//S1(支持)的數量
      Integer numN=0;//S2(反對)的數量
      Orientation firstOrientation;//記錄句子中首個非中性的狀態
      For  i ← 0  to  Length-1  do
          If S[i]!=S3 then                
            If i>0 and W[i-1] ∈Deny then
              //此狀態不是句首且此狀態對應的觀察值是否定詞時
               //狀態類別以相反類別計數
              S[i]==S1?numN++;numP++;
          Else
              S[i]==S1?numP++;numN++;
          End If                
          If firstOrientation==NULL then
            firstOrientation =(S[i]== S1?“支持”:“反對”);
            End If
       End If
      Repeat
      If numP>numN then
        orientation=“支持”;
      Else If numP<numN then
        orientation=“反對”;
      Else
        orientation=firstOrientation;
      End If
    end getOrientation
2.3 應用舉例
    例句:“我同意你的觀點”。
    經分詞結果為:“我/r 同意/v 你/r 的/u 觀點/n”。去除無用詞得到觀察值序列為:“同意/v 觀點/n,最后經過識別得出最優狀態序列為:S1,S3。由于S1出現1次,而沒有出現S2,故這個句子的傾向性為S1的傾向類別:支持。
3 實驗結果及分析
    實驗文本是來自不同網站上下載的各種評論共2 000條,所有的評論都經過分詞、標注和去無用詞處理,然后手工分為:支持(褒義)、反對(貶義)和中立(中性)3個類別。然后在每個類別中分別取200、300、400、500條,共600、900、1 200、1 500條作為本實驗的訓練數據,進行封閉測試并對剩余的評論進行開放測試。實驗結果如表1、表2所示。

    從表中結果可以看出,封閉測試可以達到很高的識別率,可見訓練語料庫的規模將直接影響分析結果。當語料更全面、覆蓋面更廣泛時,識別率將大大提高,因此建立一個良好的訓練語料庫的識別方法將有很好的應用前景。
    本文從單個句子出發,研究其傾向性分析方法,從實驗結果數據可以看出,此方法有很好的識別率,但需面對兩個問題:(1)網絡文本的復雜性:如語句的語氣、具有傾向性的詞語所針對不同的評價對象和網絡新詞的頻繁出現等情況;(2)語料庫的整理:語料庫的完整性和準確性將直接影響分析方法的準確率,而國內還沒有公開的文本傾向語料庫。這些問題將做進一步地研究和改進。
參考文獻
[1] 來火堯,
劉功申.基于主題相關性分析的文本傾向性研究[J].信息安全與通信保密,2009(3):77-78.
[2] HATZIVASSILOGLOU V, MEKEOWN K R. Predicting the semantic orientation of adjectives[A]. In: Proceedings of the 35th Annual Meeting of the Association for Computational Liguistics and the 8th Conference of the European Chapter of the ACL, 1997:174-181.
[3] PETER T. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews[A]. In: Proceedings of the 40th Annual Meeting of the Association for Computational Liguistics, 2002.
[4] 徐琳宏,林鴻飛,楊志豪.基于語義理解的文本傾向性識別機制[J].中文信息學報,2007,21(01):98-102.
[5] 宗成慶.統計自然語言處理[M].北京:清華大學出版社,2008.
[6] 羅雙虎,歐陽為民.基于隱Markov模型的文本分類[J].計算機工程與應用,2007,43(30):179-181.
[7] 龍麗君.網絡內容監管系統中基于局部信息的語義傾向性識別算法[D].南京.南京理工大學,2004.
[8] PETER T,MICHAEL L. Measuring praise and criticism: Inference of semantic orientation from association[J]. ACM Transactions on Information Systems, 2003,21(4):315-346.

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          女仆av观看一区| 开元免费观看欧美电视剧网站| 欧美资源在线观看| 国产一级揄自揄精品视频| 午夜精品亚洲一区二区三区嫩草| 麻豆精品在线视频| 欧美体内she精视频在线观看| 亚洲精选在线观看| 国产精品乱子乱xxxx| 欧美日韩高清在线一区| 久久成人免费| 亚洲影院色在线观看免费| 欧美日产一区二区三区在线观看| 国产精品99久久久久久白浆小说| 欧美精品v日韩精品v韩国精品v| 欧美日韩一区高清| 国产精品社区| 一区二区三区自拍| 国产欧美亚洲视频| 久久精品亚洲精品国产欧美kt∨| 好男人免费精品视频| 欧美日韩一区二区三| 免费一级欧美在线大片| 欧美激情五月| 欧美日韩理论| 亚洲精品视频在线观看免费| 国产精品麻豆va在线播放| 亚洲精品之草原avav久久| 一个色综合导航| 欧美精彩视频一区二区三区| 国产精品欧美经典| 牛人盗摄一区二区三区视频| 国产一区二区丝袜高跟鞋图片| 国产精品午夜在线| 香蕉亚洲视频| 国产精品视频九色porn| 欧美精品一卡二卡| 亚洲片国产一区一级在线观看| 99精品久久| 久久裸体艺术| 一区二区久久久久久| 午夜精品久久久久久久久久久| 欧美在线free| 性久久久久久久| 在线播放亚洲| 亚洲精品国产精品国产自| 国产精品国产三级国产aⅴ9色| 欧美sm重口味系列视频在线观看| 亚洲欧美网站| 国产精品一区二区久久久久| 欧美日韩国产在线一区| 午夜精品一区二区三区在线视| 亚洲一品av免费观看| 欧美日韩成人网| 黄色在线一区| 91久久精品国产| 一本一本久久a久久精品综合麻豆| 一区视频在线看| 亚洲一区二区在线| 久久久久久综合网天天| 亚洲精品久久久一区二区三区| 亚洲欧美日韩中文在线制服| 亚洲欧美另类中文字幕| 国产精品午夜在线| 亚洲人午夜精品免费| 亚洲国产精品v| 美乳少妇欧美精品| 在线观看成人小视频| 国产一区二区日韩| 欧美日韩精品一区二区在线播放| 国产精品高潮视频| 久久综合亚州| 在线观看视频亚洲| 亚洲午夜在线观看| 在线观看中文字幕不卡| 久久疯狂做爰流白浆xx| 欧美国产成人在线| 久热综合在线亚洲精品| 久久av一区二区三区亚洲| 99国产精品视频免费观看一公开| 在线视频日韩| 欧美极品影院| 久久久久久综合| 亚洲第一福利社区| 欧美高潮视频| 欧美一区亚洲| 欧美成人激情在线| aa日韩免费精品视频一| 欧美婷婷六月丁香综合色| 国产精品日产欧美久久久久| 国产一区二区黄| 韩国v欧美v日本v亚洲v| 欧美日韩亚洲高清| 亚洲激情第一页| 午夜在线视频观看日韩17c| 欧美日韩国产影片| 香蕉av福利精品导航| 国产主播一区| 久久久久久久91| 欧美影院一区| 欧美午夜a级限制福利片| 欧美日韩中文字幕| 久久美女艺术照精彩视频福利播放| 久久综合久久综合这里只有精品| 蜜桃av一区二区三区| 最近中文字幕mv在线一区二区三区四区| 欧美视频在线观看免费| 久久久久久香蕉网| 欧美韩日一区二区| 欧美亚州一区二区三区| 一本色道久久综合亚洲精品按摩| 国产精品丝袜久久久久久app| 国产精品呻吟| 老司机免费视频久久| 免费亚洲婷婷| 亚洲精品一区中文| 亚洲欧美日韩精品久久亚洲区| 欧美不卡激情三级在线观看| 亚洲尤物视频在线| 欧美成人午夜影院| 欧美激情一区在线观看| 欧美精品一区二区三区久久久竹菊| 欧美噜噜久久久xxx| 欧美激情1区2区| 久久影院午夜论| 日韩视频在线观看一区二区| 亚洲欧美日本伦理| 欧美人与性禽动交情品| 欧美日韩精品欧美日韩精品| 亚洲欧美国内爽妇网| 国产精品免费aⅴ片在线观看| 亚洲精品视频在线| 久久久精品免费视频| 亚洲丝袜av一区| 在线观看视频一区| 国产色产综合色产在线视频| 免费不卡在线观看| 欧美一区三区二区在线观看| 老司机午夜免费精品视频| 国产精品乱码久久久久久| 午夜亚洲精品| 亚洲另类自拍| 欧美在线看片| 欧美韩日一区二区三区| 亚洲免费观看高清完整版在线观看熊| 亚洲欧美日韩国产一区二区| 国产亚洲精品久久久久久| 在线国产欧美| 欧美日韩一区在线| 亚洲影音先锋| 欧美不卡在线视频| 国产亚洲成av人在线观看导航| 国产日韩成人精品| 亚洲日本激情| 国产欧美一区二区三区视频| 欧美成在线观看| 一区二区高清在线观看| 黄色精品一区| 亚洲欧洲日产国产网站| 欧美在线免费视屏| 国产精品久久一卡二卡| 欧美女主播在线| 欧美一区二区三区四区在线| 欧美日韩精品中文字幕| 欧美一区二区三区日韩| 欧美插天视频在线播放| 国产欧美日韩精品专区| 久久婷婷久久| 欧美在线视频a| 久久夜色精品亚洲噜噜国产mv| 小黄鸭视频精品导航| 国产日产精品一区二区三区四区的观看方式| 欧美亚洲日本一区| 亚洲国产精品va在线看黑人| 亚洲天堂av在线免费观看| 国一区二区在线观看| 久久一区视频| 韩国av一区二区三区在线观看| 亚洲天堂成人在线视频| 国产一区二区三区成人欧美日韩在线观看| 亚洲综合精品一区二区| 国产精品久久久久婷婷| 国产精品中文字幕在线观看| 欧美日韩综合在线免费观看| 欧美日韩在线播放| 亚洲国产一区在线| 欧美一区二区三区在线播放| 激情懂色av一区av二区av| 久久免费少妇高潮久久精品99| 国产在线麻豆精品观看| 欧美亚洲一区| 亚洲一区二区久久| 亚洲国产一区二区三区在线播| 欧美日韩亚洲高清一区二区| 亚洲欧美激情一区二区| 99re亚洲国产精品| 欧美一区三区二区在线观看| 国产精品久久久久久久久免费樱桃| 亚洲欧美一区二区三区久久| 欧美日韩福利在线观看| 一区二区成人精品| 欧美成人亚洲成人日韩成人| 在线观看免费视频综合| 老司机亚洲精品| 欧美日韩xxxxx| 国模吧视频一区| 国产精品青草久久久久福利99| 最近中文字幕mv在线一区二区三区四区| 亚洲一区国产精品| 影音先锋久久资源网| 亚洲成人影音| 欧美视频第二页| 国产自产精品| 国产精品日韩精品欧美精品| 国产精品99久久久久久久女警| 久久九九久精品国产免费直播| 久久综合网络一区二区| 欧美日韩国产综合视频在线观看| 中文一区二区在线观看| 欧美韩日一区二区| 国产欧美va欧美不卡在线| 亚洲日本久久| 欧美一区二区日韩| 国内精品美女在线观看| 国产欧美精品一区| 欧美日韩国产在线| 精品白丝av| 国产欧美日韩中文字幕在线| 老司机久久99久久精品播放免费| 亚洲视频在线观看一区| 日韩一级视频免费观看在线| 国产一区二区三区成人欧美日韩在线观看| 国产主播一区| 久久在线播放| 久久精品视频导航| 亚洲欧洲日产国码二区| 欧美日韩亚洲视频| 午夜精品99久久免费| 欧美午夜精品久久久久久孕妇| 久久久久久穴| 影音先锋亚洲视频| 久久亚洲捆绑美女| 亚洲女人天堂av| 久久伊人精品天天| 亚洲主播在线| 在线观看日韩av电影| 9色精品在线| 亚洲欧美国产另类| 久久综合成人精品亚洲另类欧美| 欧美日韩成人在线视频| 亚洲图中文字幕| 国产主播精品在线| 免费毛片一区二区三区久久久| 亚洲人成在线影院| 一区二区三区高清在线观看| 国产精品久久久久久久久动漫| 久久免费国产精品1| 欧美成人中文字幕| 亚洲欧美日韩天堂| 亚洲黄色成人网| 亚洲最新在线视频| 久久久国产午夜精品| 一区二区三区四区五区精品| 欧美成人亚洲成人日韩成人| 欧美精品激情在线观看| 狠狠久久综合婷婷不卡| 欧美亚洲一区| 亚洲免费观看高清在线观看| 国产精品欧美久久久久无广告| 亚洲激情一区二区| 在线看成人片| 亚洲国产精品专区久久| 亚洲精品久久久久久下一站| 欧美成人一区二区| 亚洲男人av电影| 欧美3dxxxxhd| 国产美女一区| 黄色成人免费网站| 国产亚洲精品资源在线26u| 亚洲国产三级网| 亚洲在线免费观看| 亚洲尤物视频网| 国产乱码精品一区二区三区av| 香蕉成人久久| 亚洲精品资源美女情侣酒店| 久热re这里精品视频在线6| 欧美日韩大片一区二区三区| …久久精品99久久香蕉国产| 久久久久久亚洲综合影院红桃| 国产精品外国| 先锋影音国产精品| 久久激情视频免费观看| 久久亚洲欧洲| 先锋影音国产一区| 欧美日韩一区三区四区| 另类av导航| 美女尤物久久精品| 久久久午夜电影| 蜜臀91精品一区二区三区| 亚洲欧美欧美一区二区三区| 亚洲精品一区二区三区四区高清| 久久久亚洲国产天美传媒修理工| 久久日韩精品| 国产欧美一区二区精品仙草咪| 欧美精品国产一区| 麻豆九一精品爱看视频在线观看免费| 亚洲在线国产日韩欧美| 午夜精品久久久久久久白皮肤| 精品91在线| 国产精品揄拍一区二区| 亚洲午夜三级在线| 亚洲电影第三页| 欧美理论片在线观看| 欧美欧美午夜aⅴ在线观看| 欧美va天堂在线| 欧美成年人网站| 亚洲精品一二三| 在线视频欧美日韩| 亚洲伦理在线免费看| 久久这里只有精品视频首页| 亚洲福利免费| 在线观看亚洲精品| 亚洲欧洲视频在线| 国产在线播放一区二区三区| 欧美精品18+| 亚洲国产精品高清久久久| 国产一区二区毛片| 欧美日韩三区四区|