《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 文本挖掘中主客觀因素影響性的眼追蹤研究
文本挖掘中主客觀因素影響性的眼追蹤研究
2017年微型機與應用第3期
郭楠
同濟大學 電子與信息工程學院,上海 201800
摘要: 基于文本主題模型與眼動儀技術,從主題挖掘的客觀角度與閱讀興趣的主觀角度研究文本內容提取技術。傳統文本挖掘多基于文本本身內容等客觀因素,而主觀取向的重要因素很少在文本挖掘中發揮作用。文章利用眼部追蹤技術,先將眼動數據轉換為閱讀興趣等主觀結果形式,并利用LDA(Latent Dirichlet Allocation)模型對文本進行客觀主題提取,繼而對眼部數據與主題建模結果進行比較,提取分析主客觀因素對文本挖掘的影響。新聞數據集的眼部追蹤實驗與主題提取實驗顯示了主客觀因素對結果影響的具體差異性與相似性,未來兩者結合并調控比率可作為對文本挖掘效果提升的基本方向。
Abstract:
Key words :

  郭楠

  (同濟大學 電子與信息工程學院,上海 201800)

       摘要:基于文本主題模型與眼動儀技術,從主題挖掘的客觀角度與閱讀興趣的主觀角度研究文本內容提取技術。傳統文本挖掘多基于文本本身內容等客觀因素,而主觀取向的重要因素很少在文本挖掘中發揮作用。文章利用眼部追蹤技術,先將眼動數據轉換為閱讀興趣等主觀結果形式,并利用LDA(Latent Dirichlet Allocation)模型對文本進行客觀主題提取,繼而對眼部數據與主題建模結果進行比較,提取分析主客觀因素對文本挖掘的影響。新聞數據集的眼部追蹤實驗與主題提取實驗顯示了主客觀因素對結果影響的具體差異性與相似性,未來兩者結合并調控比率可作為對文本挖掘效果提升的基本方向。

  關鍵詞文本主題建模;眼部追蹤技術;文本挖掘;主題模型

  中圖分類號:TP391文獻標識碼:ADOI: 10.19358/j.issn.1674-7720.2017.03.023

  引用格式:郭楠.文本挖掘中主客觀因素影響性的眼追蹤研究[J].微型機與應用,2017,36(3):79-81.

0引言

  文本主題建模以LDA(Latent Dirichlet Allocation)模型[1]為代表,是近年來文本挖掘領域的一個熱門研究方向。主題模型挖掘出的主題可以幫助理解文本背后隱藏的語義,也可以作為其他文本挖掘方法的輸入,完成文本分類、話題檢測等多方面的文本挖掘任務。然而近年來,主題建模模型的代表LDA模型的改進與擴展研究正面臨方法上的瓶頸,層出不窮的模型改進算法多使用參數上調整、建模層數優化等基本方法[2],這些改進對于主題模型的效率、效果提高程度有限;另一方面,主題挖掘研究集中于研究文本本身內容等客觀因素,而人類主觀取向因素很少在文本挖掘方面發揮重要作用,事實上,閱讀興趣等主觀因素對于文本挖掘有非常重要的參考價值,對主題模型本身也有極大的意義[3]。

  因此針對文本挖掘、主題建模領域的相關研究,希望解決的相關問題就是,如何能夠在現有的主題建模模型基礎上,不僅對于不同內容領域的文本本身的客觀因素能夠統一進行分析挖掘,并且同時考慮人主觀閱讀規律、興趣取向因素的影響性,使得文本中所抽取的信息與知識更有價值、更有意義。

  眼動儀技術可以獲得視覺信息提取過程中的生理和行為表現,它與人的心理活動有著直接或間接的關系,能夠為主題提取與文本挖掘提供人主觀興趣取向信息[4]。本文通過對眼動儀捕獲的用戶文本閱讀數據的分析和對主題提取模型LDA的研究,比較分析主觀眼動數據結果與主題模型的挖掘結果,從主觀規律和客觀模式兩方面對文本挖掘效果進行結果分析,對于推動未來文本挖掘領域建模與應用方法的進步,提高文本挖掘模型效果,具有一定的參考意義和應用價值。

1文本主題提取算法

  1.1LDA模型

  LDA模型以一種“詞袋”假設,把每個文檔當作組成文檔的詞匯分布的向量,這樣,文檔由多個主題的概率分布所代表,而主題則由單詞的概率分布所刻畫。

  它對于每個文檔的主題生成過程如下:如圖1所示的概率模型,矩形代表重復的過程,外部矩形代表一個文檔,內部矩形則代表對于每個詞語選擇主題的重復過程,重復次數為文檔內詞語的個數。α和β代表語料庫級的參數,每進行一次語料庫的生成都要進行采樣化。θ則是文檔級參數,每取一個文檔則進行一次采樣化,z和w則為詞語級參數,對每一個文檔的每一個詞都進行一次采樣化。

  

001.jpg

  1.2文本主題提取過程

  每一個文件集合M在T主題上服從多項式分布,系數為θ。如果每個主題對于組成的詞語而言都服從多項式分布,參數記為φ。θ和φ服從Dirichlet分布,超參分別為α與β,每一個文檔d中的詞語,話題z是以多項分布θ為參數從文檔中進行采樣的,詞語w則是以多項分布φ為參數從話題z中進行采樣。這個生成過程重復次數為N,是文檔d中詞語的總個數,形成文件D。

  因此,利用該模型,有兩個參數需要從數據中推斷,即文檔的主題分布θ和主題的詞語分布φ,推斷的方式是采用Gibbs抽樣的方式來進行模型的參數估計。θ與φ參數則可分別代表用戶文章中主題的分布情況,以及能夠刻畫該主題的詞語的分布情況。

  通過LDA模型的應用,輸入的文檔級數據可以轉化為主題分布的形式,主題數目由事先設定好的參數N來確定,最終以用戶感興趣的程度(主題分布中所占比率大?。┤∏癗個主題輸出,以主題級數據刻畫文檔。而每個主題由組成的詞語的分布表示,詞語同樣也對應于分布中所占比率的參數。因此,可以通過LDA獲得用戶文檔中所描述的多個主題內容,并且抽取出描述該主題的詞語。

2基于眼動儀的閱讀興趣提取方法

  通過眼動儀捕獲的實驗對象閱讀文本的視覺追蹤數據,其結果形式體現在用戶閱讀文本的軌跡和看每個詞語的集中時間長度,圖像化結果如圖2所示,其中圓圈直徑代表對該詞語(位置)眼球集中時間長短,時間越長,直徑越大;直線代表眼球運動軌跡?!?/p>

002.jpg

  而眼動儀的非直觀性數據形式,則以觀察文本時間內每個捕獲視覺點的坐標和對應時間點的形式給出。如:(x,y),t: 0908。因此對這類數據進行形式轉換處理,最終轉換結果應為詞語及對應集中時間。

  2.1詞語區域統計

  眼動儀實驗使用統一的圖片形式,即txt格式文本轉化為包括首行縮進、行距等文本分布形式均相同的圖片格式。根據一致的分布形式,統計每篇文章每個詞語所占區域的坐標范圍(x0x1y0 y1)。如式(1)~(4)所示。

  Y$805OHH9C[)XB`3$3%3ON3.png

  其中,d0、D0為每行和每列第一個字符的初始x、y坐標值;wi、Wi分別為水平與垂直方向的第i個詞的詞長和詞與詞間距長的和;K0、Q0分別為水平和垂直方向詞與詞間距長。

  2.2詞語集中時間計數

  根據每個詞語的坐標區域劃分情況,對眼動數據結果文件中的坐標與對應時間點數據進行統計,落在某個詞語坐標區域內的坐標對應的該詞語的集中時間計數加一。全部觀察時間范圍內所有坐標與時間點均可通過轉換關系,轉為詞語和詞語集中時間的結果形式,即實驗對象閱讀文本通過眼動儀所捕獲到的集中度和興趣規律。

  通過對每個詞語集中時間的計數,可以得到實驗對象對該文本中所有觀察詞語的集中時間排序結果。

3實驗結果

  數據集采用BBC news的20篇文章,實驗對象為20名,每名實驗對象分別閱讀20篇新聞文章,并通過SMI眼動儀進行眼部數據跟蹤并捕獲。文本主題建模算法應用于同樣數據集中。如圖3所示為眼動數據實驗詞語的計數分布結果(橫軸代表各個詞語,具體內容略);圖4所示為對于每個詞語,所有實驗對象的均值與方差變化圖,可見方差基本穩定在0.1左右。

  

003.jpg

  對LDA模型主題提取結果排序后與眼動數據結果排序后進行比較分析,每篇文章中同一詞語的計數值比較如圖5。而圖6顯示了具體主客觀文本挖掘方法的差異性和相似性。均值的重合度以排序前30個詞語為例,基本維持在0.6左右。分析比較結果,此例中,LDA模型對文本內容的客觀性提取有0.6的比率與人主觀興趣取向一致,而0.4比率是基于詞語頻率等內容因素的偏向客觀性的主題內容。

  根據實驗數據結果可以看出,文本主題模型對于文本的提取結果與人的興趣行為取向存在一致性和差異性,而

  

  通過調控主題提取結果所取的詞語比率,結合眼動數據結果中興趣部分的詞語比率,二者結合可同時反映主題內容和閱讀興趣這兩種文本挖掘因素,對于實際文本分類、文檔摘要等文本挖掘應用效果會有很大提升。

4結論

  本文通過LDA模型進行文檔的客觀性主題抽象,利用眼動儀提取主觀興趣取向因素結果。在News數據集上的比較分析實驗顯示了主觀因素和客觀結果對文本挖掘的具體不同影響,可以為未來主客觀因素相結合的文本挖掘算法提供一定參考與應用價值。

  參考文獻

  [1] BLEI D M, NG A Y,JORDAN M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003(3):993-1022.

  [2] DU L, BUNTINE W, JIN H. Modelling sequential text with an adaptive topic model[C]. Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, 2012:535-545.

 ?。?] MICHELSON M, MACSKASSY S A. Discovering users’ topics of interest on twitter: a first look[C]. Proceedings of the Fourth Workshop on Analytics for Noisy Unstructured Text Data,2010:73-80.

  [4] DUCHOWSKI A T. Eye tracking methodology: theory and practice[M]. SpringerVerlag:2003.


此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          亚洲一区二区三区高清| 欧美激情精品久久久久久变态| 一本色道久久综合狠狠躁的推荐| 久久婷婷国产综合精品青草| 欧美aaa级| 欧美精品在线观看播放| 亚洲国产日韩欧美| 亚洲一区二区免费| 国产欧美二区| 久久精品水蜜桃av综合天堂| 国产精品一区久久久| 久久精品人人做人人爽| 国产乱肥老妇国产一区二| 亚洲欧美成人一区二区在线电影| 亚洲欧美日韩在线观看a三区| 国产精品日韩一区二区| 亚洲一区在线观看视频| 午夜精品免费| 欧美色视频日本高清在线观看| 欧美超级免费视 在线| 亚洲视频每日更新| 欧美久久精品午夜青青大伊人| 欧美日韩一区成人| 久久爱另类一区二区小说| 久久天天躁夜夜躁狠狠躁2022| 欧美在线三级| 在线观看福利一区| 亚洲国产女人aaa毛片在线| 久久在线播放| 国产欧美一区二区三区在线老狼| 亚洲激情一区二区| 亚洲美女视频| 亚洲精品护士| 亚洲一级在线| 久久精品在线| 欧美精品成人一区二区在线观看| 亚洲区欧美区| 欧美大片在线观看| 久久成人18免费网站| 裸体素人女欧美日韩| 国产精品99久久不卡二区| 久久久久久久一区二区| 狠狠色狠色综合曰曰| 久久国产精品免费一区| 国产一区二区三区的电影| 加勒比av一区二区| 欧美国产欧美亚洲国产日韩mv天天看完整| 欧美国产丝袜视频| 黄色精品网站| 国产日韩在线亚洲字幕中文| 欧美另类一区| 亚洲黄一区二区| 国产精品都在这里| 一本色道久久综合精品竹菊| 欧美日韩精品免费在线观看视频| 亚洲欧美一区二区三区在线| 欧美日韩国产综合视频在线| 欧美性开放视频| 黑人巨大精品欧美一区二区小视频| 久久这里只精品最新地址| 欧美日韩91| 亚洲六月丁香色婷婷综合久久| 激情婷婷欧美| 久久一日本道色综合久久| 亚洲国产高清高潮精品美女| 在线综合亚洲欧美在线视频| 一区二区三区高清在线观看| 国产精品美女诱惑| 在线电影国产精品| 亚洲久久视频| 国产色产综合色产在线视频| 国产精品日韩二区| 国产精品高潮呻吟久久av黑人| 国产精品日韩一区二区三区| 一区二区三区四区五区精品视频| 国产一区在线视频| 麻豆精品传媒视频| 亚洲国产一区二区三区在线播| 在线视频中文亚洲| 在线一区二区日韩| 国内精品久久久久影院 日本资源| 欧美午夜理伦三级在线观看| 亚洲国产婷婷香蕉久久久久久99| 亚洲免费黄色| 麻豆精品视频在线观看视频| 在线观看不卡av| 亚洲国语精品自产拍在线观看| 久久久久久久波多野高潮日日| 欧美午夜不卡影院在线观看完整版免费| 久久久久久久网站| 亚洲电影自拍| 国外成人在线视频网站| 欧美成人乱码一区二区三区| 国产精品一区二区欧美| 亚洲精品久久7777| 亚洲二区在线视频| 欧美午夜一区二区三区免费大片| 在线中文字幕不卡| 国产精品一区二区久久| 久久久久久自在自线| 久久久久久久成人| 91久久精品国产91久久性色tv| 亚洲精品少妇30p| 亚洲第一色中文字幕| 欧美激情亚洲国产| 国外精品视频| 国产精品久久久久久亚洲调教| 亚洲精品欧美在线| 麻豆精品91| 亚洲素人一区二区| 亚洲免费综合| 亚洲欧美日韩直播| 欧美黄在线观看| 一区二区欧美在线| 国产日韩欧美精品在线| 亚洲国产三级| 在线欧美小视频| 国产精品综合av一区二区国产馆| 欧美激情一区二区三区在线| 亚洲四色影视在线观看| 欧美一区亚洲一区| 亚洲精品国产精品国自产在线| 一区二区三区我不卡| 欧美成人首页| 性伦欧美刺激片在线观看| 欧美精品一区二区三区四区| 欧美国产另类| 欧美日韩一区二区三区在线视频| 久久精品视频在线播放| 欧美一区二区在线免费观看| 久久精品国产久精国产思思| 久久精品网址| 亚洲成人在线视频网站| 亚洲视频视频在线| 久久天天综合| 欧美精品久久久久久久久久| 欧美日本一区二区高清播放视频| 欧美一区午夜精品| 最新亚洲激情| 欧美日韩美女| 欧美三日本三级少妇三99| 久久免费少妇高潮久久精品99| 国产日韩欧美视频| 欧美性猛交xxxx乱大交退制版| 欧美国产一区二区在线观看| 亚洲一区二区三区久久| 国产亚洲欧美日韩在线一区| 99re这里只有精品6| 午夜一区二区三视频在线观看| 欧美亚洲一区三区| 欧美日韩亚洲一区三区| 亚洲欧美日韩天堂一区二区| 亚洲国产精品精华液2区45| 欧美网站大全在线观看| 国内精品视频在线观看| 国产美女精品视频免费观看| 国产欧美另类| 亚洲人成欧美中文字幕| 国产精品久久久久久久久免费桃花| 亚洲综合欧美日韩| 欧美成人精品高清在线播放| 亚洲精品亚洲人成人网| 亚洲视频一二区| 伊人狠狠色j香婷婷综合| 亚洲福利专区| 久久视频在线免费观看| 欧美在线短视频| 欧美日韩亚洲一区二区三区| 免费在线观看成人av| 欧美一区二粉嫩精品国产一线天| 国产欧美日韩精品a在线观看| 欧美日韩一二三区| 9l国产精品久久久久麻豆| 欧美日韩在线不卡一区| 亚洲精品欧美日韩| 欧美三级小说| 国产美女精品视频免费观看| 欧美精品乱码久久久久久按摩| 亚洲欧美一区二区在线观看| 亚洲人成网站在线观看播放| 国产专区精品视频| 久久国产精品一区二区三区| 国产精品一区二区女厕厕| 欧美日韩91| 国产一区久久久| 性欧美精品高清| 久久国内精品视频| 韩国成人理伦片免费播放| 99综合电影在线视频| 亚洲欧美偷拍卡通变态| 国产精品久久久久aaaa| 久久先锋资源| 亚洲人成毛片在线播放女女| 国产精品夜色7777狼人| 国精品一区二区三区| 国产免费成人在线视频| 夜夜嗨av一区二区三区| 国语自产精品视频在线看一大j8| 久久国产欧美精品| 欧美在线观看一区二区| av成人天堂| 国产一区视频在线看| 狠久久av成人天堂| 亚洲国产精品成人va在线观看| 在线中文字幕一区| 欧美国产综合一区二区| 国产视频综合在线| 亚洲精品影院| 欧美中文日韩| 国产精品久久久久免费a∨大胸| 国产精品第三页| 国产精品99久久久久久人| 亚洲黄色成人网| 亚洲国产99精品国自产| 国产伦精品一区二区三区高清| 久久精品国产精品亚洲精品| 午夜精品在线看| 欧美三级电影网| 亚洲直播在线一区| 欧美高清视频在线播放| 在线日韩电影| 久久精品亚洲精品| 国产精品一区一区三区| 国产一区二区丝袜高跟鞋图片| 欧美日韩午夜剧场| 欧美日本一道本| 亚洲精品一区二区在线观看| 国产欧美日韩不卡| 一区二区三区在线视频免费观看| 国产亚洲精品一区二区| 国产精品视频免费| 在线观看日韩一区| 亚洲一区二区三区午夜| 欧美人与性动交cc0o| 久久午夜影视| 欧美自拍偷拍午夜视频| 影音先锋欧美精品| 久久精品在线播放| 亚洲影院色在线观看免费| 亚洲精品一区二区三区蜜桃久| 欧美中文字幕| 欧美精品三级| 久久久久久尹人网香蕉| 激情文学综合丁香| 榴莲视频成人在线观看| 一区二区三区精品视频| 亚洲精品国产精品乱码不99| 欧美电影免费网站| 日韩视频不卡中文| 免费成人激情视频| 亚洲精品日韩综合观看成人91| 久久天天躁夜夜躁狠狠躁2022| 国产精品中文字幕欧美| 欧美国产日本韩| 国产精品美女黄网| 欧美精品一区二区视频| 午夜精品三级视频福利| 国产精品久久久久久久久久久久久| 国产亚洲精品一区二区| 亚洲性人人天天夜夜摸| 欧美波霸影院| 国产亚洲人成a一在线v站| 在线视频国产日韩| 欧美一区二区日韩一区二区| 久久婷婷国产麻豆91天堂| 禁断一区二区三区在线| 久久亚洲综合色| 亚洲精品激情| 欧美婷婷久久| 亚洲在线免费视频| 欧美人与禽性xxxxx杂性| 午夜欧美不卡精品aaaaa| 在线观看亚洲一区| 国产亚洲精品久久久久动| 亚洲第一级黄色片| 日韩手机在线导航| 免费成人毛片| 久久久国产精品亚洲一区| 在线综合+亚洲+欧美中文字幕| 国产视频亚洲| 国产午夜精品一区二区三区欧美| 久久精品动漫| 久久久久一区二区三区| 亚洲女人天堂av| 午夜视黄欧洲亚洲| 欧美中文字幕视频在线观看| 国产精品va在线播放| 欧美成人精品福利| 久久精品在线免费观看| 久久综合色影院| 亚洲国产第一页| 国产精品成人v| 久久人人97超碰精品888| 99精品免费| 在线亚洲国产精品网站| 欧美日韩高清在线观看| 亚洲精品乱码久久久久久蜜桃91| 亚洲高清一区二| 1024成人网色www| 欧美在线影院在线视频| 久久综合色婷婷| 夜夜嗨网站十八久久| 性xx色xx综合久久久xx| 亚洲欧洲偷拍精品| 亚洲欧美bt| 国产视频一区欧美| 亚洲永久免费视频| 激情综合在线| 亚洲国产乱码最新视频| 国产日韩亚洲欧美综合| 国产精品久久国产精品99gif| 欧美激情网友自拍| 欧美日韩国产首页在线观看| 亚洲免费不卡| 亚洲欧美中文另类| 欧美三区在线视频| 欧美一区综合| 国产午夜精品全部视频播放| 影音先锋中文字幕一区| 欧美性色综合| 悠悠资源网亚洲青| 亚洲欧洲在线观看| 国产伦精品一区二区三区高清| 亚洲一区二区三区高清| 亚洲小说春色综合另类电影| 欧美中文在线字幕| 欧美国产在线观看| 欧美激情中文字幕乱码免费|