《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 綠網摘要提取系統算法研究
綠網摘要提取系統算法研究
來源:微型機與應用2013年第12期
龍 瓏1, 鄧 偉2
(1. 廣西師范學院 計算機與信息學院, 廣西 南寧530023; 2. 廣西腫瘤防治研究所, 廣西
摘要: 隨著互聯網的普及和發展, 傳統的文本摘要的提取方法已無法適應綠色網絡提供優質內容并過濾不良文本的社會需求。提出通過條件隨機場模擬對句子進行注解的方法提取文本摘要。實驗證明新方法提取文本的效果有效并可提供更好的過濾不良文本的服務。
Abstract:
Key words :

摘  要: 隨著互聯網的普及和發展, 傳統的文本摘要的提取方法已無法適應綠色網絡提供優質內容并過濾不良文本的社會需求。提出通過條件隨機場模擬對句子進行注解的方法提取文本摘要。實驗證明新方法提取文本的效果有效并可提供更好的過濾不良文本的服務。
關鍵詞: 綠色網絡; 提取信息; 不良文本; 過濾; 條件隨機場

    目前尚未發現“綠色網絡”權威定義,現階段只能將其理解為可預防網民患上網癮流行病的計算機網絡[1-2]?;谛袨榉治龅木G色網絡系統軟件的設計目的是為了預防青少年感染不良的網癮行為?;谛袨榉治龅木G色網絡系統中提取文本摘要子系統(下文稱綠網摘要提取系統)采用智能的方法濃縮文本信息,從而使基于行為分析的綠色網絡系統能快速有效地識別過濾對青少年有不良影響的文本,保留青少年獲得感興趣并對他們身心有益的文本。
    在如何快速準確提取文本摘要這個問題上,不少學者進行了大量有價值的研究。Baxendale提出引入句子位置判斷句子重要性的方法提取文本摘要[3]。Luhn列出高頻詞并打分,分數高的句子被認定為文本摘要句[4]。AONE C等提出基于TF-IDF樸素貝葉斯模型的算法提取文本摘要[5-7]。KUPIE C J等通過增加句長方法改進樸素貝葉斯模型的算法提取文本摘要[8]。金立左等提取文本摘要使用基于最大熵模型,增加了先驗概率,從而優于所有基于樸素貝葉斯模型的方法[9-11]。
    針對文本摘要更新較快和多樣性的特點,本文提出通過條件隨機場模擬對句子進行注解來達到提取文本摘要的方法。實驗表明該方法可有效地提取文本摘要,為綠色網絡系統是否過濾該文本提供依據。
1 綠網摘要提取系統摘要主要特征
    文本摘要具有三個基本的特征:源自文件、保留文本重要信息、長度短。因此要滿足以上特點,很多因素會影響一個句子是否被認為是文本摘要句。影響分為兩大類,第一類是句子自身因素,也稱單句特征;第二類是文本上下文信息因素,稱為關聯特征。
1.1 句子自身特征
    句子自身特征是指不涉及文本上下文信息也能體現出句子本身的特征。下文列舉出幾種句子自身因素。
    (1)長度特征,由于文本摘要基本不會出現過短或過長的句子,先過濾掉句子中的停用詞,然后以詞為單位計算目標句子的長度,最終本文算法選取最短和最長的閥值分別為38和6。
    (2)位置特征,位置因素是文本預料的重要特征因素,首句、尾句、段首和段尾是最重要的影響提取文本摘要的幾個特征,本文采用了首段、尾句、段首和段尾的位置特征因素。標記詞語特征,判斷摘要句的標記詞語,例如“表示”等,統計表明,約有30%句子含有標記詞語,本文算法利用這些詞語判斷摘要句。
    (3)高頻詞特征,高頻詞是指出現在目標文本頻率較高的句子,詞頻越高,證明該詞語的重要程度越大,所在的句子代表性越強,本文算法在停用詞被過濾后,再度量使用高頻詞。
    (4)時間、數字及專有名詞特征,文章的焦點基本是命名實體,算法選擇句子時決定使用時間、數字以及專有名詞。
1.2 上下文關聯特征
     一個句子是否被綠網摘要提取系統選擇為摘要句,除了句子自身的特征影響外,受到上下文關聯特征的影響也是很大的。綠網摘要提取系統選擇兩種基本的關聯特征。
    (1)與文本標題相似度的關聯特征。文本信息包含在標題中,研究發現句子與標題相似度越大,則出現在摘要的可能性越大。
    (2)與文本其他句子的相似度的關聯特征。實際開發中綠網摘要提取系統把使用該特征看作尋找“高頻句”的相似過程,原理與高頻詞原理相似,建模公式為:
  

其中,x為綠網摘要提取系統目標文本;Length(x)為綠網摘要提取系統目標文本的長度,即系統目標文本所包含的句子數。
3 實驗測試結果及分析
3.1 實驗測試預料

    本文實驗的測試數據來源于廣西軟件測試中心,從搜狐、新浪、網易以及鳳凰網4個網站上采集了35 220篇文本,其中既有不宜青少年閱讀的文本,也有適合青少年閱讀的文本,將這些平均分為5等份,4份用于訓練,1份用于測試,測試使用交叉驗證方法。
3.2 實驗測試評測方法
    為了更好地評價綠網摘要提取系統測試實驗效果,采用準確率、召回率和F值3個標準指標來衡量,其中F值是本次測試最重要的評價指標。綠網摘要提取系統測試實驗結果的計算公式為:
 
    從表1的實驗結果可以看出,綠網摘要提取系統使用基本條件隨機場模型的綜合效果(即F值)好于系統使用其他兩種模型,召回率不如系統使用樸素貝葉斯模型。算法設計小組觀察標注的結果發現,當系統選取目標文本過長時,使用條件隨機場提取摘要句子分布會過于分散,位于文本中部的句子其位置特征相對分散,導致誤判,從而綠網摘要提取系統使用基本條件隨機模型提取目標文本的摘要的召回率低一些。算法設計小組對本次測試統計發現,有54%的文本超過10句,24%的文本超過20句,文本越長,綠網摘要提取系統使用基本條件隨機模型提取目標文本的摘要的效果越差。
    表2 列出了第二組測試的實驗結果。

 

 

    從表2實驗結果可以看出,綠網摘要提取系統使用合適的修正因子條件隨機場模型后,召回率提高了15.4%,綜合效果(F值)也提高了1.6%,在一定程度上提高了F值,取得更好的效果。
    綠網摘要提取系統采用增加修正因子的方法改進條件隨機模型可以克服目標文本因文本過長所造成的影響。從實驗效果來看,使用修正因子可以提高提取摘要的效果,今后可重點考慮在算法模型中增加更多因素的修正因子,以提高模型算法的提取效果。
參考文獻
[1] 寧葵,龍瓏,覃曉,等.綠色網絡不良內容語義分析方法研究[J].計算機應用研究,2010,27(12):4643-4645.
[2] 龍瓏,鄧偉.綠色網絡智能文摘算法研究[J].計算機應用, 2012,32(7):2030-2032.
[3] BAXENDALE P. Machine-made index for technical literature-an experiment[J]. IBM Journal of Research Development, 1958,2(4):354-361.
[4] LUHN H P. The automatic creation of literature abstracts[J].  IBM Journal of Research Development,1958,2(2):159-165.
[5] AONE C, OKUROWSKI M E, GORLINSKY J, et al. A  trainable summarize with knowledge acquired from robust NLP techniques[C].In Mani, I.and Maybury,M. T., editors, Advances in Automatic Text Summarization, 71-80. MIT Press. 1999.
[6] PANG B,LEE L,VAITHYANTHAN S. Thumbs up? Sentiment classification using machine learning techniques[C]. Processdings of the Conference on Empirical Methods in  Natural Language Processing. Stroudsburg: Association for Computational Linguistics, 2002:79-86.
[7] 何鳳英.基于語義理解的中文博文傾向性分析[J].計算機應用,2011,31(8):2130-2137.
[8] KUPIEC J, PENDERSEN J, CHEN F. A trainable document summarizer[C]. Proceedings of SIGIR‘95, 68-73,New York, NY,USA,1995.
[9] 金立左,袁曉輝,趙一凡,等.二維模糊劃分最大熵圖像分割算法[J].電子與信息學院,2002,2(8):1040-1048.
[10] 張龍凱, 王厚峰. 文本摘要問題中的句子抽取方法研究[J].中文信息學報,2012,26(2):97-101.
[11] 屈志毅,李一偉,張延堂,等.一種基于關鍵重復語義的最大熵文本分類[J].廣西師范大學學報(自然科學版), 2007,25(4):204-207.

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          另类专区欧美制服同性| 亚洲欧美日韩精品久久奇米色影视| 欧美特黄一级| 噜噜噜噜噜久久久久久91| 亚洲免费在线视频一区 二区| 欧美在线1区| 欧美亚洲综合另类| 久久深夜福利免费观看| 国产亚洲美州欧州综合国| 玖玖玖免费嫩草在线影院一区| 久久久精品国产免费观看同学| 夜夜嗨av一区二区三区免费区| 欧美一区二区免费视频| 开心色5月久久精品| 亚洲国产综合在线看不卡| 中文精品99久久国产香蕉| 亚洲欧美成人一区二区在线电影| 欧美日韩一区在线观看视频| 在线精品视频一区二区| 欧美视频一区二区三区四区| 亚洲精品资源| 欧美伦理影院| 国产亚洲精品高潮| 亚洲国产一区二区视频| 欧美日韩国产电影| 影音先锋日韩资源| 欧美性生交xxxxx久久久| 一区二区在线看| 亚洲国产视频一区二区| 欧美日韩在线播放三区| 中文久久精品| 亚洲美女啪啪| 性欧美激情精品| 亚洲精品国产品国语在线app| 欧美日韩色综合| 欧美日韩国产一区二区三区地区| 国产精品www994| 亚洲视频一区二区免费在线观看| 亚洲综合国产激情另类一区| 99国内精品| 欧美日韩国产精品一卡| 欧美在线观看视频在线| 亚洲日本免费电影| 久久亚洲电影| 国产亚洲综合在线| 免费久久99精品国产自| 久久久久久亚洲精品中文字幕| 国产精品盗摄久久久| 久久免费少妇高潮久久精品99| 中文在线一区| 国产日韩在线亚洲字幕中文| 国产精品高潮粉嫩av| 午夜欧美精品久久久久久久| 欧美人妖另类| 美女脱光内衣内裤视频久久网站| 一区二区三区av| 精品成人一区二区三区四区| 国产精品一区二区在线观看不卡| 中文在线资源观看视频网站免费不卡| 亚洲一区3d动漫同人无遮挡| 欧美a一区二区| 黄色日韩精品| 羞羞色国产精品| 国产精品免费一区二区三区在线观看| 国产视频精品免费播放| 欧美福利视频| 欧美+亚洲+精品+三区| 国产伦精品一区二区三区四区免费| 一区二区激情视频| 欧美日韩影院| 亚洲免费观看高清完整版在线观看熊| 亚洲最新色图| ●精品国产综合乱码久久久久| 99亚洲伊人久久精品影院红桃| 午夜精品久久久久久久99樱桃| 久热re这里精品视频在线6| 9国产精品视频| 亚洲视频在线观看网站| 日韩视频免费观看高清在线视频| 国外成人性视频| 欧美亚洲在线| 狠狠色综合色综合网络| 欧美日韩一区不卡| 亚洲欧美变态国产另类| 亚洲人成人一区二区三区| 国产精品午夜在线| 国产欧美日韩综合一区在线观看| 国产亚洲精品资源在线26u| 午夜精品美女自拍福到在线| 一区二区精品| 国产精品美女久久久浪潮软件| 国产一区二区三区精品欧美日韩一区二区三区| 国产日韩精品一区二区三区| 亚洲精品激情| 亚洲激情欧美| 免费一区二区三区| 国产精品va在线播放我和闺蜜| 国产一区二区在线观看免费播放| 欧美啪啪一区| 在线播放国产一区中文字幕剧情欧美| 欧美精品日韩综合在线| 激情久久中文字幕| 亚洲欧美日韩在线| 在线观看视频一区二区| 国产亚洲aⅴaaaaaa毛片| 欧美日韩视频在线观看一区二区三区| 久久www免费人成看片高清| 亚洲欧洲精品一区二区三区波多野1战4| 欧美日韩国产成人在线91| 在线观看欧美| 国内一区二区三区在线视频| 国产欧美在线播放| 亚洲午夜在线| 亚洲电影在线观看| 午夜在线不卡| 香蕉成人伊视频在线观看| 日韩一区二区精品视频| 亚洲一区精品视频| 亚洲国语精品自产拍在线观看| 久久久亚洲精品一区二区三区| 国产精品每日更新在线播放网址| 国产精品久久久久一区二区三区共| 久久免费的精品国产v∧| 欧美色视频一区| 欧美婷婷在线| 欧美视频在线视频| 亚洲专区在线| 日韩午夜电影av| 欧美日韩日日夜夜| 欧美日韩视频一区二区| 国产精品欧美一区喷水| 国产精品国产三级国产aⅴ入口| 国产日韩欧美综合一区| 亚洲丰满在线| 国产精品高潮呻吟久久| 亚洲素人在线| 欧美日韩免费| 国产精品区免费视频| 快she精品国产999| 伊人蜜桃色噜噜激情综合| 欧美国产日韩a欧美在线观看| 国产亚洲精品高潮| 亚洲一区精品电影| 国产精品久久久久一区| 亚洲电影在线看| 久久视频这里只有精品| 一区精品在线播放| 久久久美女艺术照精彩视频福利播放| 玖玖玖国产精品| 中文欧美日韩| 亚洲人成网站影音先锋播放| 中文在线资源观看网站视频免费不卡| 在线看欧美日韩| 欧美三日本三级三级在线播放| av成人老司机| 欧美涩涩网站| 国产综合久久| 亚洲蜜桃精久久久久久久| 亚洲一区二区三区乱码aⅴ| 欧美激情一区二区三区在线视频观看| 久久久亚洲精品一区二区三区| 亚洲福利视频三区| 欧美α欧美αv大片| **性色生活片久久毛片| 亚洲一区二区三区乱码aⅴ蜜桃女| 欧美国产日韩精品免费观看| 一色屋精品视频免费看| 亚洲激情一区| 国产精品综合av一区二区国产馆| 一个色综合导航| 国产精品一区二区久久久久| 久久国产福利| 亚洲午夜免费视频| 永久免费毛片在线播放不卡| 亚洲综合色噜噜狠狠| 欧美va亚洲va日韩∨a综合色| 激情亚洲网站| 国产精品久久一级| 国产综合欧美在线看| 欧美日韩蜜桃| 亚洲一区二区综合| 日韩亚洲精品视频| 欧美成人午夜视频| 亚洲视频一二三| 亚洲精品国精品久久99热一| 欧美特黄一级大片| 欧美日韩国产一区精品一区| 欧美亚洲一区在线| 欧美一区二区三区日韩| 亚洲欧美日韩高清| 欧美日本三级| 国产精品人人爽人人做我的可爱| 国产精品二区三区四区| 欧美极品在线视频| 国产精品亚洲产品| 欧美精品亚洲| 欧美午夜女人视频在线| 日韩视频永久免费观看| 国产精品成人一区二区三区吃奶| 99精品国产高清一区二区| 欧美中日韩免费视频| 麻豆精品传媒视频| 欧美噜噜久久久xxx| 在线观看福利一区| 久久久久久有精品国产| 亚洲国产综合在线| 国产精品视频福利| 国产乱码精品一区二区三区av| 欧美成人一区二区三区片免费| 久久九九免费视频| 久久久亚洲午夜电影| 欧美伊人精品成人久久综合97| 这里是久久伊人| 欧美日韩99| 乱中年女人伦av一区二区| 亚洲美女av在线播放| 午夜欧美理论片| 久久精品二区三区| 久久综合精品国产一区二区三区| 国产精品丝袜白浆摸在线| 欧美国产视频一区二区| 国产精品免费观看在线| 国产一区二区主播在线| 久久在线免费| 亚洲特黄一级片| 久久国产直播| 狠狠色丁香久久综合频道| 91久久在线观看| 1000部精品久久久久久久久| 国产日韩欧美在线播放不卡| 欧美专区亚洲专区| 国产精品夜夜嗨| 欧美日韩国产123区| 国模精品一区二区三区色天香| 亚洲理论电影网| 一区二区三区精品在线| 久久九九有精品国产23| 欧美一区午夜视频在线观看| 亚洲美女黄色片| 欧美精品久久久久久久免费观看| 国内精品久久久| 亚洲电影免费观看高清完整版| 欧美高清在线视频| 国产亚洲永久域名| 久久综合伊人77777尤物| 亚洲永久精品国产| 欧美精品一区二区精品网| 国产精品一区二区在线观看不卡| 亚洲免费观看高清完整版在线观看熊| 欧美福利在线| 制服诱惑一区二区| 欧美一区二区在线观看| 欧美激情第二页| 久久青草欧美一区二区三区| 午夜精品久久久| 欧美激情性爽国产精品17p| 亚洲二区在线观看| 性欧美大战久久久久久久久| 亚洲视频第一页| 国产精品福利影院| 国产在线日韩| 在线视频中文亚洲| 国产一区二区三区四区三区四| 国产精品私房写真福利视频| 欧美电影电视剧在线观看| 欧美日本高清视频| 国产美女搞久久| 99视频精品全国免费| 欧美顶级少妇做爰| 黄色精品在线看| 欧美日韩日本国产亚洲在线| 亚洲国产91精品在线观看| 久久久一区二区三区| 老司机精品视频网站| 亚洲欧美日韩一区二区三区在线| 欧美好吊妞视频| 日韩视频在线观看| 中文国产成人精品| 欧美日韩人人澡狠狠躁视频| 亚洲视频国产视频| 好吊视频一区二区三区四区| 99精品视频一区二区三区| 午夜免费久久久久| 尤妮丝一区二区裸体视频| 久久久久久久久久久久久久一区| 亚洲精品视频免费| 亚洲欧美日韩中文在线制服| 亚洲综合第一| 欧美激情一区二区三级高清视频| 亚洲欧美日韩一区| 亚洲精品美女| 亚洲六月丁香色婷婷综合久久| 亚洲毛片在线观看| 欧美片第一页| 黄色av日韩| 亚洲婷婷综合色高清在线| 国内精品美女在线观看| 狠狠色香婷婷久久亚洲精品| 亚洲电影观看| 欧美中文在线免费| 一区二区三区四区在线| 欧美性jizz18性欧美| 亚洲一区二区视频在线观看| 欧美调教vk| 国产精品国产精品| 欧美精品123区| 亚洲福利视频网| 99精品国产在热久久婷婷| 亚洲高清不卡在线| 亚洲一区视频| 亚洲欧洲精品天堂一级| 午夜亚洲福利在线老司机| 亚洲人www| 欧美精品久久久久a| 欧美一区2区视频在线观看| 欧美~级网站不卡| 噜噜噜噜噜久久久久久91| 最近中文字幕日韩精品| 欧美在线播放一区二区| 国模一区二区三区| 国产一区久久| 久久精品国产77777蜜臀| 欧美特黄一区| 亚洲国产日韩在线一区模特| 久久国产精品色婷婷| 午夜欧美大片免费观看| 午夜精品视频在线观看一区二区| 玖玖玖免费嫩草在线影院一区|