《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 一種基于軟構件描述文本信息抽取的檢索方法
一種基于軟構件描述文本信息抽取的檢索方法
來源:微型機與應用2013年第2期
韓忠愿, 謝 丹
(南京財經大學 信息工程學院,江蘇 南京210046)
摘要: 通過對目前應用廣泛的軟構件檢索技術的研究,提出了一種基于軟構件描述文本信息抽取的檢索方法。該方法利用中文分詞技術和向量空間模型中“詞頻與倒文檔頻度”算法抽取關鍵詞,通過《知網》語義相似度,計算用戶需求與可重用軟構件的匹配度,實現了對軟構件的語義檢索,能實現模糊查詢,具有一定的張弛能力。
Abstract:
Key words :

摘   要: 通過對目前應用廣泛的軟構件檢索技術的研究,提出了一種基于軟構件描述文本信息抽取的檢索方法。該方法利用中文分詞技術和向量空間模型中“詞頻與倒文檔頻度”算法抽取關鍵詞,通過《知網語義相似度,計算用戶需求與可重用軟構件的匹配度,實現了對軟構件的語義檢索,能實現模糊查詢,具有一定的張弛能力。
關鍵詞: 構件檢索;向量空間模型;知網;語義相似度;信息抽取

    隨著軟件開發規模的增大,軟件構件技術被認為是解決軟件危機的有效途徑,基于構件的軟件開發CBSD(Component Based Software Development)[1]成為有效提高軟件生產率、縮短軟件產品交付時間和提高軟件質量的新方法。
    傳統的軟構件的檢索方法[2]主要有三種:基于外部索引的檢索、基于內部靜態索引的檢索和基于內部動態索引的檢索。其中以構件的刻面表示以及在此基礎上的構件檢索技術已得到軟件復用界的重視和應用[3]。著名的REBOOT構件庫[4]提出了可重用軟件構件基于刻面的分類檢索方案。國內的青鳥構件庫[5]采用以刻面分類為主、多種分類模式相結合的方法對構件進行分類描述。
    傳統的基于關鍵字或刻面描述的軟件構件的檢索由于缺少特定領域語義信息,使得用戶在查詢所需要的構件時,有時很難對構件的各個刻面作出準確的描述,因此在查準率和查全率上存在不足。準確地理解用戶的查詢請求是構件檢索的一個重要問題,本文針對與軟構件如影隨形的自然語言描述,提出一種基于軟構件描述文本信息抽取的檢索方法。該方法采用自然語言描述軟構件的實現,并由系統利用自然語言處理技術抽取軟構件特征信息和需求的特征信息,然后利用特征匹配和《知網》詞匯語義相似度計算獲得候選的結果。
1 軟構件檢索系統體系結構
    有效的構件檢索機制能夠降低構件查找和理解的成本,檢索方式對構件描述和用戶查詢的依賴是本文研究的主體部分。本文設計了基于文本描述的軟構件檢索系統體系結構,如圖1所示。其各部分功能如下:

    (1)軟構件文本描述主要是將系統數據庫中有關軟構件的文本描述信息提取出來進行自然語言處理,并將處理返回的結果存儲起來;主要負責與用戶交互,為用戶提供查詢接口,通過用戶輸入生成查詢條件,并將滿足條件的軟構件信息返回給用戶。
    (2)自然語言處理模塊主要是將數據庫的軟構件文本描述信息集合在一起,通過ICTCLAS分詞技術獲得帶標注的分詞結果,并根據VSM中TFIDF的計算方法為每個軟構件描述文本提取特征項并存儲;
    (3)檢索模塊分為兩種方式:一種是將用戶查詢的特征與抽取出的軟構件特征項通過《知網》詞匯語義相似度計算來獲取查詢結果,此種方法主要實現了軟構件的語義檢索,是本文研究的重點;另一種是用戶查詢的特征與軟構件特征項之間的匹配檢索。
    這種層次結構的體系模式將各模塊的功能相互獨立,有利于系統的維護與擴展,確保了系統的穩定性和可維護性。
2 軟構件檢索實現分析
    檢索實現是本文研究的重點,尤其是實現軟構件的語義檢索。通過上面軟構件檢索系統的體系結構圖可以看出,自然語言處理部分是實現語義檢索的基礎,自然語言處理的準確度直接影響到檢索結果的查全率和查準率。
    下面簡單介紹ICTCLAS漢語分詞系統和VSM的研究現狀,并詳細介紹語義檢索的實現過程。
2.1 ICTCLAS漢語分詞簡介
    分詞系統[6]ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)是由中科院計算所的張華平、劉群所開發的一套獲得廣泛好評的分詞系統。它先通過層疊形馬爾可夫模型CHMM(Hierarchical Hidden Markov Model)進行分詞,通過分層,既增加了分詞的準確性,又保證了分詞的效率。ICTCLAS分詞速度單機500 KB/s,分詞精度98.45%,是世界上最好的漢語詞法分析器,并且在國內973專家組組織的評測中獲得了第一名。
2.2 向量空間模型
    向量空間模型VSM(Vector Space Model)由Salton等人于上世紀60年代末提出,并成功應用于著名的SMART系統,是目前最為成熟且應用最為廣泛的文本表示模型之一[7]。它把對文本內容的處理簡化為向量空間中的向量,用“詞頻與倒文檔頻度”TFIDF(Term-Frequency Inverse-Document-Frequency)[8]進行特征項賦權值,來表征某個特征項對該文本內容的重要程度。其中TFIDF將一個特征項在某個文檔中的重要性和在整個文檔數據全集中的重要性結合起來,成為一個統一的度量值。它說明一個在單個文檔中頻度很高,而在整個數據全集中頻度很低的詞是更加重要的詞。
    本文在自然語言處理過程中對文本關鍵詞的抽取正是提取VSM中TFIDF值較高的特征項,將通過此方法獲得的所有特征項按權值大小排序,提取滿足閾值或一定數目的最優特征作為最終表達該文本特征的特征項集。
2.3 《知網》詞匯語義相似度計算
    《知網》(HowNet)[9]是一部比較詳盡的語義知識詞典,是一個以漢語和英語詞義所代表的概念為描述對象,以揭示概念間及概念所具有的屬性間關系為基本內容的常識知識庫。概念與義原是《知網》中的兩個主要概念。每一個詞可以表達為幾個概念,每個概念又可由若干個義原來描述。
 
    以上是《知網》詞匯語義相似度的計算方法,是本文的一個重要部分,精確的詞匯匹配度是下一步檢索的基礎工作。
2.4 檢索模塊
    通過抽取軟構件文本描述特征項來實現基于語義的檢索是本文研究的重點。通過對相似度計算模塊得到的數據進行處理分析,是實現檢索的關鍵步驟,其主要處理流程如圖2所示。

    假設用戶查詢關鍵詞集合為Q{K1,K2,…,Km},某一軟構件的文本描述向量空間模型的特征項表示為集合Di{T1,T2,…,Tn},其中Tj{j=1,2,…,n)為經過自然語言處理的描述該構件的特征項。
  一般將兩個集合中的特征項兩兩比較得到的相似度的平均值作為它們的相似度,如此一個集合任意兩個特征項之間的相似度都為1,集合才能與它本身100%相似。本文采用以下算法為這兩個集合進行相似度計算:
    (1)利用《知網》詞匯語義相似度,將Q中每個關鍵字與Di中每個特征項進行相似度計算,如圖3所示。得到Term_Sim{Sim(K1,T1),Sim(K1,T2),…,Sim(Ki,Tj),…,Sim(Km,Tn)}為相似度值集合,共m×n個數據。

    (2)將相似度值中最大的值所對應的Ki和Tj建立對應關系。
    (3)將包含Ki和Tj的相似度值從Term_Sim中刪除。
    (4)重復(2)和(3),直到所有的相似度值都被刪除。
    (5)沒有建立起對應關系的關鍵字或特征項與空對應。
    (6)將包含Ki的相似度值取算術平均值。
    把上面得到的平均值作為用戶查詢與軟構件之間的相似度度量值,將滿足閾值的軟構件信息按照相似度值的遞減順序輸出。
3 實驗結果
    根據以上描述,實現了在ERP領域軟構件的檢索,檢索結果如圖4所示。

 

 

    實驗從ERP軟構件描述數據庫中抽取出相似度較高的軟構件作為候選結果輸出。其中,“成本管理”經過ICTCLAS分詞、VSM處理得到的關鍵詞是:“成本”、“產品”、“計算”等,與用戶檢索關鍵詞“成本”、“分析”比較,相似度值是72.22%。在查詢結果中點擊相應的項目,會詳細顯示對構件的描述,可以幫助用戶更清晰地了解該構件的信息,從而從候選結果中選擇符合要求的軟構件。
    本文提出了一種基于文本信息抽取的軟構件檢索方法,并對軟構件檢索系統的體系結構、功能模塊進行了詳細介紹,優化了關鍵字集合相似度計算;并且針對傳統軟構件檢索中語義缺失的缺點,實現了對軟構件的語義檢索的目的,有利于進行基于軟構件的軟件開發。另外,本系統還有尚待改進的地方,例如:擴充分詞詞典,保證領域術語的完整性;增加軟構件的圖形描述,實現多功能檢索等,這些問題也是下一步研究工作的重點。
參考文獻
[1] BROWN A W, WALLNAU K C. The current state of CBSE[J]. IEEE Software,1998,15(5):37-46.
[2] 劉韜,范菁,熊麗榮.構件的檢索技術研究及其在信用領域構件庫中的應用[D].杭州:浙江工業大學,2008.
[3] 舒遠仲,陳志勇,彭曉紅,等.基于刻面分類描述的構件檢索方法研究[J]. 計算機工程與科學, 2010,32(11):156-160.
[4] MOREL J M, FAGET J. The REBOOT environment[C].In: Prieto-Diaz R,Frakes WB eds.Processdings of the 2nd International Workshop on Software Reusability Advances in  Software,Lucca:IEEE Computer Society Press,1993:80-88.
[5] CHANG J C, LI K Q,GUO L F,et al. Representing and retrieving reusable software components in JB(Jadebird)System[J]. Electronica Journal,2000,28(8):20-24.
[6] ICTCLAS分詞系統研究[EB/OL].(2010-08-24).http://wenku.baidu.com/view/2eeb4afff705cc175527093f.html.
[7] 楊小平,丁浩,黃都培.基于向量空間模型的中文信息檢索技術研究[J].計算機工程與應用,2003(15):109-111.
[8] 王曉龍,關毅.計算機自然語言處理[M].北京:清華大學出版社,2005.
[9] 劉群,李素建.基于《知網》的詞匯語義相似度計算[C].臺北:第三屆漢語詞匯語義學研討會論文集,2002:59-76.

此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          国产午夜精品一区二区三区欧美| 亚洲视频一区二区免费在线观看| 欧美极品在线视频| 久久婷婷蜜乳一本欲蜜臀| 欧美激情一区二区三区在线视频| 欧美成人69| 欧美一区二区三区视频| 国产精品一区二区久久久| 洋洋av久久久久久久一区| 欧美福利一区| 精品动漫一区| 国产精品s色| 久久se精品一区精品二区| 亚洲日产国产精品| 欧美日一区二区在线观看| 欧美一区二区视频免费观看| 欧美在线播放视频| 国产手机视频一区二区| 欧美另类一区二区三区| 亚洲开发第一视频在线播放| 久久成人免费视频| 国产精品一区二区久久| 欧美精品一线| 在线观看一区二区视频| 久久久综合香蕉尹人综合网| 亚洲国产欧美日韩精品| 国产精品国产三级国产aⅴ9色| 国产精品自在欧美一区| 国产精品视频最多的网站| 你懂的亚洲视频| 久久综合久久美利坚合众国| 国产精品女主播在线观看| 欧美日韩国产麻豆| 久久精品观看| 欧美精品一区二| 免费不卡在线观看| 国产在线国偷精品产拍免费yy| 日韩视频中文字幕| 亚洲欧洲久久| 亚洲国产黄色片| 久久精品国内一区二区三区| 国产精品一区二区三区乱码| 欧美性一二三区| 欧美体内she精视频在线观看| 一区二区精品在线观看| 久久久久久久久久码影片| 欧美69视频| 99国产精品久久久久久久久久| 午夜在线观看免费一区| 久久久综合香蕉尹人综合网| 欧美日韩国产天堂| 国产一区二区久久精品| 亚洲精品中文字幕女同| 欧美午夜一区二区三区免费大片| 亚洲午夜在线观看视频在线| 亚洲视频一区在线| 欧美另类高清视频在线| 欧美黄色免费网站| 欧美丰满少妇xxxbbb| 国产精品日韩欧美| 欧美高清在线播放| 欧美777四色影视在线| 欧美成人免费在线观看| 你懂的国产精品永久在线| 老司机久久99久久精品播放免费| 玖玖玖国产精品| 欧美另类视频在线| 国模精品一区二区三区| 亚洲欧美变态国产另类| 亚洲午夜一区二区| 国产亚洲欧美另类一区二区三区| 欧美性猛交xxxx免费看久久久| 欧美精品三级在线观看| 国产精品一区二区三区久久| 欧美视频中文在线看| 亚洲图片欧洲图片av| 久久综合狠狠综合久久激情| 国产精品一区二区久久精品| 欧美日韩p片| 欧美三级日本三级少妇99| 日韩视频二区| 中文精品99久久国产香蕉| 欧美高清视频一区二区| 亚洲欧美一区二区三区在线| 亚洲欧美成人一区二区在线电影| 美女黄网久久| 99国产精品久久久久久久成人热| 欧美人与性动交a欧美精品| 91久久精品www人人做人人爽| 亚洲欧美日韩国产另类专区| 亚洲精品免费在线观看| 先锋影音久久久| 女人色偷偷aa久久天堂| 欧美精品午夜视频| 免费在线视频一区| 狠狠色伊人亚洲综合成人| 国产在线乱码一区二区三区| 久久国产精品久久精品国产| 激情欧美一区| 欧美手机在线视频| 欧美色精品在线视频| 亚洲高清资源综合久久精品| 亚洲精品日韩精品| 亚洲三级性片| 国产一区二区三区免费不卡| 欧美午夜精品久久久久免费视| 欧美在线免费看| 国产精品亚洲激情| 亚洲电影在线免费观看| 亚洲自拍另类| 亚洲无吗在线| 国产精品伦子伦免费视频| 在线看日韩欧美| 亚洲欧美成人一区二区在线电影| 国产亚洲欧美另类一区二区三区| 欧美丰满高潮xxxx喷水动漫| 久久天天躁狠狠躁夜夜爽蜜月| 欧美在线播放| 久久亚洲不卡| 欧美一级欧美一级在线播放| 国产伦精品一区二区三区在线观看| 欧美日本韩国在线| 中日韩美女免费视频网站在线观看| 久久一二三区| 欧美三级网址| 久久综合给合久久狠狠狠97色69| 国产精品影视天天线| 欧美激情中文字幕一区二区| 在线视频亚洲欧美| 亚洲视频免费| 久久视频一区| 国产精品一区二区三区乱码| 另类图片综合电影| 狠狠操狠狠色综合网| 黄色一区二区三区四区| 久久综合九色综合网站| 在线亚洲精品| 国产欧美婷婷中文| 亚洲四色影视在线观看| 欧美精品成人| 欧美精品日韩| 午夜久久黄色| 国产日产欧美精品| 欧美一区亚洲二区| 欧美精品午夜视频| 亚洲欧美日韩在线不卡| 狠狠久久五月精品中文字幕| 性伦欧美刺激片在线观看| 亚洲毛片在线| 亚洲毛片在线看| 国产精品久久久一本精品| 日韩写真在线| 欧美另类69精品久久久久9999| 免费在线播放第一区高清av| 性色av一区二区怡红| 欧美一区二区视频在线观看2020| 狠狠色综合色综合网络| 欧美刺激午夜性久久久久久久| 一区二区三区免费网站| 午夜精品一区二区三区在线播放| 亚洲免费成人av电影| 国产精品一区在线播放| 亚洲福利视频专区| 99精品欧美一区二区三区综合在线| 亚洲欧美激情视频在线观看一区二区三区| 亚洲国产精品成人va在线观看| 欧美日韩中文在线| 久久久国产精品一区二区中文| 国产在线麻豆精品观看| 国产区精品在线观看| 欧美日韩国产一级| 欧美在线亚洲一区| 免费人成精品欧美精品| 久久精品一区二区三区不卡牛牛| 国产在线播精品第三| 在线中文字幕日韩| 韩国自拍一区| 欧美二区在线观看| 老色鬼精品视频在线观看播放| 亚洲在线播放| 欧美午夜片在线观看| 国产精品每日更新| 国产亚洲人成网站在线观看| 欧美色播在线播放| 欧美1区2区| 国产精品久久久久久户外露出| 国产精品国产三级国产| 狠狠色综合日日| 亚洲国产婷婷综合在线精品| 欧美视频一区二| 久久精品国产91精品亚洲| 亚洲少妇在线| 亚洲午夜一区| 国产精品jvid在线观看蜜臀| 久久精品99国产精品日本| 国产精品视频男人的天堂| 欧美视频亚洲视频| 久久综合久久久久88| 亚洲精品美女在线观看| 久久先锋资源| 国产欧美不卡| 欧美亚日韩国产aⅴ精品中极品| 欧美成人69| 国产精品v日韩精品| 久久综合色88| 欧美精品导航| 国产专区一区| 亚洲国产美国国产综合一区二区| 国产一区日韩二区欧美三区| 国产一区白浆| 欧美日韩国产成人在线| 亚洲区中文字幕| 欧美黑人在线播放| 亚洲狼人精品一区二区三区| 欧美国产精品一区| 国产精品伦理| 一区二区欧美亚洲| 国内精品美女在线观看| 欧美一区二区视频观看视频| 久热爱精品视频线路一| 午夜精品久久久久久久久久久久久| 欧美精选一区| 一区二区三区蜜桃网| 一本色道精品久久一区二区三区| 在线观看一区二区精品视频| av成人福利| 国内精品视频在线观看| 亚洲美女啪啪| 亚洲午夜精品久久| 国内揄拍国内精品少妇国语| 亚洲欧洲三级电影| 欧美欧美在线| 欧美在线播放高清精品| 亚洲福利电影| 欧美在线一区二区| 国产精品网站视频| 亚洲第一精品电影| 一本色道久久综合亚洲精品高清| 欧美sm极限捆绑bd| 在线欧美一区| 亚洲最新视频在线| 亚洲欧洲另类国产综合| 欧美精品色综合| 国产精品s色| 黑人巨大精品欧美一区二区小视频| 国产日韩精品视频一区二区三区| 国产精品区一区二区三区| 一区二区三区波多野结衣在线观看| 欧美理论视频| 亚洲欧美在线免费观看| 国产精品久久久久影院色老大| 欧美高清在线一区| 国产精品久久久久天堂| 在线精品视频一区二区| 欧美日韩中文字幕综合视频| 久久国产精品99国产精| 亚洲电影免费在线观看| 国产精品久久久久一区二区| 欧美在线播放一区| 欧美三级日本三级少妇99| 亚洲午夜激情免费视频| 国产一区二区av| 国产精品乱码一区二三区小蝌蚪| 久久久久中文| 国产精品xnxxcom| 欧美电影在线免费观看网站| 亚洲视频欧美视频| 欧美日韩一本到| 国内外成人在线视频| 久久久久亚洲综合| 欧美一级专区| 亚洲毛片网站| 欧美午夜免费电影| 亚洲无人区一区| 国产精品久久7| 亚洲国产精品久久久久秋霞不卡| 国产日韩在线不卡| 欧美激情一区二区三区在线视频观看| 日韩亚洲一区二区| 亚洲男同1069视频| 欧美激情aⅴ一区二区三区| 国产精品久久久久久久久久三级| 久久精品视频导航| 欧美成人激情视频免费观看| 在线精品国产欧美| 亚洲在线视频网站| 狠狠色狠色综合曰曰| 久久亚洲精品一区二区| 国产午夜精品久久久久久久| 国语精品一区| 久久综合综合久久综合| 国产精品久久久久久久免费软件| 国产精品久久久久久户外露出| 老**午夜毛片一区二区三区| 在线成人激情| 亚洲一区免费观看| 亚洲图片欧洲图片日韩av| 欧美有码视频| 国产欧美三级| 午夜精品免费| 国产精品久久久久久久7电影| 久久久久成人精品免费播放动漫| 国产欧美1区2区3区| 亚洲图片欧洲图片日韩av| 久久九九精品| 久久人人97超碰国产公开结果| 亚洲一区二区久久| 欧美国产日韩二区| 亚洲欧美卡通另类91av| 久久高清福利视频| 亚洲国产一区二区三区青草影视| 午夜在线成人av| 亚洲国产精品福利| 国产偷国产偷亚洲高清97cao| 99视频+国产日韩欧美| 欧美三级特黄| 国产日本欧洲亚洲| 91久久黄色| 能在线观看的日韩av| 亚洲婷婷综合久久一本伊一区| 久久精品久久99精品久久| 亚洲国产精品女人久久久| 欧美一区二区福利在线| 亚洲欧美日韩国产一区| av成人免费观看| 99av国产精品欲麻豆| 国产视频一区免费看| 欧美日韩免费观看一区=区三区|