《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > 維基百科你已經是個大百科了,該自己學會用ML識別原文出處了

維基百科你已經是個大百科了,該自己學會用ML識別原文出處了

2019-04-21
關鍵詞: 維基百科 WikiLabels

維基百科可能是我們認為比較客觀真實的材料了,但它包羅萬象卻又會引起一些小問題,例如很多句子或說法提供不了引用出處。那么機器學習在預測引用,并給出引用原因方面就顯得非常重要,它會讓這一自由的百科全書更加完美無瑕。


讓維基百科保持高質量的一個關鍵機制就是內聯引用的使用。通過引用,讀者和編輯者可以確定一篇文章中的信息準確反映了其來源。正如維基百科的可驗證性原則所要求的,「受到質疑的材料,或者很可能受到質疑的材料,以及所有的引文,都要具有可靠的、已發布的來源」,沒有來源的材料應該被刪除,或者使用「需要引用」的標記來提出質疑。


然而,決定哪些句子需要引用可能不是一項簡單的任務。一方面,編輯者被強烈要求避免為很明顯的或者常識性的信息添加引用——例如「天空是藍色的」。另一方面,有時候天空并不一定是藍色的——所以或許我們還是需要一個引用?


將這個問題擴大到整個百科全書的規??赡軙兊秒y以應付。維基百科編輯者的專業知識很有價值,但他們的時間卻是有限的,那么他們的引用工作應該集中在哪些類型的事實、文章和主題上呢?此外,最近的統計表明,相當一部分比例的文章只有很少的參考文獻,英文維基百科中四分之一的文章根本就沒有任何參考文獻。這意味著,有大約 35 萬篇文章包含一個或多個需要添加引用的標記,而且我們可能遺漏了更多。


我們最近設計了一個框架,幫助編輯者在維基百科中識別哪些句子需要引用,并且確定需要引用的優先順序。通過針對英語、意大利語和法語維基百科的編輯者們開展的一項大型研究,我們首先確定了維基百科文章中單個句子需要引用的共同原因。然后我們使用這項研究的結果來訓練一個機器學習模型分類器,它能夠預測英語維基百科中任何一個給定的句子是否需要一個引用,以及為何需要引用。這個模型將在 3 個月內部署到其他語言的版本中。


通過識別維基百科獲取信息的位置,我們能開發系統,以支持志愿者驅動的驗證和事實檢查,從而有可能提升維基百科的長期可靠性,抵御信息偏差、信息質量的差距以及虛假宣傳。


我們為何要引用?


為了教會機器如何識別不經驗證的陳述,我們首先要將句子需要引用的原因進行系統的分類。


我們首先檢查了與英語、意大利語和法語維基百科中與可驗證性相關的政策和指南,并嘗試特征化這些政策中的標準,即是否添加引用的標準。為了驗證和豐富實踐的集合,我們要求來自于這三個語言社區的 36 名維基百科編輯者參與試點實驗。我們使用 WikiLabels 收集了編輯者們對維基百科文章中句子的反饋:編輯者要決定一個句子是否需要引用,并且以自由形式的文本給出他們的理由。


我們的方法,以及最終關于是否需要添加引用的理由可以在項目網頁中看到:


地址:https://meta.wikimedia.org/wiki/Research_talk:Identification_of_Unsourced_Statements/Labeling_Pilot

微信圖片_20190421153253.jpg

添加引用的理由

微信圖片_20190421153348.jpg

不添加引用的理由


教機器學習引用


接下來,我們訓練機器學習模型來發現需要引用的句子,并提供對應的理由。


我們首先訓練一個模型,從整個編輯者社區中學習如何識別需要引用的句子。我們創建了一個英語維基百科的「精選文章」數據集,這是一個高質量的文章選集,每一篇都引用了很多文章。精選文章中包含內聯引用的句子被標記為正例,沒有內聯引用的句子被標記為負例。使用這些數據,我們基于句子中的詞序列訓練了一個 RNN 分類模型,它能夠預測一個句子為正例(需要引用)還是負例(不需要引用)。最終模型對正例的分類準確率高達 90%。


解釋算法預測


那么為什么模型具有高達 90% 的準確率呢?在決定句子是否需要引用的時候,算法是什么樣子的呢?


為了解釋這些結果,我們對需要引用的句子進行了采樣,并且將模型考慮最多的單詞進行了高亮標注。例如,在陳述「opinion」的例子中,模型將最高的權重給了「claimed,宣稱」一詞。在「statistics,統計」這項引用原因中,對模型最重要的單詞是分析數值時最常用的動詞。在「scientific,科學」引用原因的例子中,模型將更多的注意力給了領域專用的單詞,例如「quantum,量子」。

微信圖片_20190421153425.jpg

模型認為需要引用的句子樣本,關鍵單詞高亮標注。


預測句子引用的原因


更進一步,我們希望模型提供引用原因的完整解釋。我們首先使用 Amazon Mechanical Turk 設計了一個眾包實驗,用來收集引用的理由,并將其作為標注。我們從精選文章中隨機抽取了 4000 個句子,讓眾包工作人員使用我們在之前的研究中識別出的八個原因進行標注。我們發現,當句子與科學或歷史事實相關,或者是直接、間接引語時,我們需要提供引用。

微信圖片_20190421153457.png


我們修改了在之前的研究中所用的神經網絡,以便能夠將無源的句子分類為 8 個引用原因類別中的一個。我們使用眾包標記的數據集重新訓練了這個網絡,發現它在預測引用原因的時候達到了合理的準確率(精度 0.62),尤其是對于具有大量訓練數據的類別。


后續步驟:預測跨語言和主題的「引用需要」


這個項目的下一個階段將會涉及到修改我們的模型,以讓它們能夠為維基百科上的任何一種可用的語言進行訓練。我們將會使用這些跨語言模型來量化維基百科不同版本中未經驗證的內容的比例,并將引文的覆蓋范圍映射到不同的文章主題,以幫助編輯者識別那些非常需要添加高質量引用的地方。


我們計劃盡快提供這些新模型的源代碼。同時,您可以查看我們的研究論文「Citation Needed: A Taxonomy and Algorithmic Assessment of Wikipedia's Verifiability」,這篇論文最近被 The Web Conference 2019 接收,它的補充材料詳細分析了引用政策以及我們用于模型訓練的所有數據。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          国产一区二区三区久久悠悠色av| 你懂的亚洲视频| 国产精品日本欧美一区二区三区| 韩日精品中文字幕| 国产婷婷一区二区| 欧美日韩一区二区视频在线| 狠狠入ady亚洲精品| 国外成人性视频| 亚洲性图久久| 亚洲午夜国产成人av电影男同| 国产欧美日韩三区| 黄色成人在线| 久久久久久亚洲精品杨幂换脸| 日韩一级免费观看| 99精品国产高清一区二区| 一区二区三区国产盗摄| 久久免费国产精品1| 日韩午夜激情电影| 一区二区三区四区五区精品| 女生裸体视频一区二区三区| 久久精品国产一区二区三| 亚洲精品免费一二三区| 欧美精品激情在线| 欧美成人在线网站| 国产欧美日韩在线观看| 一本色道久久99精品综合| 亚洲人永久免费| 国产精品久久婷婷六月丁香| 欧美日韩亚洲综合| 亚洲一区二区三区四区在线观看| 欧美激情第六页| 国产亚洲一区在线| 亚洲国产精品久久| 欧美日韩专区在线| 欧美激情精品久久久久久大尺度| 亚洲精品一品区二品区三品区| 亚洲一区国产精品| 久久久久www| 国产欧美一区二区精品仙草咪| 亚洲图片欧洲图片av| 亚洲一区激情| 国产欧美高清| 亚洲精品免费一二三区| 欧美激情亚洲自拍| 欧美日韩免费精品| 国产精品乱码人人做人人爱| 另类av一区二区| 亚洲激情黄色| 亚洲一区在线免费| 欧美专区中文字幕| 这里只有精品视频在线| 久久女同精品一区二区| 亚洲美女性视频| 久久免费高清视频| 亚洲欧美激情精品一区二区| 亚洲一区二区高清| 欧美制服丝袜| 国产欧美欧洲在线观看| 在线精品视频一区二区三四| 欧美亚洲日本国产| 欧美第一黄色网| 欧美剧在线免费观看网站| 精品成人一区| 亚洲国内精品在线| 国产日韩成人精品| 欧美精品一区在线观看| 欧美日韩大片一区二区三区| 久久综合网络一区二区| 久久久国际精品| 久久午夜视频| 欧美在线999| 欧美91福利在线观看| 亚洲天堂成人| 免费国产自线拍一欧美视频| 蜜臀av性久久久久蜜臀aⅴ| 亚洲一区成人| 欧美国产日韩在线观看| 欧美一区二区三区免费视| 国产日产亚洲精品| 国产欧美不卡| 最新日韩av| 欧美日韩免费精品| 亚洲午夜免费福利视频| 亚洲欧洲日本一区二区三区| 亚洲一级二级| 亚洲欧美福利一区二区| 欧美日韩在线高清| 欧美日韩在线播| 国产亚洲成人一区| 亚洲精品乱码视频| 久久久久综合| 欧美区在线播放| 亚洲素人在线| 久久精品一区二区三区四区| 国产精品视频免费| 亚洲精品乱码久久久久久蜜桃麻豆| 午夜精品久久久久久久久久久久久| 午夜精品久久久久久久久久久久久| 国产精品一区久久| 亚洲无限乱码一二三四麻| 欧美日韩中文字幕在线视频| 一区在线视频观看| 黄色精品网站| 国产精品国产三级国产aⅴ浪潮| 99精品视频一区二区三区| 国产精品夫妻自拍| 一区二区免费在线视频| 亚洲综合色自拍一区| 亚洲精品午夜精品| 嫩草国产精品入口| 欧美成人伊人久久综合网| 伊人精品久久久久7777| 久久亚洲欧美国产精品乐播| 亚洲欧美文学| 国产精品人人爽人人做我的可爱| 亚洲欧洲在线看| 国产亚洲精品一区二555| 国产一级揄自揄精品视频| 亚洲精品麻豆| 亚洲黄色在线观看| 国产美女诱惑一区二区| 亚洲一区二区3| 欧美在线亚洲综合一区| 曰本成人黄色| 99re亚洲国产精品| 亚洲毛片视频| 国产日韩欧美亚洲一区| 久久久国产午夜精品| 亚洲缚视频在线观看| 欧美激情偷拍| 国产三级精品三级| 国产亚洲一区二区精品| 国产农村妇女毛片精品久久麻豆| 国产精品日韩| 亚洲精品人人| 另类天堂视频在线观看| 久久福利视频导航| 136国产福利精品导航网址应用| 欧美日韩在线综合| 欧美精品精品一区| 在线精品视频一区二区| 国产精品人成在线观看免费| 性色一区二区三区| 欧美电影免费观看网站| 在线视频欧美精品| 久久久久久久网| 欧美中文字幕视频在线观看| 国产精品久久久久久久久久直播| 欧美激情国产高清| 欧美片网站免费| 亚洲欧洲中文日韩久久av乱码| 在线视频日韩精品| 欧美女人交a| 欧美深夜福利| 伊人一区二区三区久久精品| 国产精品日韩一区| 国产视频一区在线观看| 麻豆精品网站| 国产精品一区二区三区成人| 欧美成人资源网| 国产亚洲福利| 国产一区二区剧情av在线| 久久精品人人爽| 久久久精品2019中文字幕神马| 亚洲一区二区三区在线播放| 尤物精品国产第一福利三区| 国产精品一区一区| 国产精品免费aⅴ片在线观看| 欧美中日韩免费视频| 亚洲性视频h| 欧美午夜片在线免费观看| 亚洲精品一品区二品区三品区| 欧美精品久久久久久久久老牛影院| 欧美国产在线观看| 亚洲韩国日本中文字幕| 国产精品嫩草久久久久| 国产自产精品| 欧美激情精品久久久久久蜜臀| 99国产精品久久久| 欧美日韩精品免费观看视频完整| 含羞草久久爱69一区| 亚洲一区二区三区三| 国产精品视频999| 在线观看视频一区| 亚洲一区高清| 欧美成年人网| 国产亚洲精品激情久久| 欧美一激情一区二区三区| 久久人人看视频| 一区二区三区日韩欧美精品| 午夜视频久久久久久| 欧美日韩一区在线播放| 欧美欧美天天天天操| 国产精品无码专区在线观看| 欧美主播一区二区三区美女 久久精品人| 亚洲三级色网| 国产亚洲一区在线播放| 亚洲激情视频| 国产精品欧美日韩一区| 国产日本亚洲高清| 国产精品s色| 怡红院av一区二区三区| 亚洲欧美激情四射在线日| 午夜性色一区二区三区免费视频| 亚洲午夜精品17c| 欧美日韩国产精品一区二区亚洲| 亚洲精品一二区| 欧美国产精品久久| 欧美在线电影| 国产精品久久二区二区| 在线免费观看日本欧美| 免费观看国产成人| 欧美视频精品一区| 欧美精品自拍偷拍动漫精品| 美女黄毛**国产精品啪啪| 免费成年人欧美视频| 亚洲精品在线观看免费| 欧美日韩一区二区三区免费| 国产一区二区精品丝袜| 亚洲精一区二区三区| 亚洲深夜福利| 国产精品二区在线观看| 亚洲日本中文字幕免费在线不卡| 亚洲日本中文字幕区| 亚洲私人影吧| 久久久亚洲国产美女国产盗摄| 亚洲婷婷国产精品电影人久久| 欧美成人午夜77777| 欧美日韩成人一区| 久久久久在线| 久久综合网络一区二区| 国产精品99久久久久久久vr| 国产色综合久久| 亚洲图色在线| 麻豆精品精品国产自在97香蕉| 久久久久久欧美| 日韩视频在线一区二区| 伊人伊人伊人久久| 在线亚洲成人| 欧美精品在线免费| 中日韩在线视频| 国产女主播一区二区三区| 国内精品久久久久久久果冻传媒| 国产嫩草影院久久久久| 欧美激情一区二区三区在线视频| 欧美伊久线香蕉线新在线| 国产午夜亚洲精品理论片色戒| 国产精品国产三级国产普通话三级| 亚洲欧美日韩精品久久奇米色影视| 欧美有码在线观看视频| 午夜宅男欧美| 国产一区二区三区在线观看免费视频| 亚洲午夜一级| 激情久久久久久久| 亚洲一区自拍| 欧美巨乳波霸| 欧美激情导航| 久久久久久尹人网香蕉| 亚洲国产美女精品久久久久∴| 欧美成人a视频| 欧美日韩精品综合| 国产日韩精品在线| 欧美在线视频免费播放| 亚洲欧美自拍偷拍| 久久综合图片| 性欧美videos另类喷潮| 亚洲伦理在线| 136国产福利精品导航| 国产亚洲精品久久久| 尤物精品在线| 欧美电影在线免费观看网站| 狂野欧美激情性xxxx| 国产精品日韩二区| 欧美日韩国产精品专区| 亚洲高清三级视频| 国产精品v欧美精品v日本精品动漫| 欧美主播一区二区三区| 国产精品一页| 国产一区二区三区在线观看免费视频| 亚洲欧美成人综合| 你懂的国产精品永久在线| 国产一区二区高清视频| 欧美与欧洲交xxxx免费观看| 国产精品国产三级国产aⅴ无密码| 久久婷婷久久一区二区三区| 国产日韩欧美精品综合| 欧美成人69av| 国产视频综合在线| 欧美极品影院| 久久综合九色99| 国产日产欧产精品推荐色| 欧美日本久久| 欧美主播一区二区三区美女 久久精品人| 国产一区免费视频| 亚洲精品日韩久久| 黄色一区二区三区四区| 国产精品免费视频观看| 欧美性猛交xxxx免费看久久久| 国产欧美日韩另类一区| 久久av老司机精品网站导航| 国产欧美日韩麻豆91| 亚洲婷婷国产精品电影人久久| 亚洲欧美日韩国产成人精品影院| 久久精品国产精品亚洲| 欧美精品久久一区二区| 久久国产66| 亚洲美女91| 999在线观看精品免费不卡网站| 久久伊人亚洲| 亚洲欧美日韩在线一区| 国内欧美视频一区二区| 国产性猛交xxxx免费看久久| 午夜影视日本亚洲欧洲精品| 中文国产一区| 欧美成人网在线| 一区二区在线视频观看| 欧美亚洲成人网| 在线观看久久av| 久久精品麻豆| 亚洲国产成人在线| 亚洲精品女人| 欧美三级韩国三级日本三斤| 欧美成人免费在线观看| 亚洲午夜视频在线观看| 久久不射2019中文字幕| 一二三四社区欧美黄| 欧美精品七区| 久久在线91|