《電子技術應用》
您所在的位置:首頁 > 其他 > 業界動態 > 機器學習基礎:相似度和距離度量究竟是什么

機器學習基礎:相似度和距離度量究竟是什么

2019-10-09

  相似度度量和距離度量在整個機器學習領域都是非?;A的概念,數據科學家 Gonzalo Ferreiro Volpi 近日通過淺顯易懂的推薦系統示例介紹了這些概念以及它們的計算方式。

  在推薦系統中,我們經常談到「相似度度量」這一概念。為什么?因為在推薦系統中,基于內容的過濾算法和協同過濾算法都使用了某種特定的相似度度量來確定兩個用戶或商品的向量之間的相等程度。所以總的來說,相似度度量不僅僅是向量之間的距離。

  注:我的所有工作都可在我的 GitHub 頁面查看:https://github.com/gonzaferreiro,其中當然也包括本文內容的代碼庫以及有關推薦系統的更多內容。

  在任意類型的算法中,最常見的相似度度量是向量之間夾角的余弦,即余弦相似度。設 A 為用戶的電影評分 A 列表,B 為用戶的電影評分 B 列表,那么它們之間的相似度可以這樣計算:

640.webp (23).jpg

  從數學上看,余弦相似度衡量的是投射到一個多維空間中的兩個向量之間的夾角的余弦。當在多維空間中繪制余弦相似度時,余弦相似度體現的是每個向量的方向關系(角度),而非幅度。如果你想要幅度,則應計算歐幾里德距離。

  余弦相似度很有優勢,因為即使兩個相似的文件由于大小而在歐幾里德距離上相距甚遠(比如文檔中出現很多次的某個詞或多次觀看過同一部電影的某用戶),它們之間也可能具有更小的夾角。夾角越小,則相似度越高。

640.webp (22).jpg

  如下例所示,來自 www.machinelearningplus.com

  上圖統計了 sachin、dhoni、cricket 這三個詞在所示的三個文檔中的出現次數。據此,我們可以繪出這三個向量的圖,從而輕松地看出衡量這些文檔的余弦和歐幾里德距離的差異:

640.webp (21).jpg

  按照定義,常規余弦相似度反映了方向的差異,而不是位置的差異。因此,使用余弦相似度指標無法考慮到用戶評分這樣的差異。調整后余弦相似度可以緩解這一問題,具體做法是從每對共同評分的配對減去各自用戶的平均評分,其定義如下:

640.webp (20).jpg

  我們看看下面這個來自 Stack Overflow 的例子,這能更好地解釋余弦相似度和調整過的余弦相似度之間的差異:

  假設一位用戶為兩部電影分別給出了 0~5 的評分。

640.webp (19).jpg

640.webp (18).jpg

  直觀而言,我們可以看到用戶 b 和 c 的品味相近,而 a 則頗為不同。但常規的余弦相似度卻給出了不一樣的結果。在這樣的案例中,計算調整后余弦相似度能讓我們更好地理解用戶之間的相近程度。

640.webp (17).jpg

  順便一提,在上一篇有關推薦系統的文章中,我們給出了以下用于計算調整后余弦相似度的函數:

  from scipy import spatial

  def adjusted_cos_distance_matrix(size, matrix, row_column):

  distances = np.zeros((size,size))

  if row_column == 0:

  M_u = matrix.mean(axis=1)

  m_sub = matrix - M_u[:,None]

  if row_column == 1:

  M_u = matrix.T.mean(axis=1)

  m_sub = matrix.T - M_u[:,None]

  for first in range(0,size):

  for sec in range(0,size):

  distance = spatial.distance.cosine(m_sub[first],m_sub[sec])

  distances[first,sec] = distance

  return distances

  使用這個函數的方式非常簡單,只需輸入:

  matrix:這就是用戶之間的評分或觀點等你衡量的東西或你的業務商品的原始矩陣。

  row_columns:如果你衡量的是列之間的距離,則設為 1;如果你衡量的是行之間的距離,則設為 0;

  size:所得矩陣的所需大小。也就是說,當尋找用戶或商品相似度時,這就是用戶或商品的數量。所以如果有 500 個不同用戶,則距離矩陣的大小就為 500×500。

  下面給出了一個參考示例:

  user_similarity = adjusted_cos_distance_matrix(n_users,data_matrix,0)

  item_similarity = adjusted_cos_distance_matrix(n_items,data_matrix,1)

  最后,我們簡要回顧一些可用在推薦系統中計算相似度的其它方法,但也可用于機器學習中其它任何基于距離的算法:

  1. 歐幾里德距離:如果繪制在 n 維空間中,相似的項取決于彼此之間的相近程度。

    640.webp (16).jpg

  2. 皮爾森相關性或相關相似度:告訴了我們兩個項之間的相關程度。相關性越高,則相似度越高。

640.webp (14).jpg

  3. 均方差:在于計算用戶評分之間的平均平方差。MSE 更側重于懲罰更大的錯誤。

640.webp (13).jpg

  然后:

640.webp (12).jpg

  其中 |??????| 是用戶 ?? 和 ?? 都評價過的商品的數量。

  用戶-用戶以及商品-商品相似度示例

  我們借助之前介紹推薦系統的文章來簡要回顧一下協同過濾的工作方式:假設我喜歡《盲刺客》和《莫斯科紳士》這兩本書;我的朋友 Matias 也喜歡《盲刺客》和《莫斯科紳士》,但也還喜歡《Where the crawdads sing》??雌饋砦遗c Matias 有一樣的興趣。所以你可能會想我也會喜歡《Where the crawdads sing》,即使我還沒讀過它。協同過濾也正是基于這一邏輯,只是你不僅可以比較用戶,也可以比較商品。

  我們可視化地比較看看推薦系統的用戶-用戶相似度與商品-商品相似度之間的差異:

  用戶-用戶相似度

  商品-商品相似度

640.webp (11).jpg

640.webp (10).jpg

  現在,理解了這一點,我們用下面的示例解釋說明一些度量,我認為這清楚辨明了用戶-用戶以及商品-商品相似度:

  用戶-用戶相似度詳解

640.webp (9).jpg

  這里給出了一個用戶電影評分矩陣。為了以更加實用的方式理解這一點,我們先根據上表計算一下用戶 (A, C) 和 (B, C) 的相似度。用戶 A 和 C 共同評分的電影是 x2 和 x4,B 和 C 共同評分的電影是 x2、x4、x5。知道了這些信息后,我們計算皮爾森相關性或相關相似度:

640.webp (8).jpg

  A 和 C 之間的相關性比 B 和 C 之間的相關性大。因此,A 和 C 更相似,A 喜歡的電影會被推薦給 C,C 喜歡的也會被推薦給 A。

  商品-商品相似度詳解

640.webp (7).jpg

  這里的平均商品評分(mean item rating)是給定商品的所有評分的平均(比較看看我們在用戶-用戶過濾中看到的表格)。這里要計算的不是用戶-用戶相似度,而是商品-商品相似度。要做到這一點,我們首先需要找到給這些商品評分過的用戶,然后再基于這些評分來計算這些商品之間的相似度。我們計算一下電影 (x1, x4) 和 (x1, x5) 之間的相似度。給電影 x1 和 x4 評過分的用戶是 A 和 B,而給電影 x1 和 x5 評過分的用戶也是 A 和 B。

640.webp (6).jpg

  x1 和 x4 的相似度大于 x1 和 x5 的相似度。基于這些相似度值,如果有任何用戶搜索電影 x1,他們將被推薦 x4;反之亦然。

  關于推薦系統的內容就到此為止了。但是,請記住相似度度量和距離度量在整個機器學習領域都是非?;A的概念,理解它們對進一步的學習至關重要。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美日本中文字幕| 国产精品一区免费观看| 国产精品视频yy9099| 欧美午夜精品久久久久免费视| 久久久青草婷婷精品综合日韩| 国产精品影视天天线| 国模私拍一区二区三区| 伊人久久久大香线蕉综合直播| 欧美高清在线| 久久久久www| 久久免费99精品久久久久久| 欧美一区二区在线免费播放| 欧美精品日韩综合在线| 国模精品一区二区三区| 久久九九国产精品| 欧美高清在线一区| 欧美精品www| 国产精品丝袜xxxxxxx| 欧美激情精品| 亚洲欧美日韩第一区| 国产在线视频欧美一区二区三区| 国产欧美日韩精品丝袜高跟鞋| 欧美成人第一页| 国产精品国色综合久久| 欧美激情中文字幕在线| 99精品视频一区二区三区| 亚洲毛片一区二区| 中日韩高清电影网| 欧美一区二区女人| 亚洲一区中文字幕在线观看| 亚洲精品国偷自产在线99热| 海角社区69精品视频| 亚洲午夜视频在线| 国产精品大片| 亚洲电影免费在线观看| 一本色道精品久久一区二区三区| 99热免费精品| 国产美女精品人人做人人爽| 久久亚洲综合色一区二区三区| 一区二区不卡在线视频 午夜欧美不卡在| 亚洲国产欧美一区二区三区同亚洲| 一区在线播放| 久久婷婷一区| 国产女优一区| 亚洲一区黄色| 久久人体大胆视频| 国产精品高清一区二区三区| 欧美日韩一卡二卡| 一区二区三区视频在线看| 亚洲第一页中文字幕| 久久精品一区二区三区不卡| 红桃视频国产一区| 国产精品99久久久久久久久久久久| 一片黄亚洲嫩模| 狠狠色狠狠色综合| 久久不见久久见免费视频1| 巨胸喷奶水www久久久免费动漫| 亚洲一区观看| 国产精品国产三级国产aⅴ9色| 国产亚洲欧美一区在线观看| 欧美日韩一区二区三区高清| 欧美日韩精品一区| 亚洲剧情一区二区| 久久久高清一区二区三区| 欧美一区二区私人影院日本| 欧美久久在线| 久久国产精品久久w女人spa| 亚洲狠狠婷婷| 欧美 日韩 国产在线| 亚洲毛片在线观看.| 亚洲高清一区二区三区| 久久夜精品va视频免费观看| 久久久久久久久久久久久久一区| 欧美大片专区| 欧美一区二区在线视频| 国产一区二区精品久久99| 欧美一区二区三区免费观看| 久久精品二区三区| 国产精品一香蕉国产线看观看| 欧美视频在线视频| 欧美激情影院| 欧美激情乱人伦| 欧美日韩在线视频首页| 娇妻被交换粗又大又硬视频欧美| 亚洲一线二线三线久久久| 欧美精品成人91久久久久久久| 国产精品进线69影院| 亚洲一区二区三区在线视频| 国产精品激情电影| 亚洲欧美日韩精品久久奇米色影视| 黄色精品一二区| 国内精品国语自产拍在线观看| 欧美电影免费观看高清完整版| 中文av字幕一区| 一区电影在线观看| 国内精品视频在线观看| 国产日韩高清一区二区三区在线| 亚洲日韩第九十九页| 蜜桃久久av一区| 欧美欧美在线| 国产精品草莓在线免费观看| 久久av老司机精品网站导航| 久久婷婷蜜乳一本欲蜜臀| 久久综合精品国产一区二区三区| 亚洲一区在线免费| 国产日韩欧美视频| 欧美久久久久久| 欧美一区二区三区四区视频| 欧美一区二区福利在线| 亚洲精品久久嫩草网站秘色| 亚洲国产欧美日韩精品| 一区二区三区高清在线观看| 午夜国产精品视频免费体验区| 欧美日韩精品一本二本三本| 国产一区日韩欧美| 亚洲网址在线| 亚洲日韩欧美视频一区| 伊人成年综合电影网| 国产精品久久久久久久久搜平片| 欧美日韩免费观看一区二区三区| 亚洲综合第一页| 亚洲国产二区| 欧美刺激午夜性久久久久久久| 亚洲性视频网址| 国产在线精品一区二区中文| 黄色一区二区在线观看| 亚洲欧美日韩综合国产aⅴ| 久久精品日产第一区二区| 欧美+日本+国产+在线a∨观看| 国产一区二区三区高清在线观看| 久久综合综合久久综合| 亚洲综合社区| 欧美日韩国产一中文字不卡| 欧美日韩八区| 国产目拍亚洲精品99久久精品| 极品少妇一区二区| 亚洲国产va精品久久久不卡综合| 亚洲国内高清视频| 亚洲一区三区在线观看| 国产精品天天看| 久久久精品tv| 国产亚洲欧洲一区高清在线观看| 亚洲精品久久在线| 欧美国产大片| 韩日精品视频一区| 亚洲精品孕妇| 国产精品综合色区在线观看| 久久亚洲精品中文字幕冲田杏梨| 亚洲精品在线三区| 国产精品你懂得| 美女视频黄 久久| 久久综合伊人77777尤物| 国产伦精品一区二区三区视频黑人| 国产精品美女黄网| 久久精品视频在线观看| 亚洲精品视频免费| 亚洲四色影视在线观看| 9l视频自拍蝌蚪9l视频成人| 亚洲激情成人| 久久久久五月天| 99亚洲视频| 狠狠做深爱婷婷久久综合一区| 久久精品观看| 国产麻豆精品久久一二三| 欧美高清自拍一区| 在线亚洲欧美| 欧美电影免费观看高清| 国产精品高潮呻吟久久av黑人| 欧美中文日韩| 亚洲小视频在线观看| 性色av一区二区怡红| 国产精品欧美经典| 欧美日韩视频| 欧美日韩视频在线一区二区| 午夜精品久久久久久久久久久久久| 欧美日韩一区二区视频在线| 一区二区三区在线观看视频| 老色鬼精品视频在线观看播放| 免费中文字幕日韩欧美| 久久av一区| 国产一区二区三区日韩| 亚洲美女91| 国产精品成人aaaaa网站| 免费日韩成人| 久久精品成人一区二区三区| 久久成人综合网| 国产亚洲成精品久久| 亚洲风情亚aⅴ在线发布| 国产综合久久| 欧美搞黄网站| 久久精品日产第一区二区三区| 久久人人看视频| 国内免费精品永久在线视频| 99国产精品视频免费观看一公开| 亚洲黄色在线视频| 久热综合在线亚洲精品| 国产精品一区久久久| 欧美在线网站| 亚洲欧美日韩另类精品一区二区三区| 亚洲国产精品久久久| 国产日韩精品久久| 国产综合在线视频| 亚洲精品123区| 国产精品一区二区欧美| 久久免费国产精品1| 香蕉尹人综合在线观看| 欧美自拍偷拍午夜视频| 麻豆免费精品视频| 久久人人爽人人爽爽久久| 国产精品成人一区二区| 一区二区三区 在线观看视| 欧美日韩国产综合久久| 国内伊人久久久久久网站视频| 亚洲视频中文| 在线亚洲精品福利网址导航| 免费不卡欧美自拍视频| 国产精品久久久久久久久搜平片| 精品成人在线| 巨胸喷奶水www久久久免费动漫| 亚洲日韩欧美一区二区在线| 亚洲人成人99网站| 国产精品制服诱惑| 欧美三级乱码| 在线亚洲+欧美+日本专区| 免费成人高清在线视频| 欧美精品久久久久久久| 亚洲欧洲精品一区二区三区| 老牛影视一区二区三区| 女生裸体视频一区二区三区| 亚洲综合第一页| 欧美国产日韩一区二区三区| 在线综合+亚洲+欧美中文字幕| 欧美天天影院| 欧美激情国产高清| 影音先锋亚洲视频| 久久久久久亚洲综合影院红桃| 欧美电影资源| 一区二区在线视频播放| 日韩性生活视频| 午夜精品成人在线视频| 国产精品爱啪在线线免费观看| 久久久久久久久综合| 久久人人爽爽爽人久久久| 狂野欧美激情性xxxx欧美| 久久精品盗摄| 另类天堂视频在线观看| 免费成人黄色片| 欧美亚男人的天堂| 今天的高清视频免费播放成人| 欧美无砖砖区免费| 日韩视频在线永久播放| 欧美日韩在线一二三| 欧美日韩国产成人在线免费| 欧美在线三区| 亚洲作爱视频| 亚洲欧美文学| 国内精品福利| 亚洲欧美激情诱惑| 免费不卡欧美自拍视频| 欧美在线一级va免费观看| 久久精品国产免费观看| 在线国产日韩| 午夜精品999| 香蕉乱码成人久久天堂爱免费| 蜜桃久久av一区| 影音先锋中文字幕一区二区| 欧美刺激性大交免费视频| 亚洲综合国产精品| 国产精品毛片大码女人| 亚洲无线视频| 一本色道久久综合亚洲精品高清| 一区二区三区亚洲| 欧美日韩精品免费观看视一区二区| 亚洲二区视频| 亚洲美女精品成人在线视频| 亚洲精品视频在线看| 亚洲三级免费| 亚洲美女色禁图| 在线观看一区二区视频| 亚洲美女黄网| 欧美成人一二三| 一区二区三区四区五区视频| 国产精品vip| 国产精品午夜春色av| 一区二区三区无毛| 久久久久久一区| 欧美精品黄色| 欧美在线视频二区| 欧美另类专区| 欧美日韩一区二区三区在线| 亚洲观看高清完整版在线观看| 久久综合色婷婷| 国产日韩一区| 欧美亚洲尤物久久| 一本色道久久精品| 久久久www成人免费无遮挡大片| 欧美一区二区三区四区在线观看| 国产精品久久久久久久久免费樱桃| 欧美日韩亚洲三区| 免费黄网站欧美| 国产精品久久久久久久电影| 久久久国产午夜精品| 欧美日韩综合网| 久久综合色天天久久综合图片| 欧美大片免费观看在线观看网站推荐| 国产精品资源在线观看| 国产欧美日韩综合精品二区| 亚洲日本成人在线观看| 日韩一级大片在线| 国产精品嫩草99av在线| 国产精品二区影院| 欧美性猛交99久久久久99按摩| 国产精品女人网站| 狠狠狠色丁香婷婷综合久久五月| 国产在线精品一区二区夜色| 精品91免费| 一区二区三区在线视频免费观看| 久久久精品五月天| 精品91免费| 免费91麻豆精品国产自产在线观看| 亚洲永久精品大片| 国产精品一区二区黑丝| 欧美aa国产视频| 欧美福利在线| 曰本成人黄色| 亚洲专区免费| 国产人成精品一区二区三| 久久精品国亚洲|