《電子技術應用》
您所在的位置:首頁 > 顯示光電 > 設計應用 > 適合近紅外光譜數據特征的降維方法對比分析
適合近紅外光譜數據特征的降維方法對比分析
2015年微型機與應用第1期
孫文蘋1,宮會麗1,王梅勛2,王麗麗2,徐 碩2
(1.中國海洋大學 信息科學與工程學院,山東 青島 266100; 2.山東臨沂煙草有限公司,山東 臨沂 276000)
摘要: 因近紅外光譜具有波長點多、譜帶歸屬困難、光譜重疊嚴重及光譜分布結構未知等問題,在進行近紅外光譜關鍵特征提取和數據特征空間映射時難以準確獲知合適降維方法。為了解決該問題,本文對比分析了典型線性和非線性降維方法,并用煙葉近紅外光譜數據從數據降維可視化和分類準確性識別率角度分別進行了實驗驗證。結果表明,線性降維算法,特別是PCA、LDA算法,比較適合應用于煙葉近紅外光譜降維分析中,非線性降維算法因其泛化學習能力與推廣能力差以及本征維數估計困難不適合應用于近紅外光譜降維分析。
Abstract:
Key words :

  摘  要: 因近紅外光譜具有波長點多、譜帶歸屬困難、光譜重疊嚴重及光譜分布結構未知等問題,在進行近紅外光譜關鍵特征提取和數據特征空間映射時難以準確獲知合適降維方法。為了解決該問題,本文對比分析了典型線性和非線性降維方法,并用煙葉近紅外光譜數據從數據降維可視化和分類準確性識別率角度分別進行了實驗驗證。結果表明,線性降維算法,特別是PCA、LDA算法,比較適合應用于煙葉近紅外光譜降維分析中,非線性降維算法因其泛化學習能力與推廣能力差以及本征維數估計困難不適合應用于近紅外光譜降維分析。

  關鍵詞: 降維;PCA;LDA;近紅外光譜;小樣本

0 引言

  近紅外光譜(NIR)分析技術是近年來分析化學領域迅猛發展的高新分析技術,越來越受到國內外分析專家的關注,在分析化學領域被譽為分析“巨人”。它的出現可以說帶來了又一次分析技術的革命。近紅外光譜分析技術廣泛應用于農產品、化工、醫藥等領域的質量分析。然而,由于近紅外光譜數據具有高維、譜帶重疊等特征,給提取樣品的關鍵主成分信息帶來了一定程度的困難和挑戰。如何實現高維到低維空間的特征映射關系,選擇合適降維方法顯得尤為重要。近年來,為了解決高維光譜數據降維問題,國內外相繼出現大量的降維算法。主成分分析(PCA)[1]和線性識別分析(LDA)[2]是目前應用最為廣泛的特征提取與數據降維方法之一。但當分析數據集呈現非線性且數據分布明顯彎曲時,采用線性降維方法無法獲取數據非線性結構特征。為了更好地解決該問題,先后有不少非線性降維方法被提出,比較經典的有局部線性嵌入LLE算法、等距離映射方法Isomap算法;另外,Sammon[3]提出了一種非線性映射,即Sammon映射(SM),該算法能夠保持輸入樣本之間的相關距離;Hastie[4]提出了Principal Curves(PC),其定義為通過概率分布或數據云中間的“自洽”光滑曲線;Kohonen[5]基于自組織神經網絡提出Self-organizing Map(SOM)用來保存數據空間的拓撲屬性;Scholkopf[6]應用Mercer核將PCA擴展為Kernel PCA(KPCA),該算法在高維空間中計算主分量,而該高維空間由輸入空間經某種非線性映射得到;Mika等[7]采用相同的思想來非線性擴展LDA,從而提出了Kernel LDA(KLDA)。

  上述這些線性和非線性降維方法各有特性,適合解決不同類型特征數據,對于近紅外光譜而言,需要根據光譜特征找到適合降維和關鍵特征提取方法,因此,本文重點分析近紅外光譜特征,對比分析了線性降維算法與非線性降維算法在提取關鍵數據特征方面的優缺點,獲得一種可行有效的降維方法,并在實際應用中得到較好應用。

1 降維方法

  1.1 線性降維方法

  主成分分析PCA是目前應用最為廣泛的降維方法之一。PCA算法依據的是方差最大化原理,將數據從高維空間向低維空間映射,并使之投影后方向相互正交。主成分大小根據方差大小依次提取。PCA是一種無監督的降維算法,該方法無需考慮數據類別屬性,通過某種線性投影變化獲得綜合變換,綜合變量最大化反應了原始光譜數據中所反映的大致規律。

  線性判別式分析LDA算法是模式識別的經典算法,其基本思想是將高維的模式樣本投影到最佳鑒別矢量空間,以達到抽取分類信息和壓縮特征空間維數的效果,投影后保證模式樣本在新的子空間有最大的類間距離和最小的類內距離,使投影后空間中有最佳的可分離性。但是,PCA和LDA方法中的全局線性屬性限制了它們在非高斯分布數據上的有效性。

  1.2 兩種線性方法的區別

  PCA算法是在數據空間中找出一組向量,用此向量盡可能地表達數據的方差,將數據從高維降到低維,其利用K-L變換獲得逼近原數據空間的最低維識別空間。LDA算法也是一種線性降維方法,它基于分類的思想對數據進行降維,即它希望降維后的數據在分類后間距盡可能的大。

  1.3 兩種線性方法的結合PCA+LDA

  根據PCA與LDA的特點,可將二者進行結合使用。設訓練樣本為xi∈Rm×n,i=1,2,…,N,N表示訓練樣本數,訓練樣本的協方差矩陣Q為XXT,然后計算協方差矩陣的特征值與特征向量,并取其較大d個特征值對應的特征向量,組成PCA算法的特征子空間W1;在樣本數小于樣本維數時,直接運用LDA算法會出現小樣本問題,即Sw奇異,此時無法求出Sw-1Sb的特征向量,其中Sw為類內散布矩陣,Sb為類間散布矩陣。依據PCA算法的特征子空間W1,結合使用PCA、LDA算法時Sw與Sb分別定義為:

  Sw=W1TXwXwW1

  Sb=W1TXbXbW1

  然后,求解矩陣Sw-1Sb的特征值問題。這里選擇Sw-1Sb的P個較大特征值對應的特征向量構造LDA算法的特征子空間W2,將PCA算法與LDA算法的特征子空間進行融合,即WS=W1W2,可獲得PCA-LDA算法的融合特征空間WS,使用得到的WS作為PCA-LDA算法的特征空間進行運算。

  1.4 非線性降維方法

 ?。?)LLE算法

  局部線性嵌入(Locally Linear Embedding,LLE)算法是流形學習中非線性降維方法中最為經典的算法之一,能夠使降維后的數據較好地保持原有流形結構,并找到每個樣本的k個最近鄰域。

 ?。?)ISOMAP

  如果數據采自一個蛋卷形的流形,兩點間的歐式距離不能真實反應兩點間的關系,而兩個點之間沿著蛋卷的最短距離即geodesic距離可以更好地反應這兩個點之間的關系。ISOMAP的主要思想就是利用點之間的geodesic距離來代替點之間的歐氏距離,然后用Metric MDS計量多元尺度算法進行數據降維。ISOMAP對數據的整體平移、旋轉和翻轉具有不變形的特性,并且它最后也歸結為特征值和特征向量的計算問題,它具有發現高維空間低維流形的能力。

 ?。?)KPCA(Kernel-PCA)

  KPCA算法是基于核函數的思想對PCA算法進行改進,它不會顯著增加計算的復雜度,并且繼承了PCA算法可以得到全局最優解的特性,另外它可以求解非線性問題。其算法思想大致如下:假設有m個數據x1,x2,…,xm,當這些數據在n維空間中線性不可分時,希望通過一個映射將數據從n維空間映射到N(N>n)維空間中,使得數據在N維空間中是線性可分的,這樣,當使用PCA在N維空間對數據進行降維時可以得到更好的結果。實踐發現,當對數據處理時,經常會出現求兩個向量點積的形式,即椎(xi)T(xj)的形式,于是,可以用一個函數來代替這種點積計算,即尋找一個函數,使得K(xi,xj)=(xi)T(xj),這樣可以把求點積的運算轉化為求函數值的問題。這里的函數K(xi,xj)便稱為核函數。

2 實驗部分

  2.1 材料和儀器

  為了獲得有效的近紅外光譜數據降維方法,挑選了134個有代表性的復烤片煙,包含福建、云南、山東3個質量差異明顯的產區。這些煙葉樣品的近紅外光譜采用FOSS近紅外分析儀NIRS DS2500采集,該設備波長范圍400~2 500 nm,數據采樣間隔0.5 nm。

  2.2 環境條件

  為了保證近紅外光譜數據采集的準確性和穩定性,需具有良好的環境溫濕度條件,空氣相對濕度范圍保持20%~70%,溫度范圍為20℃~26℃,樣品檢測過程中門窗處于關閉狀態,確保每小時的溫度變化不大于1℃,濕度變化不大于2%。

  2.3 樣品前處理

  將挑選的134份來自三個不同產區的煙葉樣品進行抽樣、去梗等前處理,然后在烘箱中以60℃、4 h條件烘干(含水量約為4%~8%),從烘箱中取出烘好的樣品馬上磨粉,過篩40目,裝入密封袋中密封并常溫下避光貯存。

  2.4 光譜數據采集

  每份煙葉粉末樣品稱重20~25 g,采用漫反射的方式掃描,每個樣本重復裝樣3次,取平均光譜作為該樣品的最終近紅外光譜。

  2.5 實驗驗證分析

  2.5.1五種降維算法的數據可視化結果

  本實驗中,分別采用PCA、LDA、LLE、ISOMAP、KPCA 5種降維算法對134份煙葉粉末樣品近紅外光譜數據在MATLAB平臺下進行降維分析,降維因子數為10個,其獲得數據可視化結果如圖1~圖5(其中橫軸表示降維后第一主成分的得分,縱軸表示降維后第二主成分的得分)。

001.jpg

  從數據的可視化結果來看,LDA算法在水平與垂直方向都可以把產區分開,PCA、LLE、ISOMAP可以在某些方向上把產區分開,Kernel-PCA可以在某些區域內把產區分開。

  2.5.2 分類結果

  從降維后的可視化結果中可看出5種算法的不同性能,此外,本文從另外一個角度——分類器正確識別率來判斷算法的適合性。從三個產區中分別隨機選取部分樣本作為測試樣本,訓練樣本與測試樣本的組成結構如表1所示。如果測試樣本經過分類器分類之后可以正確識別出產區信息,則認為是正確識別。實驗過程中主因子數采用1~10,對5種降維算法分別進行KNN分類,不同算法采用不同主因子數得到的正確識別率如表2所示。

002.jpg

  由表2可以看出:(1)LDA具有最好的對煙葉產區分類功能,其次是PCA和ISOMAP,LLE對于產區分類的效果不理想,由此可以推測煙葉近紅外光譜在高維空間的分布情況;(2)特征空間維數對產區的正確識別率有一定的影響,并不是特征空間的維數越多對產區分類越好,這表明在特征提取時部分維數信息對于產區的分類是具有干擾性的。

3 結論

  本文著重對比分析了線性與非線性的數據降維方法在煙葉光譜中的應用。在對5種降維算法的分析中可以看出,PCA和LDA降維算法在煙葉近紅外光譜圖方面相對其他的降維算法有較好的分類性能,而且特征空間的維數對產區分類有一定的影響,合適的特征空間維數能夠進行較好的分類。本文的分析結果與專家評吸的結果相一致,對降維算法的研究可為實際應用中降維算法的選擇提供重要的參考依據。

參考文獻

  [1] HOTELLING H. Analysis of a complex of statistical variables into principal components[J]. Journal of Educational Psychology, 1933,24:417-441.

  [2] FISHER R A. The use of multiple measurements in taxonomic problems[J]. Annals of Eugenics, 1936,7(2):179-188.

  [3] SAMMON J J W. A nonlinear mapping for data structure analysis[J]. IEEE Trans on Computers,1969,18(5):401-409.

  [4] HASTIE T. Principal curves and surfaces[D]. California:

  Stanford Univ, 1984.

  [5] KOHONEN T. Self-organizing Maps[J]. Journal of Mathematical Modelling and Algorithms,2008,7(4):371-387.

  [6] SCHOLKOPF B, SMOLA A, M?譈LLER K R. Nonlinear component analysis as a kernel eigenvalue problem[J]. Neural Computation, 1999(10):1299-1319.

  [7] MIKA S, RATSCH G, WESTON J, et al. Fisher Discriminant Analysis with Kernels[C]. Proc. IEEE Workshop Neural Networks for Signal Processing, 1999,25: 41-48.


此內容為AET網站原創,未經授權禁止轉載。
热re99久久精品国产66热_欧美小视频在线观看_日韩成人激情影院_庆余年2免费日韩剧观看大牛_91久久久久久国产精品_国产原创欧美精品_美女999久久久精品视频_欧美大成色www永久网站婷_国产色婷婷国产综合在线理论片a_国产精品电影在线观看_日韩精品视频在线观看网址_97在线观看免费_性欧美亚洲xxxx乳在线观看_久久精品美女视频网站_777国产偷窥盗摄精品视频_在线日韩第一页
  • <strike id="ygamy"></strike>
  • 
    
      • <del id="ygamy"></del>
        <tfoot id="ygamy"></tfoot>
          <strike id="ygamy"></strike>
          欧美日韩高清区| 99国产麻豆精品| 亚洲精品久久久久久久久久久| 国产精品亚洲第一区在线暖暖韩国| 米奇777在线欧美播放| 欧美专区在线观看| 午夜精品美女久久久久av福利| 亚洲国产精品ⅴa在线观看| 欧美综合激情网| 一区二区视频欧美| 伊人春色精品| 母乳一区在线观看| 久久xxxx| 一区二区三区国产精华| 国产视频久久| 国产一区二区三区四区在线观看| 亚洲天天影视| 老司机午夜免费精品视频| 欧美日韩一级视频| 久久精品国产亚洲aⅴ| 午夜在线视频一区二区区别| 亚洲一二三区视频在线观看| 日韩午夜在线电影| 一区二区在线看| 欧美不卡激情三级在线观看| 欧美在线高清视频| 黄色影院成人| 亚洲国产一区二区三区青草影视| 亚洲已满18点击进入久久| 国产精品系列在线播放| 在线观看亚洲一区| 欧美一区二区在线观看| 欧美人妖另类| 欧美国产三级| 海角社区69精品视频| av不卡在线看| 久久人人爽爽爽人久久久| 欧美成人在线免费视频| 亚洲清纯自拍| 欧美久久久久久久| 蜜臀av国产精品久久久久| 久久爱另类一区二区小说| 国产精品一区二区久久国产| 国产精品入口麻豆原神| 欧美日本高清一区| 欧美日本一区二区高清播放视频| 国产精品xxxav免费视频| 在线看片成人| 亚洲第一福利在线观看| 国产欧美综合一区二区三区| 国产精品视频区| 日韩视频免费观看高清完整版| 久久精品99久久香蕉国产色戒| 欧美1区2区视频| 亚洲国产成人久久综合一区| 国产综合久久久久影院| 午夜视频在线观看一区| 亚洲专区一区二区三区| 午夜在线播放视频欧美| 免费在线视频一区| 免费在线观看日韩欧美| 久久久久久69| 一区二区三区在线观看欧美| 欧美国产91| 亚洲一区二区三区免费观看| 国产精品一级| 久久国产精品久久久久久| 久久亚洲视频| 亚洲国产片色| 亚洲精品中文字| 久热成人在线视频| 国产真实精品久久二三区| 欧美区在线播放| 中文高清一区| 亚洲欧美制服中文字幕| 欧美国产丝袜视频| 亚洲美女网站| 久久精品亚洲热| 一区二区三区在线视频观看| 日韩亚洲一区二区| 国产精品爱久久久久久久| 亚洲国产日韩欧美一区二区三区| 亚洲人成网站色ww在线| 免费国产一区二区| 国际精品欧美精品| 欧美日韩一区二区精品| 国产伦精品一区二区三区高清| 在线成人国产| 亚洲激情图片小说视频| 欧美三级乱码| 裸体一区二区| 亚洲欧洲在线播放| 久久精品国产99国产精品| 亚洲永久在线观看| 一本久道久久综合狠狠爱| 91久久在线播放| 亚洲高清一区二区三区| 欧美日韩麻豆| 欧美大片免费| 亚洲伊人观看| 亚洲精品永久免费精品| 国产色产综合色产在线视频| 久久综合九色| 国产精品综合色区在线观看| 久久视频国产精品免费视频在线| 欧美日韩www| 欧美午夜激情小视频| 亚洲精品综合久久中文字幕| 国产日韩一区二区三区| 国产精品理论片| 欧美性猛交一区二区三区精品| 亚洲精品黄色| 最新69国产成人精品视频免费| 久久综合精品一区| 中文欧美字幕免费| 国产精品一区二区视频| 欧美a级片一区| 亚洲综合色噜噜狠狠| 亚洲精品一区二| 欧美午夜在线| 国产精品观看| 国产精品永久| 老司机精品视频一区二区三区| 欧美亚洲在线观看| 一本色道久久88亚洲综合88| 欧美韩日亚洲| 午夜影视日本亚洲欧洲精品| 欧美在线日韩精品| 国产综合在线视频| 你懂的成人av| 国产在线视频欧美一区二区三区| 欧美日本在线视频| 欧美高清在线视频观看不卡| 亚洲国产成人精品久久久国产成人一区| 久久久久久噜噜噜久久久精品| 国产女主播一区二区| 久久久久国产免费免费| 午夜综合激情| 欧美精品国产一区| 亚洲国产天堂久久综合| 欧美高清你懂得| 国产精品日韩欧美一区二区| 亚洲在线一区二区| 亚洲日韩中文字幕在线播放| 久久精品人人做人人爽电影蜜月| 国产又爽又黄的激情精品视频| 午夜国产精品影院在线观看| 激情亚洲成人| 久久精品亚洲精品国产欧美kt∨| 性刺激综合网| 亚洲国产经典视频| 欧美丝袜一区二区| 红桃视频国产一区| 国外成人在线视频| 欧美日韩亚洲一区二区三区在线观看| 国产精品久久久久毛片大屁完整版| 久久久国产精品亚洲一区| 国产精品乱码| 好吊日精品视频| 午夜精品久久久久99热蜜桃导演| 欧美一进一出视频| 精东粉嫩av免费一区二区三区| 一区二区三区精品国产| 欧美一区观看| 亚洲欧美在线一区二区| 亚洲第一综合天堂另类专| 亚洲免费高清| 亚洲天堂黄色| 亚洲欧美综合v| 国外成人在线| 午夜一级在线看亚洲| 在线视频国内自拍亚洲视频| 新片速递亚洲合集欧美合集| 免费欧美在线| 国产欧美欧洲在线观看| 久久国产精品色婷婷| 久久国产精品一区二区三区| 欧美一区91| 国产精品国产精品国产专区不蜜| 亚洲国产日韩美| 亚洲国产一区二区精品专区| 国语精品中文字幕| 久久久伊人欧美| 国产一区二区中文字幕免费看| 久久综合福利| 夜夜精品视频一区二区| 亚洲欧美国内爽妇网| 在线视频一区观看| 麻豆久久婷婷| 毛片av中文字幕一区二区| 欧美大片va欧美在线播放| 国产精品国产| 国产永久精品大片wwwapp| 欧美一级久久久久久久大片| 亚洲男女自偷自拍图片另类| 亚洲国产cao| 狠狠色综合网站久久久久久久| 久久gogo国模啪啪人体图| 国产精品自拍小视频| 亚洲国产精品传媒在线观看| 国内精品久久久久影院优| 国产精品久久久久久久午夜| 午夜精品视频在线观看一区二区| 99v久久综合狠狠综合久久| 欧美第一黄网免费网站| 久久精品一二三| 欧美国产日韩一区二区三区| 久久精品综合网| 欧美亚洲一区二区在线| 欧美日韩1080p| 国产乱码精品一区二区三区五月婷| 亚洲国产精品小视频| 国产精品欧美日韩一区二区| 国产一区二区看久久| 欧美一级视频| 欧美日本三区| 久久久精品国产免大香伊| 国产资源精品在线观看| 国产精品自拍视频| 亚洲欧美清纯在线制服| 久久久久久久久久久成人| 亚洲欧美日韩成人高清在线一区| 亚洲欧洲一区二区三区在线观看| 99re6热只有精品免费观看| 国产精品一区二区a| 影音先锋欧美精品| 好吊成人免视频| 国产日韩欧美综合精品| 欧美一区二区啪啪| 久久久精品日韩欧美| 久久久久国产免费免费| 亚洲每日更新| 欧美在线精品免播放器视频| 国产精品久久久久免费a∨大胸| 国产精品成人一区二区艾草| 中日韩高清电影网| 欧美精品一区二区久久婷婷| 欧美日韩无遮挡| 亚洲精品免费电影| 亚洲人成网站在线播| 国产精品一区一区| 亚洲综合清纯丝袜自拍| 亚洲午夜在线观看| 快射av在线播放一区| 欧美午夜免费电影| 国产精品视频第一区| 国产日产亚洲精品| 亚洲欧美一区二区精品久久久| 久久精品国产一区二区电影| 国产精品久久久久99| 欧美色图五月天| 国产欧美一区二区精品仙草咪| 国产视频精品va久久久久久| 99精品热6080yy久久| 国产日韩欧美在线一区| 国产精品日韩欧美一区二区| 亚洲性线免费观看视频成熟| 一区二区三区四区在线| 欧美美女日韩| 一区精品在线| 国产精品你懂的在线欣赏| 久久精品在线视频| 欧美色大人视频| 亚洲国产视频直播| 暖暖成人免费视频| 日韩图片一区| 亚洲综合精品自拍| 欧美激情一区二区三区蜜桃视频| 黄网站免费久久| 亚洲一区二区三区在线播放| 亚洲欧美久久久| 国产美女精品视频| 亚洲人妖在线| 毛片一区二区| 91久久精品一区| 黄色成人小视频| 国产精品久久97| 欧美日韩一区二区三区免费| 嫩草伊人久久精品少妇av杨幂| 欧美日韩国产一区精品一区| 欧美一区二区三区免费观看视频| 久久理论片午夜琪琪电影网| 欧美日韩福利在线观看| 99国产精品一区| 久久精品国语| 久久久久一区二区三区四区| 欧美精品少妇一区二区三区| 久久久www成人免费精品| 国产欧美午夜| 久久影视精品| 亚洲午夜女主播在线直播| 中文av一区特黄| 亚洲黄色在线| 亚洲精品一区二区三区婷婷月| 欧美a级片网站| 国产精品青草综合久久久久99| 黄色精品一二区| 欧美视频在线观看| 另类酷文…触手系列精品集v1小说| 性欧美大战久久久久久久免费观看| 99精品国产一区二区青青牛奶| 国内精品久久久久久| 欧美午夜精品久久久久久人妖| 亚洲人成免费| 国产婷婷色一区二区三区四区| 午夜视频在线观看一区二区| 性视频1819p久久| 久久久精品日韩欧美| 一区二区免费在线播放| 99精品欧美一区| 国产综合色在线视频区| 狠狠色噜噜狠狠色综合久| 一区二区三区国产在线| 亚洲欧美视频一区二区三区| 亚洲午夜视频| 久久久久久久网| 亚洲欧美视频一区| 国产真实乱偷精品视频免| 欧美韩日高清| 欧美黑人国产人伦爽爽爽| 国产精品家教| 最新热久久免费视频| 国产在线观看91精品一区| 国产精品美女久久久久久久| 久久精品视频免费观看| 亚洲天堂网站在线观看视频| 国产精品免费福利| 久久成人免费|