1. 高光譜岩性信息提取
8.5.1 方法與流程
8.5.1.1 岩性信息產品生成業務化流程
採用的高光譜岩性信息分類填圖方法:先將成像高光譜數據進行輻射定標、大氣校正、光譜重建等過程得到光譜反射率數據,然後根據礦物特徵吸收峰分布情況對高光譜反射率數據進行波譜降維,對照已有地質圖選取其中的典型岩性並結合像元純凈度指數圖在高光譜數據區域中建立感興趣區,確定岩性分類的先驗樣區,最後用合適的方法進行岩性信息分類填圖,並對結果進行優化操作。岩性信息分類填圖流程圖如圖8.20。
圖8.20 高光譜岩性信息分類填圖流程
8.5.1.2 岩性分類信息提取的高光譜數據預處理
無論是高光譜成像儀還是傳統的多光譜感測器,它們所記錄的數據都是地面觀測目標的反射或輻射能量的光譜輻射絕對值,與地物目標的光譜反射率或光譜輻亮度值是不一致的。因此,輻射定標和光譜重建是地物識別和定量分析不可缺少的環節。只有經過輻射標定、輻射校正和大氣校正,剔除由於大氣散射、吸收、地形起伏及感測器本身不穩定帶來的各種失真,將記錄的圖像值轉換為地面的反照率值,重建像元地面光譜,才能根據光譜特徵,有效地識別地物,反演地物成分。
8.5.1.3 端元選擇
對於一個地區的未知岩性分類信息提取,一般要進行岩性端元信息的提取。所謂端元,指的是成分單一的岩性像元。只有提取出端元才能進一步對研究區域進行岩性信息的分類分析。目前端元選擇的方式概括起來主要有兩種:①根據野外波譜測量或從已有的地物波譜信息庫中選擇端元。通過這種途徑選擇的端元稱為「參考端元」。②直接從待分類岩性的圖像上選擇端元,然後不斷對其修改、調整,確定端元,這種圖像上選擇的端元區域稱為先驗樣區。
野外獲取岩性端元信息一般要經過實地勘察,先選擇好樣區,然後選擇合適的時間進行量測。一般情況下,要求在獲取影像的同時進行地物波譜量測,但這種難度很大,實際應用中很少能做到。通過野外測量方式獲取的參考端元理論上比較精確,但遙感圖像上地物的波譜曲線受到大氣、地形和感測器等的影響,這些與野外實地測量的地物波譜曲線存在很大差別,即使對影像進行各種糾正進一步消除這些因素的影響,也不會與野外測量的地物波譜曲線很好地吻合。對於大部分研究區域而言,有與研究區對應的實際地物波譜庫的區域很少,也很少投入大量人力、物力進行野外波譜測量。因此在缺乏野外波譜測量數據情況下,從影像本身獲取端元是目前獲取端元的主要方式。目前,在端元從影像本身的像元獲取方式中,除了對遙感影像像元的色調、波譜特徵進行目視解譯直接分析外,還可藉助以下分析方法進行。
基於圖像的端元選擇是假定圖像中存在有基本上僅反映一種岩性或礦物光譜的「純像元」或「非混合像元」,用數學方法自動或交互地從圖像中提取這些「純像元」作為端元,用同一類「純像元」的典型光譜或平均像元光譜作為端元光譜。PPI方法由於推出較早,計算簡便直觀,並且處理高光譜數據中使用最廣泛的遙感圖像處理系統ENVI中有該功能,因而得到較廣泛的應用。但是在進行PPI之前,需先對高光譜數據進行降維處理。我們常用的降維處理手段主要是最大雜訊分離(MNF)變換。
(1)最大雜訊分離(MNF)變換
成像光譜的光譜解析度很高,波段多,數據海量,且波段之間的相關性很強,數據冗餘度高,需要在端元選取和礦物識別之前對數據作減維,並弱化雜訊。最常用的方法是「最大雜訊組分變換」。
MNF變換是利用圖像的雜訊組分矩陣(∑N∑-1)的特徵向量對圖像進行變換,使按特徵值由大到小排序的變換分量所包含的雜訊成分逐漸減小,圖像質量順次提高。∑為圖像的總協方差矩陣;∑N為圖像雜訊的協方差矩陣。MNF有兩個重要的性質,一是對圖像的任何波段作比例擴展,變換結果不變;二是使圖像矢量、信息分量和加性雜訊分量互相垂直,達到信息分離的目的。乘性雜訊可通過對數變換轉換為加性雜訊,變換後可針對性地對各分量圖像進行去噪,或舍棄雜訊占優勢的分量,以達到成像光譜數據減維和去噪的目的。
(2)像元純度指數(PPI)分析
基於上述MNF變換,排序低的MNF波段被暫時忽略,僅選擇高序次波段進一步處理。PPI設計指定光譜極值像元,對應為混合光譜端元。通過反復投影n維散點圖到隨機單元矢量來計算PPI。記錄每次投影的極值像元,注記每個像元被標定為極值的總次數。PPI圖像產生,其中,每個像元的DN值對應像元被記錄為極值的次數。這些圖像的直方圖顯示被PPI「擊中」(hit)的分布。從直方圖中選擇閾值,用於選擇最純的像元以保證被分析的像元數最小。這些像元被輸入到分離特定光譜端元的互動式可視化演算法中。
(3)N維可視化(n-Dimensional Visualization)
由於PPI演算法本身確定的並不是最終的端元,而是從圖像眾多像元中選出包含所有端元像元的較小像元子集。所以,一般要將PPI的處理結果輸入到N維可視化(n-Dimensional Visualization)工具中,選擇出最終的端元像元。
在N維可視化中,光譜可視為n維散點圖中的一個點,n是波段數。對給定的像元,n維空間中組成n值的點的坐標是每個波段的光譜反射率。這些點在n維空間的分布可用於估計光譜端元數和它們的純光譜特徵。在兩維空間,如果只有兩個端元混合,混合光譜將落入直方圖的線中。純端元將落入混合線的兩端;如果三個端元混合,混合像元將落入四面體中;余類推。混合的端元落在純端元之間,處在純端元勾畫的多面體中。這種混合光譜的凸面幾何特徵,可用於確定端元光譜數並估算它們的光譜特徵,經過PPI選擇出的潛在端元光譜輸入n維散點圖中進行反復旋轉以識別出純端元。根據前面的分析,較好的端元通常會出現在n維散點圖的頂點和拐角處,當一系列的端元點被確定後,就可以將其輸入到圖像中的感興趣區(ROI),從圖像中提取每個感興趣區平均反射率光譜曲線作為成像光譜礦物填圖的候選端元。
鑒於PPI演算法得出的結果是從圖像眾多像元中選出包含所有端元的較小像元子集(圖8.21),在已有的地質圖中結合PPI結果圖可選取盡量純凈的端元區域作為後期監督分類的感興趣區(ROI,Region of Interest)。
圖8.21 選擇出的純凈像元的波譜曲線
8.5.2 結果與分析
目前,從是否需要先驗樣區可將岩性分類技術分為兩大類:非監督分類和監督分類。非監督分類是指人們事先對分類過程不施加任何的先驗知識,而僅憑數據遙感影像地物的光譜特徵的分布規律,即自然聚類的特性,進行「盲目」的分類;其分類的結果只是對不同類別達到了區分,但並不能確定類別的屬性;其類別的屬性是通過分類結束後目視判讀或實地調查確定的。非監督分類也稱聚類分析。一般的聚類演算法是先選擇若干個模式點作為聚類的中心。每一中心代表一個類別,按照某種相似性度量方法(如最小距離方法)將各模式歸於各聚類中心所代表的類別,形成初始分類。然後由聚類准則判斷初始分類是否合理,如果不合理就修改分類,如此反復迭代運算,直到合理為止。監督分類又稱訓練場地法,是以建立統計識別函數為理論基礎,依據典型樣本訓練方法進行分類的技術。即根據已知訓練區提供的樣本,通過選擇特徵參數,求出特徵參數作為決策規則,建立判別函數以對各待分類影像進行的圖像分類,是模式識別的一種方法。要求訓練區域具有典型性和代表性。判別准則若滿足分類精度要求,則此准則成立;反之,需重新建立分類的決策規則,直至滿足分類精度要求為止(圖8.22)。
圖8.22 地質圖
對原始數據的211個波段進行目視解譯,去掉其中明顯的雜訊波段得到剩下的178個波段,對這178個波段的數據信息用上述方法進行分類得到所需的結果,然後結合各種岩性地質特徵,得知大多數礦物特徵吸收峰均位於1300 nm以後的波段中,故在這178個波段中繼續裁剪得93個波段,並對裁剪結果用相同的方法及參數重新分類,將得到的結果與第一次分類結果進行對比。
8.5.2.1 非監督分類填圖結果
(1)K-Means
預選待分類數據可分為八類,最大迭代次數為2,且設變化閾值為5%,即當每一類像元數變化小於閾值時結束迭代過程,最大允許標准差和最大允許距離誤差不輸入,即所有像元都參與分類。從而,當達到閾值5% 或迭代達到兩次時則分類結束(圖8.23 ,圖8.24)。
圖8.23 所用數據:dts_178,K-Means填圖結果
圖8.24 所用數據:resize_dts_93,K-Means填圖結果
(2)ISODATA
預選待分類數據可分為5~10類,最大迭代次數為2 ,變化閾值為5%,每一類最少含有像元數為500 ,最大允許標准差為10 ,即如果一類的標准差大於10 ,則該類被拆分為兩類。類均值間允許最小距離為5,能夠被合並成對的最大對數為5,即當類均值間距離小於5 時,這一類就會被合並,而合並後的成對類的最大值為5(圖8.25 ,圖8.26)。
圖8.25 所用數據:dts_178,ISODATA 填圖結果
圖8.26 所用數據:resize_dts_93,ISODATA填圖結果
8.5.2.2 監督分類填圖結果
首先,對照地質圖和PPI圖像選取兩種岩性(Cgammabeta:石炭紀黑雲母花崗岩,Cdelta:石炭紀閃長岩)的感興趣區。
(1)平行六面體
設置最大允許標准差(Max stdev from Mean)為1.4(圖8.27,圖8.28)。
圖8.27 所用數據:dts_178,平行六面體填圖結果
圖8.28 所用數據:resize_dts_93,平行六面體填圖結果
(2)最小距離
設置最大標准差為10 ,最大允許距離誤差為2500 ,則分類過程中由兩者中較小的一個判定像元是否參與分類,若一旦大於任何一個值則該像元不參與分類,歸屬為無類別(圖8.29 ,圖8.30)。
圖8.29 所用數據dts_178,最小距離填圖結果
圖8.30 所用數據resize_dts_93,最小距離填圖結果
(3)光譜角制圖
設置最大允許角度為0.05°,即當像元波譜與終端端元波譜間夾角大於0.05°時,則不參與分類(圖8.31 ,圖8.32)。
圖8.31 所用數據:dts_178,光譜角制圖填圖結果
圖8.32 所用數據:resize_dts_93,光譜角制圖填圖結果
(4)光譜信息散度
設置最大散度閾值為0.002(圖8.33)。
圖8.33 所用數據:dts_178,光譜信息散度填圖結果
(5)二值編碼
設置最小二進制閾值為0.95 ,決定了哪些像元參與分類(圖8.34 ,圖8.35)。
圖8.34 所用數據:dts_178,二進制編碼填圖結果
圖8.35 所用數據:resize_dts_93,二進制編碼填圖結果
(6)最小距離(Hymap數據)
該方法需要設置兩個閾值:Max stdev from Mean;Max Distance Error。通過不同的嘗試,針對兩種閾值的設定如圖8.36所示。
圖8.36 局部填圖效果
(7)光譜信息散度(Hymap數據)
該方法需要設置閾值:Maximun Divergence Threshod。通過不同的嘗試,參數設置和填圖效果如圖8.37所示。
圖8.37 Threshod=0.005 時的譜信息散度填圖結果
8.5.2.3 岩性信息填圖結果分析
為了分析高光譜星載模擬數據的岩性填圖效果(圖8.38),可對比研究區的岩性信息分布圖與地質圖逐像素進行對比,如果研究區總的點數為N,地質圖中與岩性信息分布圖的結論相同就認為該點取值1,最後統計結果中1的個數n,這樣岩性信息識別精度可定義為
高光譜遙感技術原理及礦產與能源勘查應用
圖8.38 岩性提取結果圖
筆者發現岩性分類結果與地質圖吻合度達到了89%,對出現誤差的主要原因分析如下(圖8.39):
1)實驗中所用數據是高光譜星載模擬數據,其空間解析度為30m,隨著解析度的降低,單個像元所對應的地面面積將增大,導致每個像元中包含更多的岩性類型,岩性間的影響性也會增加。一方面,由於混合像元的平均效應,目標岩性在像元中的等效豐度會下降,光譜信息減弱。當像元中目標岩性的等效豐度下降到檢出限以下時,岩性將不能被識別,而造成岩性分布區的外圍含量較低的地段和含量較低分布區填繪面積的減少,點狀集群分布區的漏識別,線狀分布區的斷續分布。這種效應相當於檢出限的下降。另一方面,當像元中目標岩性的等效豐度在檢出限以上時,會使面狀岩性分布區的范圍擴大、空洞的充填、相鄰小區的連接,點狀集群分布區的成片,線狀區域的斑點效應。這兩種效應的綜合作用結果,空間解析度的減小則會使強異常區(包括高豐度區和光譜反襯度較高的礦物分布區)范圍的擴大、小區的相連、點群的結合,而使異常更加醒目,但其細節特徵會因此消失;弱異常區(包括低豐度區和光譜反襯度較低的那些岩性分布區)和小異常區面積會縮小或漏檢;線狀異常可能會形成斷續分布的小斑塊而使線狀特徵和其走向變得不清晰。因此,在填圖的細致程度上,解析度越高的數據填圖效果越好,這是造成填圖效果差異的最主要原因之一。
2)輻射校正的精確程度。無論是高光譜成像儀還是傳統的多光譜感測器,它們所記錄的數據都是地面觀測目標的反射或輻射能量的光譜輻射絕對值,與地物目標的光譜反射率或光譜輻亮度值是不一致的。因此,輻射校正和光譜重建是地物識別不可缺少的環節。但校正後數據必然丟失一定的信息,故再進行後續處理也會有一定的誤差。
3)感興趣區的選取是進行監督分類的一個重要環節,但由於一般情況下並不能得到純度足夠高的感興趣區,造成選取的樣區含有多種岩性,從而對後期處理造成不可避免的誤差。
4)在數據一定的情況下,各種分類方法中參數的選取決定了分類效果,但由於無法遍取各種參數進行嘗試,實驗過程中僅是進行有限嘗試後選擇了具有較好的結果的參數,但並不能保證所用參數是最適合的參數。
總之,用高光譜星載模擬數據進行礦物填圖是可行的,它可以在一定程度上對岩性的種類及分布進行識別。
圖8.39 對比地質圖(上圖是下圖黑框中部分)
2. 高光譜影像端元提取
利用ENVI波譜沙漏工具提取影像端元,並利用軟體自帶的波譜庫對端元光譜進行匹配識別,之後利用光譜角制圖法(SAM)對原始數據進行分類,得到一個參考分類結果(圖版3.3),用於選取不同地物的訓練樣本數據和作為本研究分類結果的參考。表7.1為該數據影像灰度值與其地物意義的對照表。
表7.1 類別重定義
註:Value為SAM直接分類的結果;Re-Value為類別重定義的值;Description為類別描述;Count為該類別單元計數。
3. 基於高光譜遙感的三維卷積神經網路分析
高光譜解析度遙感是用很窄而連續的光譜通道對地物持續遙感成像的技術。在電磁波譜的可見光、近紅外、中紅外和熱紅外波段范圍內,採用光譜解析度高達納米數量級的光譜儀在幾十個甚至數百個波段同時對地物進行成像,獲取許多非常窄的連續光譜波段信息,實現了地物空間信息、輻射信息、光譜信息的同步獲取,實質為光譜解析度的不斷提高。由於高光譜遙感影像數據具有豐富的光譜波段信息,其應用領域涉及比較廣,比如在農業遙感監測方面,可利用高光譜遙感數據可以計算歸一化植被指數、葉面積指數、葉綠素含量等信息,可對植物的生長變化、病蟲害及其對土壤的污染程度等進行分析與評估,從而促進農業的優質、高效的發展。據有關報道,自然資源部利用高光譜衛星影像數據已經在林業資源變更調查、自然資源審計、災害應急、地理國情監測以及主要生態功能區植被長勢監測等方面開展了大規模的應用示範。由此可見,高光譜遙感技術已被廣泛應用於實際工作中,且在其他方面諸如海洋水質監測、地質勘探、林業遙感、現代軍事等領域也有著廣闊的應用前景。
圖1 不同光譜解析度遙感影像的對比圖
隨著科學技術的不斷進步與發展,傳統的高光譜影像在地物分類上顯現出許多不足,其特徵能力表達有限、冗餘度高、泛化能力較弱以及分類精度差,已無法滿足當下高精度的分類需求。隨著深度學習的不斷發展,卷積神經網路可以進行監督與非監督的學習,可更深層次處理高光譜遙感影像分類。
卷積神經網路是一種以卷積操作為主的神經網路,常用於提取圖像特徵,可以用作圖像分類、語義分割、圖像生成等功能。由於卷積神經網路具有局部區域鏈接、權值共享、降采樣的結構特點,使得卷積神經網路在提取特徵能力時減少訓練權值個數、減少過度擬合以及較高的泛化能力等特點為高光譜遙感影像分類提供強有力技術支撐,卷積神經網路的輸入層可處理多維數據,分別為一維卷積神經網路(1DCNN)、二維卷積神經網路(2DCNN)以及三維卷積神經網路(3DCNN)。在一維卷積神經網路中,內核沿一個方向移動,在二維卷積神經中,內核在二個方向上移動,而三維卷積神經網路中,內核是在三個方向移動。因此,本文通過研究輸入不同維度的卷積神經網路方法對高光譜遙感影像地物分類進行對比,驗證三維卷積神經網路較其他維度的卷積神經網路在高光譜圖像分類上其特徵提取、冗餘度以及分類種類數量上效果更加顯著。
本文主要研究不同維度的卷積神經網路對高光譜遙感圖像分類的方法。在卷積神經網路中,常以一維卷積神經網路(1DCNN)來獲取高光譜遙感圖像的光譜特徵,以二維卷積神經網路(2DCNN)來獲取空間特徵,以三維卷積神經網路(3DCNN)或以一維卷積神經網路加上二維卷積神經網路(1DCNN+2DCNN)來獲取光譜與空間特徵。利用不同維度卷積神經網路進行高光譜遙感圖像特徵提取的方法,構建了在不同的數據集中包含1DCNN、2DCNN、(1D+2DCNN、3DCNN) 的方法的模型組。
3.1 基於高光譜遙感的一維卷積神經網路(1DCNN)的方法分析
在一維卷積神經網路中是將卷積神經網路的輸入層圖像的所有的像素點會讓卷積神經網路組合成一個行向量,即為一維的維度,可用這一維的維度向量來表示光譜信息。通過卷積層對這輸入層進行兩次卷積之後所提取的像素點,這一過程稱之為一維特徵提取。圖2表示基於高光譜遙感一維卷積神經網路的光譜特徵提取過程。將高光譜遙感影像每一個像素點進行卷積、降采樣、卷積、降采樣這一過程後所提取的的像素點的為光譜特徵提取。
3.2 基於高光譜遙感的二維卷積神經網路(2DCNN)的方法分析
二維卷積神經網路有著長和寬的兩個空間維度,常用來處理圖像空間信息。二維卷積層是通過將輸入層和卷積核做相互運算,並加上一個標量差來得到的輸出。圖3表示基於高光譜遙感的二維卷積神經網路空間特徵提取的過程,將高光譜影像數據每個局部區域通過重復使用卷積核做相互運算而輸出得到在空間維度(寬和長)上某一級的特徵。其也可通過二維卷積神經網路來完成圖像分類的過程。
3.3 基於高光譜遙感的聯合卷積神經網路(1D+2D CNN)的方法分析
聯合卷積神經網路是通過輸入圖像,分別提取光譜特徵以及空間特徵,經過各種卷積合並在一起進行提取的光譜信息,稱之為聯合空譜特徵提取,圖4表示基於高光譜遙感影像聯合提取空譜特徵的過程。即將輸入高光譜影像,分別提取其光譜特徵與空間特徵,然後合並經過卷積層所提取的空譜特徵。
3.4 基於高光譜遙感的三維卷積神經網路(3DCNN)的方法分析
三維卷積神經網路有著高度、寬度以及深度的三個空間維度,在三維卷積神經網路中,內核是沿3(圖像的高度、寬度、深度)個方向移動的。由於它移動是個3D空間,所以輸出值也是按3D空間分布。圖5表示基於高光譜影像直接獲取空譜特徵的 3D CNN 典型模型的過程。即將輸入高光譜影像數據,通過堆疊多個連續的像素而組成的立方體,然後在立方體中運用3D卷積核而提取的特徵。
利用A、B以及C三個數據集,針對高光譜圖像分類進行了實驗,每個數據集影像分類方式都包含一維卷積神經網路(1DCNN)、二維卷積神經網路(2DCNN)、聯合卷積神經網路(1D+2DCNN)以及三維卷積神經網路(3DCNN)的方法執行。
A 數據集由AVIRIS 感測器在某地區松林試驗區採集得到 ,該數據集覆蓋光譜范圍為 0.4-2.5μm,譜解析度為10nm,可提供224個譜段,空間解析度為 20m,數據大小為 145*145,通過刪除覆蓋吸水區域的波段,剩餘為200個,它包含16種農作物類別。
B 數據集由 ROSIS 光譜感測器在某地城鎮集中區採集得到 ,該數據集由 0.43-0.86μm 的 115 個光譜波段構成,每個波段由空間解析度為 1.3m 的 610 340 的像素組成,其中它有 9 個地物類別經過處理後,剩該數據集有103 個光譜波段。
C 數據集由 AVIRIS 光譜儀在某地生態片區採集得到 ,該數據集覆蓋光譜范圍為 0.4-2.5μm,譜解析度為10nm,可提供224個譜段,空間解析度為 18m,每個波段由512 614 個像素構成,共有 13個類別,去掉吸水率和低SNR頻段後,剩餘 176 個波段。圖6、圖7、圖8為不同維度的卷積神經網路的方法在 A、B 以及 C 數據集上的分類圖。
針對不同維度的卷積神經網路方法在三個基準數據集上的實驗結果進行了比較分析,圖6、圖7、圖8為不同維度的卷積神經網路的方法在A、B以及C數據集上的分類圖。在三個數據集分類成果圖中,與1DCNN、2DCNN以及1D+2DCNN的分類圖相比,3DCNN的分類圖不僅包含更加清晰的邊緣,且包含更少的雜訊,更加接近於真實地物圖。通過不同維度的卷積神經網路方法在不同數據集下對應的分類圖對比,證明了3DCNN用於高光譜圖像特徵提取效果更加顯著。
通過以上分析,可以得出結論,利用不同維度卷積神經網路進行高光譜圖像分類的方法相比,三維卷積神經網路(3D CNN)相對其他維度的卷積神經的分類圖的冗餘度、分類種類、地物特徵提取能力都相對較高。因此,利用三維卷積神經網路(3D CNN)的方法進行高光譜遙感圖像分類更優。
參考資料:
[1] 張欣. 基於三維卷積神經網路的高光譜遙感圖像分類技術研究[D].中國科學院大學(中國科學院長春光學精密機械與物理研究所),2021.
4. matlab怎麼讀取高光譜圖像
matlab怎麼讀取高光譜圖像
用fopen打開文件,用fread或者fget讀取數據進行處理
5. 小波變換在高光譜影像處理中的應用
小波分析在遙感圖像處理中的應用起步比較晚,主要是對圖像進行二維小波變換和重構,常用於一般遙感圖像壓縮、圖像去噪、圖像融合、圖像紋理特徵和邊緣特徵分析、圖像插值處理、多衛星數據融合、圖像數據分類等方面。
由於小波變換具有多解析度分析的特點,在時、頻兩域都具有表徵信號局部特徵的能力,對高光譜波譜維進行小波分解能夠同時保留信號高頻與低頻信息,精細地描述光譜的波峰和波谷等曲線特性,自動消除數據中的異常值,大大減少了特徵光譜維數(Kaewpi-jit,2003),因而有利於高光譜後續處理。如基於小波變換,可提取信號在不同分級上的小波分量特徵值,可利用特徵值匹配方法實現了高光譜影像的分類(李新雙等,2006)。結合小波變換的特點和非監督正交子空間迭代分解的方法,也可利用基於光譜維的小波低頻系數特徵或高頻特徵系數,進行混合像元投影迭代分解或亞像素目標識別(吳波等,2005;路威等,2005a)。孫桂玲等(2006)對典型地物的高光譜數據採用小波變換的分析方法,根據小波分解後的高頻信息中包含重要信息的特點,提出了一種能夠比較精確的提取出地物光譜各個吸收帶的中心波長的光譜特徵提取方法。
相對來說,小波變換在高光譜影像處理中主要用於高光譜影像數據的壓縮(王晉等,2006)、融合、去噪(路威等,2005b;吳傳慶等,2005)、影像分類、小波神經網路分類、影像亞像素目標識別、特徵提取等。小波變換在高光譜影像數據的光譜分析和光譜特徵提取中的應用還比較少,這方面應用以對各個像元或參考目標的高光譜數據進行小波變換為基礎,主要用於光譜特徵提取、目標識別與分類和高光譜遙感影像亞像素目標識別。
6. 教你如何用python6個步驟搞定金融數據挖掘預處理
數據預處理沒有標準的流程,通常針對不同的任務和數據集屬性的不同而不同。下面就一起看下常用六大步完成數據預處理。
Step 1:導入相關模塊
Step 2:獲取數據
特徵構造
Step 3:處理缺失值
Step 4:分類數據編碼
創建虛擬變數
Step 5:劃分訓練集和測試集
Step 6:特徵標准化
數據變換十大秘訣
數據變換[1]是將數據集的每個元素乘以常數;也就是說,將每個數變換為,其中,和都是實數。數據變換將可能改變數據的分布以及數據點的位置。
數據標准化[2](有時稱為 z-score 或 standar score)是已重新縮放為平均值為零且標准偏差為1的變數。對於標准化變數,每種情況下的值在標准化變數上的值都表明它與原始變數的均值(或原始變數的標准偏差)的差值。
歸一化數據 是將數據縮放到0到1范圍內。
Binarizing Data
二值化[3]是將任何實體的數據特徵轉換為二值化的向量以使分類器演算法更高效的過程。在一個簡單的示例中,將圖像的灰度從0-255光譜轉換為0-
1 光譜就是二值化。
Mean Removal
去均值法 是將均值從每一列或特徵中移除,使其以零為中心的過程。
One Hot Encoding
獨熱編碼[4]是將分類變數轉換為可以提供給ML演算法以更好地進行預測的形式的過程。
Label Encoding
標簽編碼 適用於具有分類變數並將數據轉換為數字的數據。
fit
transform
詞向量 用於帶有標簽和數字的數據。此外,詞向量可用於提取數據。
獲取特徵名稱
Polynomial Features
多項式特徵 用於生成多項式特徵和交互特徵。它還生成了一個新的特徵矩陣數據,該數據是由所有次數小於或等於指定次數的特徵的多項式組合組成的。
截距項
填補 (如用均值填補缺失值),它用列或特性數據中的平均值替換缺失的值
7. 高光譜數據怎麼獲取啊
如果是遙感影像,那麼就是衛星中感測器獲得的。
如果是地面高光譜數據,就是光譜儀(一種攜帶型儀器)獲得的。
美國ASD公司地物光譜儀,這個公司的儀器。我使用過,挺不錯的。