《European Journal of Agronomy》:Comparative analysis of the effects of different dimensionality reduction algorithms on hyperspectral estimation of total nitrogen content in wheat soils
編輯推薦:
為解決土壤全氮含量傳統檢測方法的弊端及高光譜技術應用難題,研究人員開展不同降維算法對小麥土壤全氮含量高光譜估算影響的研究。結果顯示,PCA、SVD 等降維算法影響顯著,MSC+SVD+SVR 為最優模型組合,為精準農業提供理論支持。
在廣袤的農田里,小麥的茁壯成長離不開土壤中充足的養分,而氮元素,無疑是其中的關鍵角色。土壤氮素供應水平直接關乎冬小麥的生長、發育以及最終的產量。然而,當下農業生產中,氮肥的過度使用卻引發了一系列問題。過多的氮肥不僅讓土壤中的重金屬毒性增加,抑制了土壤微生物的活性,還使得土壤酸化加劇,肥力下降。同時,大量的氮肥使用還導致農田 N?O 排放顯著增加,間接碳排放量也隨之上升,對生態環境造成了不小的壓力。
傳統測定土壤全氮含量的方法雖然精準,但操作過程繁瑣,檢測成本高昂,而且還會使用一些有害或有污染的化學試劑。在這樣的背景下,高光譜分析技術憑借其快速、高效的特點,成為了檢測土壤氮含量的新希望。不過,高光譜技術在實際應用中也面臨著數據量龐大、計算復雜的挑戰。為了克服這些問題,研究人員需要探索更有效的數據處理方法。
在這樣的迫切需求下,山西農業大學的研究人員挺身而出,針對山西省晉中地區不同施氮水平的小麥田土壤展開了深入研究。他們將多種數據處理手段相結合,致力于找出最佳的高光譜估算模型,為精準農業提供有力的理論支持。這項研究成果發表在了《European Journal of Agronomy》上,在農業領域引起了廣泛關注。
研究人員在本次研究中,綜合運用了多種技術方法。首先,他們采用了六種不同的預處理方法對數據進行初步處理。接著,運用主成分分析(PCA)、奇異值分解(SVD)、無關變量消除(UVE)和隨機森林(RF)這四種降維算法對高光譜數據進行降維處理 。之后,利用支持向量回歸(SVR)、反向傳播神經網絡(BPNN)構建估算模型,并與梯度提升決策樹(GBDT)模型進行對比分析。在整個研究過程中,研究人員采集了來自山西省晉中地區孟家莊示范基地不同土層深度的土壤樣本,為研究提供了豐富的數據支持。
下面我們來詳細看看研究結果:
- 降維算法特征提取差異:PCA 和 SVD 在對高光譜數據進行降維時,產生了相同的主成分和累積貢獻率。這表明這兩種算法在提取數據主要特征方面具有相似性,能夠有效壓縮數據維度,保留關鍵信息。而 UVE 選擇的特征波段數量遠少于 RF。RF 選擇的特征波段覆蓋了可見光、近紅外和中紅外波長范圍,UVE 選擇的特征波段大多位于可見光波長范圍內。這說明不同的降維算法在選擇特征波段時各有側重,反映出它們對數據特征的挖掘方式存在差異。
- 模型精度比較:經過 PCA 和 SVD 降維后的建模結果較為相似,這進一步證實了二者在數據處理和特征提取上的相似效果; RF 選擇波段構建的模型與全光譜波段建模相比,變化較小,說明 RF 選擇的波段能較好地代表全光譜信息。在眾多模型組合中,利用乘法散射校正(MSC)預處理和 SVD 降維構建的 SVR 模型,在估算土壤全氮含量方面表現最為出色,其相關系數(Rc2=0.87,Rv2=0.85)、均方根誤差(RMSEc=0.13,RMSEv=0.14)、相對分析誤差(RPDc=2.82,RPDv=2.55)以及平均絕對誤差(MAEc=0.10,MAEv=0.10)等指標都顯示出該模型具有較高的準確性。
綜合研究結論和討論部分來看,此次研究意義重大。降維算法在土壤全氮含量高光譜估算模型的發展中起著關鍵作用。特征提取算法(PCA 和 SVD)相較于特征選擇算法(UVE 和 RF),在提高光譜建模準確性方面效果更為顯著。研究確定的最優估算模型組合 MSC+SVD+SVR,為今后快速、準確地檢測小麥田土壤全氮含量提供了有力的技術支持。這不僅有助于農民更加精準地進行施肥管理,避免因氮肥使用不當造成的環境污染和作物生長問題,還能為精準農業的發展提供重要的理論依據,推動農業生產朝著更加高效、綠色的方向邁進,讓我們在守護土地資源和保障糧食安全的道路上又邁出了堅實的一步。