《Scientific Reports》:Transfer learning from inorganic materials to ivory detection
編輯推薦:
當前象牙鑒別技術昂貴且具破壞性,為解決此問題,研究人員開展利用拉曼光譜數據和深度神經網絡(DNN)模型鑒別象牙的研究。結果顯示該方法準確率高達 99.7%,還可在無大量訓練數據下實現 92% 的準確率,有助于打擊非法象牙貿易。
在廣袤的地球上,大象曾是陸地的巨無霸,自由漫步在草原和森林。然而,象牙的珍貴卻給它們帶來了滅頂之災。全球象牙貿易成為大象數量銳減的重要因素,現存的非洲草原象(Loxodonta africana)、非洲森林象(Loxodonta cyclotis)和亞洲象(Elephas maximus)都面臨著嚴峻的生存挑戰。雖然國際上禁止了對現存大象象牙的貿易,但隨著全球氣候變暖,西伯利亞永久凍土層加速融化,猛犸象象牙大量現世,其貿易日益猖獗,且與非法象牙貿易相互交織,執法部門難以區分象牙來源的合法性。
傳統的象牙鑒別技術,如 DNA 分析和放射性碳測年,成本高昂且具有破壞性,不僅需要花費大量資金,還得破壞部分樣本才能獲取結果,整個流程耗時久,從樣本采集到最終報告出爐,往往需要數周甚至數月,難以滿足實際執法需求。在此背景下,研究人員迫切需要一種高效、準確且無損的象牙鑒別方法。
蘭卡斯特大學(Lancaster University)的研究人員承擔起了這項艱巨的任務。他們開展了利用拉曼光譜數據和深度神經網絡(DNN)模型鑒別象牙的研究,通過從無機礦物的拉曼光譜數據預訓練模型進行遷移學習(TL),將其應用于生物象牙樣本的分類。
研究結果令人振奮。他們提出的方法在鑒別不同大象物種的象牙時,準確率高達 99.7%,遠高于此前使用的主成分分析(PCA)結合線性判別分析(LDA)的 96.2%。即使不使用象牙數據進行微調,僅利用在無機礦物數據集(如 MLROD)上預訓練的 DNN 模型,準確率也能達到 92%。這意味著在缺乏大量象牙樣本訓練數據的情況下,依然能夠實現較為準確的鑒別。該研究成果發表在《Scientific Reports》上,為打擊非法象牙貿易提供了有力的技術支持。
研究人員主要運用了以下關鍵技術方法:一是拉曼光譜技術,它通過測量激光與物質相互作用時散射光的能量變化,產生物質特定的光譜 “指紋”,從而分析象牙中的生化成分;二是深度神經網絡(DNN),采用卷積神經網絡(CNN)架構進行特征提取和分類,結合不同的聚類方法識別原型;三是遷移學習(TL),借助在大規模無機礦物光譜數據集上預訓練的模型,減少訓練時間和對大量象牙數據的依賴。
研究結果
- 數據:收集了來自亞洲象、非洲象、猛犸象等不同物種的 38 個象牙樣本,共獲得 822 個拉曼光譜數據。同時使用包含約 50 萬個光譜的無機礦物數據集(MLROD)作為對比和預訓練數據。
- 實驗設置:在配備 32GB 內存和 NVIDIA GeForce RTX 3080 GPU 的筆記本電腦上進行實驗。分別設置了 DL 基線、PCA/LDA 基線,并對數據進行了降維、歸一化等預處理。
- 實驗結果:與傳統的 PCA/LDA 方法相比,該研究提出的方法準確性更高。在不同的實驗設置下,如 IDEAL/k - means 和 xDNN/ADP 等方法,都能獲得良好的性能表現。即使不進行微調,模型也能在鑒別未知象牙樣本上發揮作用。
研究結論和討論
這項研究首次證明了利用遷移學習從無機材料數據訓練的模型可用于生物象牙樣本分類,為象牙鑒別提供了高效準確的方法。該方法不僅能快速準確地區分不同物種的象牙,幫助執法部門及時發現非法象牙,還能在缺乏樣本來源信息時,對未知象牙的來源進行可靠預測。同時,基于原型的模型和可視化技術,讓研究人員能夠深入分析決策過程,了解不同大象物種象牙的生化差異。這一成果對打擊非法象牙貿易、保護野生大象種群具有重要意義,也為其他生物樣本的鑒別和相關領域的研究開辟了新的思路,有望在未來得到更廣泛的應用和拓展。