-
生物通官微
陪你抓住生命科技
跳動的脈搏
基于深度神經網絡的圖像分類器可解釋性新方法:屬性引導相關性傳播(ARP)技術
《Computer Vision and Image Understanding》:Attribute-guided Relevance Propagation for interpreting image classifier based on Deep Neural Networks
【字體: 大 中 小 】 時間:2025年05月07日 來源:Computer Vision and Image Understanding 4.3
編輯推薦:
為解決深度神經網絡(DNN)黑箱問題,研究人員提出屬性引導相關性傳播(ARP)方法,通過從預訓練分類器中學習屬性信息并整合至顯著性圖,顯著提升模型可解釋性。研究結合層間相關性傳播(LRP)算法和正向-正向(FF)訓練策略,在ResNet-50和ViT等模型上驗證了ARP在定位關鍵區域和提供示例圖像方面的優勢,為AI決策透明化提供新思路。
在人工智能蓬勃發展的今天,深度神經網絡(DNN)雖在圖像分類等領域表現卓越,卻因復雜的內部機制被稱為"黑箱"。這種不可解釋性嚴重制約了其在醫療診斷、自動駕駛等關鍵領域的應用。傳統解釋方法如梯度加權類激活圖(Grad-CAM)和層間相關性傳播(LRP)雖能生成顯著性圖,但存在噪聲干擾大、無法揭示深層語義等問題。如何讓AI的決策過程像人類一樣透明可理解,成為制約技術落地的關鍵瓶頸。
針對這一挑戰,某大學的研究團隊在《Computer Vision and Image Understanding》發表創新成果,提出屬性引導相關性傳播(ARP)方法。該方法通過三個關鍵技術突破:1) 在預訓練分類器的特定層添加可訓練屬性層,采用正向-正向(FF)算法進行層間獨立訓練;2) 引入固有類別模式(ICP)增強類間區分度;3) 構建屬性嵌入空間實現關鍵區域與訓練樣本的匹配。研究使用CUB-200-2011和ImageNet數據集,在VGG-16、ResNet-50、ConvNeXt和ViT等模型上驗證效果。
研究結果部分,通過四個維度系統驗證了ARP的優越性:
在指向性游戲測試中,ARP-LRP組合在CUB數據集上達到61.96%的AUC值,較基礎LRP提升9.11個百分點。特別是對于非類別判別性的原始LRP算法,ARP使其顯著性圖獲得類間區分能力。
擾動實驗顯示,ARP-CLRP在ImageNet數據集上取得90.92%的LeRF分數和59.78%的MoRF分數,證明其能準確識別對分類真正關鍵的像素區域。當逐步擾動非關鍵像素時,模型準確率保持穩定;而擾動ARP標識的關鍵區域則導致性能急劇下降。
分割任務評估表明,ARP在像素精度(PA)、平均精度(mAP)和平均交并比(mIoU)三項指標上全面領先。以ConvNeXt-S為例,ARP使mIoU達到0.606,較最優基線提升3.1%,顯示其像素級定位的精確性。
典型案例分析揭示,ARP能有效過濾背景干擾。對于"角海雀"圖像,傳統方法將樹枝誤判為相關特征,而ARP準確聚焦鳥類本體;面對"鏡面倒影"等復雜場景,ARP成功區分實體與倒影,這是現有方法未能實現的突破。
該研究的創新價值體現在三方面:首先,ARP首次實現了解釋過程中多層次語義屬性的自動挖掘與融合;其次,通過提供與顯著性區域相關的訓練樣本,建立了從"可視化"到"可理解"的完整解釋鏈條;最后,方法具有架構普適性,可擴展至Transformer等新型網絡。這些突破為醫療影像分析、工業質檢等需要高可靠性解釋的場景提供了新工具,標志著可解釋AI從"粗粒度定位"邁向"細粒度語義解釋"的新階段。未來通過優化屬性多樣性策略和計算效率,ARP有望成為深度學習模型的標準解釋模塊。
知名企業招聘