-
生物通官微
陪你抓住生命科技
跳動的脈搏
基于超大核卷積網絡RepLKNet的農業病害識別方法研究
《Scientific Reports》:Research on agricultural disease recognition methods based on very large Kernel convolutional network-RepLKNet
【字體: 大 中 小 】 時間:2025年05月16日 來源:Scientific Reports 3.8
編輯推薦:
為解決傳統卷積神經網絡在小核結構下難以捕捉長程依賴和全局上下文信息的問題,研究人員開展了基于超大核卷積網絡RepLKNet的植物病害識別研究。通過構建包含61類病害的95,865張圖像數據集,采用31×31大核卷積增強特征表征能力,結合遷移學習實現96.03%的整體準確率(OA),較ResNet50提升0.41%。該研究為農業病害智能診斷提供了兼顧全局感知與計算效率的新范式。
農業病害智能診斷的瓶頸與突破
植物病害每年造成全球作物減產高達40%,傳統人工診斷效率低下且依賴專家經驗。盡管深度學習技術已在農業領域廣泛應用,主流卷積神經網絡(CNN)如ResNet、VGG等普遍采用3×3或5×5小卷積核,需要通過堆疊數十層網絡來擴大感受野。這種設計存在固有缺陷:深層網絡易出現梯度消失,且逐層傳遞過程中可能丟失關鍵空間信息,對于葉片上分散的銹斑、不規則霉變等復雜癥狀識別效果有限。
云南農業大學的研究團隊在《Scientific Reports》發表的研究中,創新性地將超大核卷積網絡RepLKNet引入農業病害識別領域。該網絡采用31×31超大卷積核,單層即可覆蓋葉片大部分區域,直接捕捉病害的全局分布特征。研究構建了包含14種作物61類病害的95,865張高質量圖像數據集,通過五折交叉驗證證明模型整體準確率達96.03%,Kappa系數95.86%,較傳統CNN提升顯著。
關鍵技術方法
研究采用Kaggle公開的Plant Diseases Training Dataset,通過400×400像素裁剪和通道歸一化預處理;網絡架構包含Stem層(4層卷積與深度可分離卷積組合)、4個Stage層(含31×31至13×13遞減的RepLK Block和1×1卷積構成的ConvFFN模塊)及Transition層;訓練使用ImageNet預訓練權重,采用AdamW優化器和LambdaLR學習率調度,在RTX 4090顯卡上完成5輪交叉驗證;通過Grad-CAM可視化驗證特征聚焦區域。
研究結果
RepLKNet實驗分析
五折交叉驗證顯示模型OA穩定在95.55%-96.03%(標準差0.17%),AA達94.72%-95.31%,證明超大核卷積能有效平衡各類別識別性能。遷移學習使模型在10個epoch內快速收斂,驗證損失曲線平滑下降至接近零。
消融實驗
將31×31核替換為3×3/5×5核后,OA最大降低1.1%(94.93% vs 96.03%),AA下降1.3%,證實大核設計對提升長程特征提取的關鍵作用。
對比實驗
與Swin Transformer(96.12%)、ResNet50(95.62%)、GoogLeNet(94.98%)等對比,RepLKNet在保持Transformer級全局感知能力的同時,計算效率提升20%;顯著優于VGG16(93.60%)等傳統CNN。
Grad-CAM熱圖可視化
對桃樹褐斑病、甜椒細菌性斑點病等案例的激活圖顯示,模型注意力精準聚焦于病斑邊緣擴散區,超大核能同時捕捉局部紋理變化(如葉脈周圍褪綠)和宏觀分布模式(如傘狀霉層)。
結論與展望
該研究首次系統驗證了超大核卷積在農業病害識別的優勢:31×31核通過單層操作實現傳統CNN需15層堆疊才能達到的感受野,避免深層網絡的信息衰減問題。RepLKNet特有的深度可分離卷積和結構重參數化技術,將31×31核的參數量控制在MobileNetV3水平,為田間實時診斷提供可能。
研究仍存在三方面局限:一是固定尺寸裁剪可能截斷邊緣病斑,未來可結合YOLOv7等檢測算法動態定位感興趣區域;二是大核卷積對早期微小病斑敏感度不足,需探索與GhostNet等輕量化模塊的混合架構;三是當前模型在跨作物泛化性上未充分驗證,需通過對抗訓練增強域適應能力。該成果為農業AI領域提供了新的技術路線,其"全局感知優先"的設計理念可延伸至害蟲識別、作物長勢監測等場景,推動智慧農業從單點突破向系統化應用邁進。
知名企業招聘