-
生物通官微
陪你抓住生命科技
跳動的脈搏
基于輕量化改進YOLOv8n模型的邊緣設備部署實現高精度Orah果實實時檢測
《Artificial Intelligence in Agriculture》:Accurate Orah fruit detection method using lightweight improved YOLOv8n model verified by optimized deployment on edge device
【字體: 大 中 小 】 時間:2025年05月15日 來源:Artificial Intelligence in Agriculture 8.2
編輯推薦:
本研究針對柑橘類水果采摘環節勞動強度大、傳統機器視覺方法在復雜果園環境中適應性差的問題,提出了一種輕量化改進的YOLOv8n模型。通過引入ADown模塊、C3_DualConv模塊、BiFPN結構和CA注意力機制,結合Focaler-MPDIoU損失函數,在保持4.1MB模型體積下實現97.7%的檢測精度和30fps實時性能,為基于邊緣設備的智能采摘機器人提供了關鍵技術支撐。
【研究背景】
在中國這個全球最大的柑橘生產國,2023年柑橘產量高達6433.76萬噸,其中Orah果實因其獨特風味成為南方重要經濟作物。然而傳統采摘作業50%-70%工作量集中在收獲環節,完全依賴人工。雖然學者們嘗試用LBP特征+SVM等傳統機器視覺方法(如Zhuang等2018年86%識別率),但存在光照敏感、遮擋處理能力弱等缺陷。近年來YOLO系列模型在農業檢測中展現優勢,但如何在保持精度的前提下實現邊緣設備部署仍是關鍵挑戰。
【研究方法】
廣西某研究團隊通過iPhone 12 Pro Max和華為Honor 10采集844張Orah果實圖像,經翻轉、旋轉等數據增強至3376張,按7:1.5:1.5劃分數據集;赮OLOv8n模型進行五項改進:(1)用ADown模塊替換部分卷積層減少87.1%模型體積;(2)設計C3_DualConv雙卷積瓶頸增強遮擋特征提;(3)引入含P2層的BiFPN結構優化多尺度特征融合;(4)在P3-P5特征層添加CA(Coordinate Attention)坐標注意力機制;(5)采用Focaler-MPDIoU聯合損失函數提升密集遮擋檢測。最終模型通過TensorRT Python API部署至Nvidia Jetson Orin Nano邊緣設備。
【研究結果】
模型性能驗證
改進后模型參數量降至1.9M(減少36.88%),FLOPs 5.7G(降29.63%),在保持4.1MB體積下實現97.7%精度(P)、95.7%召回率(R)和98.8% AP@0.5。熱圖分析顯示C3_DualConv使注意力更聚焦果實核心區域(圖12),CA機制顯著增強邊緣特征識別(圖14)。
對比實驗
相較于YOLOv8n基線模型,改進模型P提升1.4%,F1提高0.14%。在邊緣設備部署后,經TensorRT優化使推理速度提升58.11%至35.57fps(表6),實時檢測中未出現精度損失(圖21)。
實際應用驗證
使用RealSense D455工業相機采集的測試集顯示平均97.4% P和98.76% AP@0.5(表7),在背光、枝葉遮擋等復雜場景下保持穩定性能(圖22)。
【結論意義】
該研究通過模塊化輕量化設計,在YOLOv8n中實現精度與效率的平衡。特別地:
? ADown模塊通過最大池化與卷積雙路徑(公式1-4)實現高效下采樣
? C3_DualConv中3×3與1×1卷積組合(圖7)提升局部特征提取
? BiFPN加入P2高分辨率層(圖8B)增強多尺度融合
? CA機制通過坐標嵌入(圖9)擴大感受野
? Focaler-MPDIoU(公式9)優化困難樣本處理
雖然模型在極端遮擋下召回率略有下降,但4.1MB體積和30fps性能使其成為目前邊緣設備部署的最佳選擇。該成果為果園自動化采摘提供了可直接落地的技術方案,相關代碼已開源。未來研究可進一步優化小目標檢測能力,并探索與其他傳感器數據的融合應用。
知名企業招聘