三重聚合上下文感知地形分割網絡:面向復雜野外環境的可通行區域識別

《Expert Systems with Applications》:Contextual-aware terrain segmentation network for navigable areas with triple aggregation

【字體: 時間:2025年05月12日 來源:Expert Systems with Applications 7.5

編輯推薦:

  為解決自動駕駛系統在復雜非結構化地形中特征提取不足的問題,研究人員提出三重聚合上下文感知地形分割網絡(CTSNet)。該研究通過全局通道稀疏化模塊(GCSM)、融合校準模塊(FCM)和注意力通道熵模塊(ACEM),實現了多尺度特征與全局語義的協同優化,顯著提升了可通行區域分割精度。實驗表明CTSNet在多個野外數據集上超越現有方法,代碼已開源。

  

在自動駕駛和野外機器人導航領域,準確識別可通行區域是保障安全的核心挑戰。當前地形分割方法面臨三重困境:傳統卷積神經網絡(CNN)難以捕捉全局上下文,多尺度特征融合存在語義鴻溝,而視覺Transformer(ViT)又因計算成本過高難以落地。更棘手的是,復雜野外環境中地形特征高度異構——同一場景可能同時包含水域、巖層和植被,現有方法往往因特征表達不足導致誤判。

為解決這些問題,深圳大學的研究團隊在《Expert Systems with Applications》發表研究,提出上下文感知地形分割網絡(Contextual-Aware Terrain Segmentation Network, CTSNet)。該工作創新性地設計了三重聚合機制:通過全局通道稀疏化模塊(Global Channel Sparsification Module, GCSM)實現選擇性全局語義提取,利用融合校準模塊(Fusion-wise Calibration Module, FCM)優化跨尺度特征交互,并借助注意力通道熵模塊(Attention Channel Entropy Module, ACEM)增強關鍵特征表征。實驗證明該方法在RUGD、RELLIS等野外數據集上mIoU(平均交并比)提升3.2%-5.7%,尤其在水域邊界識別等挑戰性場景表現突出。

關鍵技術方法包括:1)基于Top-K稀疏化的Q-K-V(Query-Key-Value)機制實現輕量化全局特征提;2)通過空間-語義關系建模的多尺度特征校準;3)結合信息熵的通道注意力篩選。研究使用來自美國陸軍實驗室的RUGD數據集和德克薩斯A&M大學發布的RELLIS數據集進行驗證。

全局通道稀疏化模塊(GCSM)
通過實驗對比傳統CNN全局平均池化與ViT全通道處理,發現GCSM在保持85%計算效率的同時,使全局特征判別力提升19%。關鍵創新在于僅對30%通道執行Q-K-V運算,并通過Top-50%稀疏化過濾冗余關聯。

融合校準模塊(FCM)
消融實驗顯示,該模塊使跨尺度特征一致性提高32%。典型案例如陡坡識別任務中,通過通道校準將淺層紋理與深層語義融合錯誤率從15.4%降至8.7%。

注意力通道熵模塊(ACEM)
在沼澤地分割場景中,經信息熵篩選的通道特征使關鍵區域召回率提升6.3%?梢暬治霰砻,ACEM能有效抑制70%以上的背景干擾特征。

研究結論指出,CTSNet的三重聚合架構為復雜地形理解提供了新范式:GCSM突破傳統CNN的局部感受野限制,FCM解決多尺度特征"語義斷層"問題,ACEM則通過信息論方法優化特征選擇。值得注意的是,該方法在嵌入式設備Jetson AGX Xavier上仍能保持18fps實時性能,具備工程落地潛力。討論部分強調,未來可結合4D雷達點云數據進一步擴展三維地形理解能力,該成果不僅適用于自動駕駛,對災害救援機器人路徑規劃同樣具有重要價值。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线