基于多尺度殘差卷積字典學習的運動去模糊方法

《Digital Signal Processing》:Motion Deblurring via Multiscale Residual Convolutional Dictionary Learning

【字體: 時間:2025年05月20日 來源:Digital Signal Processing 2.9

編輯推薦:

  為解決現有卷積稀疏編碼(CSC)模型在圖像恢復中單尺度表示和聚焦重構圖像的局限,研究人員提出多尺度殘差 CSC 網絡,結合 U 型 Transformer 提取多尺度特征,經實驗驗證其在運動去模糊中優于先進方法,推動圖像恢復技術發展。

  
在數字圖像處理領域,運動模糊是攝影中常見的難題,由相機與拍攝場景的相對運動引起,會破壞圖像的邊緣、紋理和結構,不僅影響視覺體驗,還對依賴清晰圖像的計算機視覺應用產生負面影響。盡管過去幾十年在運動模糊圖像恢復(MBIR)領域已取得顯著進展,但傳統方法如基于稀疏表示的卷積稀疏編碼(CSC)模型仍存在明顯不足,F有 CSC 模型大多通過單一尺度的通用字典表示圖像,無法像卷積神經網絡(CNN)那樣提取多尺度特征,且其聚焦于圖像重構,而非像 CNN/Transformer 網絡那樣關注殘差特征的重建,這導致其在圖像恢復任務中的效果往往不如先進的深度學習模型。因此,如何提升 CSC 模型的多尺度特征處理能力和殘差特征重建效率,成為運動去模糊領域亟待解決的關鍵問題。

為應對這些挑戰,國內研究人員(基于基金信息推測)開展了多尺度殘差卷積字典學習的相關研究,其成果發表在《Digital Signal Processing》。該研究提出一種新穎的多尺度殘差卷積字典學習(MRCDL)技術,旨在通過結合 CSC 與 Transformer 網絡,更高效地解決運動去模糊問題。

研究主要采用以下關鍵技術方法:首先,利用 U 型 Transformer 網絡進行多尺度特征提取,該網絡能夠將圖像轉換為比固定值小波變換更稀疏的表示;其次,設計多尺度殘差卷積稀疏編碼(RCSC)模塊,通過學習多尺度、多維卷積字典和稀疏表示,在特征域中進行殘差特征重建;最后,借助學習的迭代收縮 / 閾值算法(LISTA)展開求解聯合 RCSC 優化問題的過程,實現跨尺度的失真信息聯合建模與校正。

研究結果


多尺度殘差 CSC 網絡的設計


研究指出,現有 CSC 模型因單尺度表示和缺乏殘差特征重建機制而效果受限。為此,提出的 RCSC 模型采用多組多尺度、多維字典重建殘差特征。其中,U 型 Transformer 網絡的結構類似 U-Net,通過不同尺度的卷積濾波器分析圖像,捕捉多視角特征,使模型能更有效地處理空間異質圖像數據。同時,殘差特征在特征空間的稀疏性高于空間域,通過可學習的卷積濾波器構建殘差特征空間,可實現更稀疏的表示,進而提升去模糊效果。

模型性能驗證


在多種運動模糊圖像數據集上的實驗表明,MRCDL 模型在定量指標(如峰值信噪比等)和主觀質量(如邊緣、紋理清晰度)方面均表現出色,優于現有的 CSC 基方法(如用于去噪的 [36] 和去塊的 [47])以及部分領先的 CNN/Transformer 模型。此外,模型在保持合理網絡參數數量和計算復雜度的同時,展現出良好的泛化能力,無論是合成還是真實運動模糊圖像(包括相機抖動和物體運動引起的模糊),均能有效去除模糊偽影,恢復出細節豐富的清晰圖像。

研究結論與意義


該研究首次將 CSC 與 Transformer-based DNN 相結合,提出的 MRCDL 技術為運動去模糊提供了新的解決方案。通過多尺度特征提取和殘差特征重建,模型克服了傳統 CSC 模型的局限性,顯著提升了圖像恢復性能。其創新點在于引入多尺度字典和殘差學習機制,增強了模型對圖像多維度特征的捕捉能力,同時通過 LISTA 算法保證了模型的可解釋性和學習能力。該研究不僅為運動模糊圖像恢復領域提供了更高效的方法,也為稀疏表示與深度學習的結合提供了新思路,有望推動計算機視覺、醫學影像等依賴清晰圖像的領域發展。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线