《Scientific Reports》:A generative adversarial network-based accurate masked face recognition model using dual scale adaptive efficient attention network
編輯推薦:
為解決蒙面人臉識別準確率低、數據不足等問題,研究人員開展基于深度學習的蒙面人臉識別研究。構建含 GAN、DS-AEAN 和 EAOA 的模型,經多數據集驗證,該模型顯著提升識別精度,為安防、醫療等領域提供可靠方案。
在公共安全與健康防護需求激增的當下,蒙面場景下的身份識別成為人工智能領域的難題。傳統人臉識別技術因面部遮擋導致特征缺失,在口罩、墨鏡等遮擋物存在時,識別精度顯著下降,尤其在疫情期間,蒙面常態化更凸顯這一技術短板。此外,現有模型面臨訓練數據不足、對復雜遮擋場景泛化能力弱等挑戰,亟需一種高效魯棒的蒙面人臉識別方案。
為攻克上述難題,來自約旦阿爾巴卡應用大學(Faculty of Engineering, Al-Balqa Applied University)等機構的研究人員開展了相關研究。他們提出一種融合生成對抗網絡(GAN)與雙尺度自適應高效注意力網絡(DS-AEAN)的蒙面人臉識別模型,并通過增強型旋角羚優化算法(EAOA)提升模型性能。該研究成果發表于《Scientific Reports》,為智能安防、醫療身份驗證等場景提供了關鍵技術突破。
研究采用的核心技術方法包括:
- GAN 圖像增強:利用 GAN 生成高質量蒙面與非蒙面圖像,擴充訓練數據集,緩解數據不足問題,提升模型對多樣輸入的適應性。
- DS-AEAN 識別網絡:通過雙尺度卷積提取多粒度特征,結合自適應注意力機制聚焦關鍵面部區域(如眼周、額頭),增強對遮擋區域的魯棒性。
- EAOA 優化算法:對網絡參數(如 epoch 數、隱藏神經元數量)進行自適應優化,提升模型收斂速度與識別精度。
研究結果
模型架構與數據處理
輸入圖像經 GAN 處理后,若為蒙面圖像則生成非蒙面版本(特征集 1),反之生成蒙面版本(特征集 2);若同時存在兩類圖像則直接輸入 DS-AEAN。DS-AEAN 通過雙尺度分支分別處理不同尺度特征,局部特征分支捕捉眼周細節,全局特征分支提取整體結構信息,最終融合特征完成身份識別。研究使用 “Face Mask Detection Dataset” 和 “Real-World-Masked-Face-Dataset”,包含數萬張蒙面與非蒙面圖像,覆蓋多場景光照與遮擋條件。
性能驗證與對比
在 K 折交叉驗證中,該模型準確率達 95% 以上,顯著優于 AMaskNet、DeepMaskNet 等傳統模型。例如,在數據集 1 中,其準確率較 AMaskNet 提升 23.07%,在數據集 2 中對復雜遮擋的魯棒性提升 15% 以上。通過 ROC 曲線分析,模型在真假正例率平衡上表現優異,AUC 值超過 0.95,證明其泛化能力。
參數優化與效率提升
EAOA 通過模擬旋角羚覓食行為優化網絡參數,相比傳統優化算法(如 AOA、GOA),模型訓練耗時減少 30%,內存占用降低 50%(僅 300MB),同時識別精度提升 10%-15%。在不同 epoch 數測試中,300 次迭代時模型準確率達峰值,驗證了優化策略的有效性。
實際應用場景拓展
模型在醫療場景可精準識別佩戴口罩的醫護人員與患者,在交通樞紐實現蒙面乘客身份核驗,在安防領域輔助識別蒙面嫌疑人。實驗顯示,其對低分辨率、模糊圖像的識別準確率較傳統 CNN 提升 25%,滿足實時監控與快速認證需求。
結論與意義
該研究構建的 GAN-DS-AEAN-EAOA 模型突破了傳統蒙面人臉識別的精度瓶頸,通過多技術融合實現了遮擋魯棒性與泛化能力的顯著提升。其核心創新在于:
- 數據增強機制:利用 GAN 生成逼真合成數據,解決蒙面圖像標注樣本稀缺問題;
- 注意力機制創新:雙尺度自適應注意力聚焦關鍵特征,有效抑制遮擋干擾;
- 優化策略:EAOA 提升參數調優效率,降低計算成本。
研究成果為后疫情時代的公共衛生管理、智能門禁系統、刑事偵查等領域提供了可靠的技術支撐,推動了生物特征識別技術在復雜場景中的實用化進程。未來可進一步融合多模態數據(如熱成像、深度傳感器),提升模型在極端環境下的性能,拓展其在智慧醫療與智慧城市中的應用邊界。