-
生物通官微
陪你抓住生命科技
跳動的脈搏
基于圖強化學習的無線移動邊緣計算網絡在線任務卸載與延遲最小化框架
《Cognitive Systems Research》:A graph reinforcement LearningPowered Online-Computational task offloading and latency minimization framework for wireless mobile edge computing networks
【字體: 大 中 小 】 時間:2025年05月06日 來源:Cognitive Systems Research 2.1
編輯推薦:
本研究針對移動邊緣計算(MEC)網絡中實時任務卸載與資源分配的動態優化難題,提出創新性解決方案。研究人員開發了基于圖神經網絡(GNN)與深度強化學習(DRL)融合的GROO框架,將MEC網絡建模為無環圖,通過圖狀態遷移實現任務卸載決策。實驗表明,該框架在復雜網絡拓撲下實現0.96秒的最低加權任務響應延遲,較傳統DRL方法降低25%,顯著提升邊緣計算效率。該研究為動態MEC環境提供了具有拓撲適應性的在線優化新范式。
在人工智能與物聯網技術爆發的時代,移動邊緣計算(MEC)作為延伸云計算能力到網絡邊緣的關鍵技術,正面臨嚴峻挑戰。當前智能攝像頭、工業機器人等無線設備(WD)產生的計算密集型任務呈指數增長,而傳統云計算因通信延遲難以滿足實時性需求。盡管MEC通過將計算能力下沉到網絡邊緣基站(MBS/SBS)緩解了這一問題,但動態環境中多設備競爭資源、時變無線信道等復雜因素,使得實時任務卸載決策成為典型的NP難組合優化問題,F有啟發式算法存在迭代效率低、無法適應拓撲變化等缺陷,而傳統深度強化學習(DRL)方法又難以有效捕捉設備間(D2D)的拓撲關聯性。
針對這一技術瓶頸,國內研究人員在《Cognitive Systems Research》發表的研究中,創新性地將圖神經網絡(GNN)與深度強化學習(DRL)相結合,提出GROO(Graph Reinforcement Learning-based Online Offloading)框架。該研究突破性地將MEC網絡建模為無環圖結構,其中無線設備與邊緣服務器作為節點,通信鏈路構成邊,利用GNN的消息傳遞機制捕捉網絡拓撲特征。通過設計包含任務需求、設備狀態和信道條件的多維圖狀態空間,將復雜的在線優化問題轉化為圖狀態遷移過程。實驗驗證該框架在動態環境下可實現毫秒級決策響應,較傳統方法顯著提升系統吞吐量。
關鍵技術方法包括:1) 構建包含無線設備、接入點(AP)和MEC服務器的異構網絡模型;2) 設計基于GNN的編碼器提取網絡拓撲特征;3) 采用深度Q網絡(DQN)算法進行離線訓練與在線微調;4) 建立包含計算負載、信道狀態和硬件配置的多維評估指標體系。
MEC網絡模型
研究將MEC系統抽象為三層架構:終端層(配備計算單元的WD)、接入層(AP中繼節點)和邊緣層(部署MEC服務器的基礎設施)。通過引入"二元任務卸載"策略,每個任務可本地執行或卸載至邊緣服務器,形成包含N個WD和K個AP的隨機幾何圖。
信息模型
定義四元組圖狀態:(1) 任務特征矩陣(計算量、數據量、截止時間);(2) 設備狀態矩陣(CPU頻率、剩余電量);(3) 信道增益矩陣(大尺度衰落與小尺度衰落);(4) 鄰接矩陣(D2D通信關系)。實驗采用Rayleigh信道模型模擬時變特性。
計算模型
推導出關鍵性能指標:本地執行延遲Tloc=Ci/fi(Ci為計算需求,fi為CPU頻率),卸載延遲Toff=Di/Rij+Ci/fj(Di為數據量,Rij為傳輸速率)。通過聯合優化二進制卸載決策和連續資源分配變量,最小化系統加權延遲。
圖強化學習框架
GROO的核心創新在于將GNN的歸納學習能力與DRL的序列決策優勢結合。GNN編碼器采用圖注意力機制(GAT)聚合鄰居節點信息,生成包含全局拓撲特征的嵌入向量。策略網絡則基于這些嵌入預測最優動作(本地/卸載),并通過延遲獎勵信號更新網絡參數。特別地,框架引入遷移學習機制,使預訓練模型能快速適應新拓撲。
實驗結果
在模擬的100節點MEC網絡中,GROO展現出顯著優勢:(1) 收斂速度較DROO算法提升40%;(2) 在設備隨機加入/退出的動態場景下保持0.98秒的穩定延遲;(3) 網絡規模擴展至500節點時,仍保持亞秒級響應,驗證了框架的可擴展性。消融實驗證實GNN模塊對性能提升貢獻率達62%。
該研究開創性地將圖表示學習引入邊緣計算優化領域,其理論價值體現在三方面:首先,提出的圖狀態建模方法為動態網絡優化提供了新范式;其次,GROO框架證明了GNN在捕捉設備間隱性關聯方面的獨特優勢;最后,遷移學習機制的引入解決了傳統DRL在新場景需重復訓練的痛點。實際應用中,該技術可顯著提升智能工廠、車聯網等低延遲場景的服務質量,為6G時代分布式智能奠定基礎。未來研究可進一步探索多智能體協作機制與能效聯合優化方向。
知名企業招聘