協同智能體深度強化學習框架在柔性作業車間調度與自動導引車協同優化中的應用研究

《Expert Systems with Applications》:A cooperative agent deep reinforcement learning framework for solving flexible job shop scheduling problem with automated guided vehicles

【字體: 時間:2025年05月14日 來源:Expert Systems with Applications 7.5

編輯推薦:

  為解決柔性作業車間調度問題(FJSP)與自動導引車(AGV)協同調實時求解難題,研究人員提出協同智能體深度強化學習框架(CADRL),通過設計析取圖表征調度信息、開發雙編碼器-解碼器組件及協同訓練機制,實現AGV分配規則與智能體協同決策。實驗表明,CADRL在基準實例中求解時間僅0.208秒,性能超越現有算法30.78%,為智能制造實時調度提供高效解決方案。

  

在智能制造浪潮中,柔性作業車間調度問題(Flexible Job Shop Scheduling Problem, FJSP)與自動導引車(Automated Guided Vehicle, AGV)的協同調度成為制約生產效率的關鍵瓶頸。傳統方法如混合整數線性規劃(MILP)雖能求得小規模問題最優解,但計算耗時嚴重;元啟發式算法如遺傳算法(GA)易陷入局部最優,而優先級調度規則(PDR)過度依賴人工經驗。這些方法難以滿足實時生產環境對高效、高質量解決方案的需求。

為解決這一挑戰,來自聊城大學等機構的研究團隊在《Expert Systems with Applications》發表研究,提出協同智能體深度強化學習框架(Cooperative Agent Deep Reinforcement Learning, CADRL)。該框架創新性地將FJSP-AGV分解為AGV分配、機器選擇和操作排序三個子問題,其中AGV分配采用規則驅動,后兩者由專用智能體通過析取圖表征和雙編碼器-解碼器架構協同處理。研究通過設計基于圖神經網絡(GNN)和深度神經網絡(DNN)的異構編碼器,結合協同訓練機制,在保證求解質量的同時顯著提升計算效率。

關鍵技術方法包括:1) 構建FJSP-AGV的析取圖表征以捕獲調度拓撲關系;2) 設計雙馬爾可夫決策過程(DMDP)建模機器選擇與操作排序的協同;3) 采用GNN編碼析取圖狀態,DNN編碼機器工況;4) 開發協同訓練框架平衡訓練效率與性能;5) 基于公開基準實例和實際案例驗證泛化能力。

FJSP-AGV描述
研究將問題定義為包含多工件、多機器和有限AGVs的協同優化系統,其中工件運輸需求由相鄰工序的機器分配差異觸發。通過析取圖整合工序優先級、機器能力和AGV路徑約束,為DRL智能體提供結構化狀態輸入。

CADRL框架
框架采用分工協作架構:AGV分配使用最近空閑車輛規則,機器選擇和操作排序分別由獨立智能體決策。GNN編碼器提取工序間拓撲特征,DNN編碼器分析機器負載狀態,通過注意力機制解碼最優動作。協同訓練采用異步策略更新,使雙智能體學習速率匹配。

實驗驗證
在Brandimarte基準測試中,CADRL以0.208秒平均求解時間刷新記錄,相對百分比增量(RPI)指標優于現有最優算法30.78%。實際案例測試顯示其泛化能力,0.067秒求解時間與最優解差距僅13.17%。協同訓練框架使訓練效率提升2.08%,性能提高0.21%。

結論與展望
該研究首次實現FJSP-AGV的實時智能決策,其創新點在于:1) 析取圖表征突破傳統調度模型局限;2) 異構智能體分工解決復雜子問題耦合;3) 協同訓練機制平衡計算資源與性能。未來研究方向包括多目標優化和動態環境適應。這項工作為智能制造實時調度系統提供新范式,其方法論可擴展至物流倉儲、半導體制造等領域。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线