《Expert Systems with Applications》:Event-triggered-based output-feedback control for uncertain nonlinear discrete-time systems: a reinforcement learning method
編輯推薦:
在許多實際應用中,非線性系統控制面臨諸多挑戰,如系統狀態不可測、控制方向未知等。研究人員針對不確定非線性離散時間(DT)系統,開展基于強化學習(RL)的事件觸發(ET)輸出反饋控制研究,證明閉環系統信號有界,算法有效,為相關控制領域提供新方法。
在當今科技飛速發展的時代,各種復雜系統廣泛應用于工業生產、航空航天、智能交通等眾多領域。其中,非線性系統因其高度復雜性和多樣性,一直是控制領域的研究熱點和難點。在實際場景中,非線性系統的控制面臨著諸多棘手問題。一方面,精確獲取系統的數學模型極為困難,現實中的干擾和不確定性使得傳統依賴精確模型的控制方法難以施展拳腳。另一方面,系統狀態常常無法直接測量,這給控制決策帶來了極大阻礙。此外,控制方向未知的情況也時有發生,進一步增加了控制的難度。
為了解決這些問題,推動非線性系統控制技術的發展,相關研究人員展開了深入探索。雖然此前已有不少關于非線性系統控制的研究成果,但仍存在諸多不足。比如,早期研究大多聚焦于已知系統動力學,對未知系統的研究相對較少;部分基于強化學習的方法雖有優勢,但在處理復雜非線性且狀態不可測的系統時效果不佳;針對控制方向未知的問題,現有方法也存在一定局限性。在此背景下,開展新的研究迫在眉睫。
研究人員針對不確定非線性離散時間(DT)系統,進行了基于強化學習(RL)的事件觸發(ET)輸出反饋控制研究。他們得出的結論具有重要意義,在 Lyapunov 穩定性定理下,證明了跟蹤誤差和閉環系統中所有信號能達到半全局最終一致有界(SGUUB) ,通過仿真也驗證了算法在處理具有未知控制方向的非線性 DT 系統時的有效性。該研究成果發表在《Expert Systems with Applications》上,為非線性系統控制領域提供了新的思路和方法,有望推動相關技術的進一步發展和應用。
在研究方法上,研究人員主要運用了以下關鍵技術:一是構建基于徑向基函數神經網絡(RBF NNs)的觀測器,用于估計不可測的系統狀態,解決系統狀態無法直接獲取的問題;二是提出高效的 ET 機制,減少通信冗余,優化系統性能;三是采用基于 ET 的 DT Nussbaum 增益技術,有效應對未知控制方向的難題。
研究結果
- 觀測器設計:受相關研究啟發,研究人員設計了基于 RBF NNs 的觀測器。該觀測器通過對系統狀態的估計,為后續的控制決策提供了重要依據。具體來說,利用 RBF NNs 的逼近能力,對系統中的未知函數進行近似,從而實現對系統狀態的有效估計。
- 穩定性分析:提出 ET DT Nussbaum 增益序列,并證明在該序列下,系統能達到一定的穩定性。通過嚴謹的數學推導,驗證了跟蹤誤差和閉環系統中所有信號的半全局最終一致有界性,為系統的穩定運行提供了理論保障。
- 仿真示例:通過對特定非線性 DT 系統的仿真,直觀地展示了所提算法的有效性。在仿真過程中,對系統狀態和控制輸入進行模擬,結果表明該算法能夠較好地處理非線性 DT 系統中未知控制方向的問題,實現對系統的有效控制。
研究結論和討論
本研究提出的基于 ET RL 的輸出反饋控制方法,為具有未知控制方向的 DT 系統控制提供了新的解決方案。利用 ET DT Nussbaum 增益,有效克服了控制方向未知帶來的挑戰;谒 ET 方法,Nussbaum 增益和控制器僅在觸發時刻更新,減少了計算資源的需求和傳輸負擔。這一研究成果不僅在理論上豐富了非線性系統控制的方法,也為實際應用提供了更可靠的技術支持,有望在工業控制、機器人等領域得到廣泛應用,推動相關行業的發展。