《Bioresource Technology》:Meta-tuning and fast optimization of machine learning models for dynamic methane prediction in anaerobic digestion
編輯推薦:
為解決機器學習和深度學習模型在厭氧消化(AD)甲烷產量預測中數據預處理和超參數(HPs)選擇難題,研究人員開展優化算法研究。結果顯示不同模型和數據集需匹配優化策略,meta - tuning 可提升復雜場景模型精度,有助于靈活沼氣運營增收。
在能源領域,風力和太陽能等可再生能源受天氣影響,供應波動較大。而利用厭氧消化(AD)過程生產沼氣,并轉化為電能,有望實現靈活供能,滿足需求側管理。不過,在實際應用中,AD 過程中的微生物反應復雜,為實現靈活的甲烷生產預測和控制,需要合適的模型。傳統的機理模型,像 ADM1,雖能描述過程,但參數眾多、離線測量昂貴,還需手動調整,對傳感器故障敏感,不適合大規模工業沼氣廠。
此時,機器學習(ML)和深度學習(DL)模型嶄露頭角。它們能利用有限測量數據動態預測甲烷產量,且更穩健,只需自動調整。然而,數據預處理技術和超參數(HPs)選擇對模型在工業規模的應用極為關鍵。但目前,HPs ?渴謩釉O定,缺乏依據,網格搜索也存在問題,而且數據預處理和 HPs 優化的結合常被忽視,通用的自動機器學習管道又因缺乏領域知識難以達到最佳效果。
為了解決這些問題,來自國外的研究人員開展了相關研究。他們旨在尋找能縮短優化過程且不犧牲模型性能的最佳優化算法,并引入 meta - tuning 策略確定管道優化器的調整參數(TP)。研究成果發表在《Bioresource Technology》上。
研究人員在應用的優化管道中測試了兩個不同的數據集和兩個預測模型,包括貝葉斯嶺回歸(BRR)和以長短期記憶(LSTM)及門控循環單元(GRU)形式的循環神經網絡(RNNs)。同時,用九種不同的元啟發式優化器對數據準備管道和預測模型的各個參數進行優化。
在研究結果部分,通過詳細評估誤差指標發現,不同模型和數據集對優化策略的響應不同。在簡單情況下,比如穩態數據集,50 次優化步驟重復三次通常就能達到最佳結果,此時 HPSO(帶時變加速的粒子群優化)表現最佳,均方根標準誤差(RMSSE)為 62.8%。而且,經過 2000 次迭代優化的遺傳算法(GA)表現更優,RMSSE 達到 61.2% 。然而,對于復雜場景,如動態數據集上的 RNNs 模型,擴展優化過程能提高精度。在測試的算法中,貝葉斯搜索在未經 meta - tuning 時表現不錯,但經過 meta - tuning 的 GA 表現更勝一籌(基線為 94.4%,meta - tuned GA 為 99.2% )。meta - tuning 優化了調整參數的選擇,提高了模型精度。差分進化和帶時變加速的粒子群優化在穩態情況下也表現良好。
研究結論表明,優化策略的選擇對預測 AD 中甲烷產量的 ML 和 DL 模型性能影響顯著。對于穩態數據集,較少的優化步驟就能滿足需求;而動態數據集和復雜模型則需要擴展優化或 meta - tuning。這一研究成果意義重大,它強調了優化策略與數據集和模型復雜性相匹配的重要性,meta - tuning 在復雜情況下優勢明顯。更高的預測精度能增加靈活沼氣運營的收益,為沼氣產業的發展提供了有力的技術支持,有助于推動可再生能源領域的進步,讓沼氣在能源供應中發揮更大的作用。