《Engineering Applications of Artificial Intelligence》:Prediction of high-performance concrete compressive strength using Decision Tree-Guided Artificial Neural Network Pretraining approach
編輯推薦:
為解決深度學習模型預測高性能混凝土(HPC)抗壓強度時數據需求量大的問題,研究人員提出決策樹引導人工神經網絡預訓練(TANNP)方法。在混凝土抗壓強度數據集上驗證表明,該方法使 R2 從 0.91 提升至 0.97,顯著提升預測精度,為小數據集下 HPC 強度預測提供新路徑。
混凝土作為建筑領域的核心材料,其性能預測一直是工程界的重要課題。高性能混凝土(HPC)憑借優異特性在重大工程中廣泛應用,但其抗壓強度受骨料、水泥、添加劑等多因素影響,呈現復雜非線性關系。傳統測試需等待 28 天養護期,耗時長、成本高,而深度學習模型雖能捕捉非線性規律,卻面臨 “數據饑餓” 難題 —— 構建大規模高質量混凝土配合比數據集成本高昂,限制了模型在小數據集場景的應用。如何在數據有限的情況下提升預測精度,成為亟待突破的技術瓶頸。
為攻克這一挑戰,國內研究團隊開展了相關研究,成果發表在《Engineering Applications of Artificial Intelligence》。研究旨在開發一種適用于小數據集的高性能混凝土抗壓強度預測模型,通過融合決策樹與人工神經網絡的優勢,探索數據高效利用的新范式。
研究采用的關鍵技術方法包括:首先,使用 CatBoost 決策樹算法對真實混凝土數據集(1030 組 HPC 數據,含 8 種材料參數和齡期參數)進行訓練,通過 SHAP 值分析篩選影響強度的關鍵變量;其次,利用訓練好的決策樹生成 “偽配合比 - 強度數據集”,用于人工神經網絡(ANN)的預訓練,使模型初步學習數據內在關系;最后,用真實數據集對神經網絡進行微調,優化模型參數。
研究結果
TANNP 方法的有效性驗證
通過對比直接使用神經網絡的模型,TANNP 顯著提升多項性能指標:決定系數(R2)從 0.91 提升至 0.97,均方根誤差(RMSE)從 5.10 MPa 降至 3.26 MPa(降幅約 36.1%),平均絕對誤差(MAE)從 3.00 MPa 降至 2.10 MPa,平均絕對百分比誤差(MAPE)從 10.72% 降至 7.24%,A20 指數從 0.88 提升至 0.92,在 UC Irvine 混凝土抗壓強度(CCS)數據集上達到先進水平。
關鍵變量識別
SHAP 解釋性分析表明,水泥含量、水灰比、齡期、礦渣和粉煤灰摻量是影響抗壓強度的關鍵因素。決策樹通過分析這些變量的交互作用,生成的偽數據有效補充了小數據集的樣本多樣性,為神經網絡提供了更豐富的學習特征。
模型泛化能力提升
實驗結果顯示,經決策樹引導預訓練的神經網絡在小數據集場景下表現出更強的泛化能力,證明通過偽數據增強可緩解深度學習的 “數據饑餓” 問題,且未引入顯著偏差,生成數據符合實際配合比設計的物理規律。
結論與討論
本研究提出的 TANNP 方法成功融合決策樹處理小數據的優勢與神經網絡的強學習能力,通過 “偽數據生成 - 預訓練 - 微調” 流程,在保證預測精度的同時大幅降低對大規模數據集的依賴。這一創新為混凝土材料設計領域提供了高效的數據驅動解決方案,尤其適用于新型混凝土研發初期數據匱乏的場景,可顯著縮短配合比優化周期,降低實驗成本,對推動智能建造和綠色建材發展具有重要意義。未來研究可進一步優化偽數據生成算法,考慮變量間的聯合分布約束,以提升生成數據的真實性,拓展模型在更多復雜工程場景中的應用。