突破傳統:單調復合分位數回歸神經網絡精準解析刪失數據治愈率

《Computational Statistics & Data Analysis》:Monotone composite quantile regression neural network for censored data with a cure fraction

【字體: 時間:2025年05月09日 來源:Computational Statistics & Data Analysis 1.5

編輯推薦:

  在生存數據分析中,傳統方法因未考慮疾病治愈特征及變量間復雜非線性關系易致誤差。研究人員開展 “Monotone composite quantile regression neural network for censored data with a cure fraction” 研究,提出 CCQRNN 模型。結果顯示該模型預測優勢明顯,能有效避免分位數交叉現象,為生存數據分析提供新方法。

  在醫學研究和臨床實踐中,生存分析是評估疾病預后和治療效果的重要手段。傳統的生存分析通常假定,只要隨訪時間足夠長,所有研究對象最終都會經歷感興趣的事件,比如疾病復發或死亡。但隨著醫療技術的飛速發展,許多疾病是可以被治愈的,而且部分患者無論隨訪多久,都不會經歷這些事件,他們被視為對該事件不易感。若在分析生存數據時忽視這一治愈或不易感特征,很可能會導致錯誤的結果。同時,以往大多數研究聚焦于變量間呈線性結構的經典統計模型,然而現實中變量之間往往存在復雜的非線性關系,這使得線性假設不再成立。在此背景下,開展一項能精準分析含治愈比例的刪失數據的研究迫在眉睫。
為了解決這些問題,來自未知研究機構的研究人員進行了 “Monotone composite quantile regression neural network for censored data with a cure fraction” 的研究。他們提出了一種刪失治愈單調復合分位數回歸神經網絡(CCQRNN)模型,該研究成果發表在《Computational Statistics 》上。這一研究成果意義重大,它為預測患者的治愈率和未治愈患者的生存時間提供了新的有效方法,有助于醫生更準確地評估患者預后,制定更合理的治療方案,在生命科學和健康醫學領域具有重要的應用價值。

研究人員在這項研究中用到了多種關鍵技術方法。首先是數據增強技術,通過對觀測數據進行擴充,增加數據的豐富度;接著采用交叉驗證和網格搜索技術,來選擇最優的隱藏層節點 J 和正則化參數λ,從而優化模型性能;利用邏輯回歸(Logistic regression)對治愈概率進行建模;運用單調復合分位數回歸神經網絡(MCQRNN)對未治愈(易感)受試者的生存時間進行分析 。

下面來詳細介紹研究結果:

  • CCQRNN 模型構建:研究人員整合人工神經網絡(ANN)技術和分位數回歸(QR)模型,考慮治愈比例,構建了 CCQRNN 模型。在模型中,將受試者的生存時間分解,同時考慮了未治愈和已治愈受試者的情況。通過定義相關的條件分布、分位數函數等,建立了完整的模型架構,為后續的分析和預測奠定基礎。
  • 算法設計:提出一種基于數據增強的迭代算法。該算法通過多次迭代,不斷更新治愈指標和相關參數的估計值。具體包括從伯努利分布中生成治愈指標,利用最大化似然函數更新參數,以及基于網格和隨機數對刪失觀測進行更新等操作。通過這些步驟,最終實現對治愈率和不同分位數水平下響應的預測。
  • 模擬研究:將 CCQRNN 模型與三種先進方法(IMP、DAU 和 CQRNN)進行比較。結果顯示,在響應與預測變量呈線性關系的情況下,DAU 和 IMP 方法的預測性能略優于 CCQRNN;但在非線性關系的設定中,CCQRNN 表現出色,其均方誤差(MSE)和平均絕對誤差(MAE)顯著更小。同時,在預測高 quantile 水平的響應時,CCQRNN 比不考慮治愈率的 CQRNN 表現更優。此外,CCQRNN 能有效確保分位數函數不交叉,而其他對比方法存在交叉問題。
  • 實際數據分析:研究人員將 CCQRNN 模型應用于腎臟移植數據和肺癌數據。在腎臟移植數據中,發現患者年齡與治愈率顯著相關,且 CCQRNN 在預測生存時間方面,其 MSE、MAE 和分位數損失(QL)在幾乎所有考慮的分位數水平上均低于其他方法。在肺癌數據中,年齡對治愈率有顯著正向影響,CCQRNN 同樣展現出良好的預測性能,并且保證了分位數預測不交叉。

研究結論和討論部分指出,CCQRNN 模型結合了基于刪失數據的增廣方法,通過邏輯回歸和 MCQRNN 模型分別對治愈比例和易感受試者進行建模,為預測受試者的治愈率和未治愈受試者的生存時間提供了有效途徑,同時成功解決了分位數交叉的問題。模擬研究表明,該方法在大多數情況下,尤其是存在非線性關系時,預測準確性優于其他競爭方法。在實際應用中,CCQRNN 模型在兩個真實數據集上均取得了良好的效果。然而,研究也存在一些可以進一步探索的方向,例如可以用其他非參數方法替代邏輯回歸模型來分析治愈比例,還可將該方法擴展到處理區間刪失數據等 。這些后續研究有望進一步完善生存數據分析的方法體系,為醫學研究和臨床實踐提供更強大的工具。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线