《Heliyon》:Classifying breast intraductal proliferative lesions via a knowledge distillation framework using convolutional neural network-based nuclei-segmentation-assisted classification (KDCNN-NSAC)
編輯推薦:
乳腺癌病理診斷中,乳腺導管內增生性病變(BIDPLs)的診斷面臨挑戰。研究人員開展基于卷積神經網絡核分割輔助分類知識蒸餾框架(KDCNN-NSAC)的研究。結果顯示該框架性能優異,有助于提高 BIDPLs 診斷水平,為臨床診療提供支持。
在乳腺癌的發展進程中,乳腺導管內增生性病變(BIDPLs)作為重要的前驅病變,對其準確診斷至關重要。然而在實際病理診斷工作中,基于蘇木精 - 伊紅(HE)染色圖像來診斷 BIDPLs 卻困難重重。BIDPLs 涵蓋了常見導管增生(UDH)、非典型導管增生(ADH)、平坦上皮異型增生(FEA)和導管原位癌(DCIS)等多種病變類型 ,它們在形態學上差異細微。像是 UDH 細胞具有多態性,容易與中間級 DCIS 混淆;ADH 和 DCIS 的細胞特征相似,且缺乏有效的免疫組化抗體來區分它們。而且,這種診斷高度依賴病理學家的專業知識,診斷的一致性和可重復性較低,使得 BIDPLs 的診斷成為一個耗時且棘手的難題。
為了解決這一困境,上海電機學院機械工程學院、武漢大學人民醫院腫瘤中心、華中科技大學同濟醫學院附屬武漢中心醫院病理科、上海交通大學生物醫學工程學院等機構的研究人員展開了深入研究。他們提出了一種基于卷積神經網絡核分割輔助分類的知識蒸餾框架(KDCNN-NSAC),相關研究成果發表在《Heliyon》上。
研究人員主要運用了以下關鍵技術方法:
首先,使用 BReAst Carcinoma Subtyping(BRACS)數據集,該數據集包含正常乳腺組織、病理良性病變、BIDPLs 和乳腺浸潤性癌(IC)的 HE 全切片圖像(WSI),為模型訓練和測試提供了豐富的數據。其次,構建 KDCNN-NSAC 框架,其中教師網絡利用 Efficient Net-B4 作為編碼器,Deeplabv3plus 的上采樣部分作為解碼器,對細胞核進行分割和分類;學生網絡采用相同的編碼器并共享權重,進行 ROI 層面的分類。此外,利用在 PanNuke 數據集上訓練的 Hover-Net 獲取細胞核偽標簽,以輔助模型訓練。
下面來看具體的研究結果:
- 教師網絡的細胞核分割和分類:教師網絡能夠有效地將 ROIs 中的細胞核分割并分類為正常上皮、腫瘤上皮、基質(結締組織和炎癥細胞)和壞死信息五類。通過梯度加權類激活映射(Grad-CAM)生成的熱圖表明,教師模型能夠突出顯示集中在細胞核信息上的重要區域。
- KDCNN-NSAC 在 ROI 層面的分類性能:在 7 類分類任務中,KDCNN-NSAC 的平均 F1 分數達到 63.26% ,優于當前最先進的方法。在區分 BIDPLs 與 IC 和正常組織的任務中,F1 分數分別達到 98.36% 和 94.21% 。在 BIDPLs 內部的二元分類中,區分 FEA 與 DCIS、UDH 和 ADH 時,F1 分數分別為 91.04%、90.11% 和 89.13% 。
- WSI 層面的預測:基于 ROIs 的風險評級對 WSI 進行預測,在 344 張標記為 N、UDH、ADH、FEA、DCIS 和 IC 的 WSIs 中,總準確率達到 90.12% ,與病理學家的注釋具有高度一致性(kappa 值為 0.88)。
- 消融研究:通過消融實驗評估 KDCNN-NSAC 各組件的貢獻,結果表明,細胞核分割和分類組件使基線模型的性能提高了 3%。
在研究結論與討論部分,KDCNN-NSAC 表現出顯著優勢。該框架通過教師模型提取細胞類別和形態的細粒度信息,優化了學生模型在 ROIs 分類的性能。在 7 類 ROI 層面分類中,KDCNN-NSAC 優于基于 CNN 和圖神經網絡(GNN)的方法。同時,基于 ROIs 風險評級預測 WSI 的方式不僅可解釋、高效,而且更準確。不過研究也存在一些局限,例如對細胞核分割和分類的準確性依賴較高,區分 UDH、ADH 和低級別 DCIS 仍面臨挑戰,在臨床應用中還需進一步驗證等。
總體而言,這項研究為 BIDPLs 的診斷框架設計提供了新思路,其理論框架在其他腫瘤的形態學分類中也具有潛在應用價值。隨著相關技術的不斷發展,有望在未來進一步完善該研究,為腫瘤病理診斷帶來更多突破,助力臨床診療水平的提升。