《Scientific Data》:SLIMBRAIN database: A multimodal image database of in vivo human brains for tumour detection
編輯推薦:
為解決現有活體人腦高光譜成像(HSI)數據庫標記數據稀缺、缺乏 3D 組織信息的問題,研究人員構建 SLIMBRAIN 數據庫,含多模態圖像數據,可用于訓練機器學習(ML)模型等,為醫學和工程領域提供新資源。
在神經外科手術中,準確區分腦腫瘤組織與健康組織是一大挑戰,尤其是像膠質母細胞瘤(GBM)這種具有高浸潤性的腫瘤,其切除難度極大,而現有的術中工具如神經導航儀、術中磁共振(iMR)等都存在各自的局限性。此外,現有的活體人腦高光譜成像(HSI)數據庫存在標記數據稀缺以及缺乏 3D 組織信息等問題,難以滿足精準醫療和復雜算法開發的需求。因此,開發更高效的腫瘤檢測工具和構建更完善的數據庫成為亟待解決的問題。
為了應對這些挑戰,西班牙馬德里理工大學(Universidad Politécnica de Madrid)和馬德里康普頓斯大學醫院(Hospital Universitario 12 de Octubre)的研究人員開展了相關研究,構建了 SLIMBRAIN 數據庫,并將研究成果發表在《Scientific Data》上。該數據庫為腦腫瘤的精準檢測和手術導航提供了新的解決方案,有望推動神經外科和醫學影像領域的發展。
研究人員主要采用了以下關鍵技術方法:使用多種傳感器(包括兩臺高光譜相機、兩臺深度相機和不同的 RGB 傳感器)在手術過程中從 193 名患者獲取圖像和視頻數據;通過數據預處理流程(包括高光譜立方體形成、光譜波段去除、數據校準、光譜校正和像素歸一化等)對原始數據進行處理;利用神經外科醫生通過基于光譜角映射器(SAM)算法的半自動標記工具對高光譜圖像進行標記,生成地面真實(GT)圖。
數據庫構建與數據特征
研究構建了包含活體人腦高光譜(HS)腦組織數據(光譜范圍 400–1000 nm)、RGB、深度和多視圖圖像的多模態數據庫。數據來自 193 例患者的手術過程,“捕獲” 指使用所有傳感器進行圖像數據采集的特定時刻。數據庫具有靈活性,例如可融合不同傳感器圖像以增強腦組織分類,利用多視圖或深度圖像重建 3D 場景,還能通過近紅外(NIR)范圍的快照相機和覆蓋可見近紅外(VNIR)光譜的線掃描相機對腦組織進行表征,標記的高光譜數據可用于開發復雜算法等,對神經科學學生和研究人員也有幫助。
數據采集與處理流程
數據采集流程包括患者準備(進行頭部 CT 和 MRI,確定腫瘤位置,患者麻醉后進行開顱手術暴露腦表面)、數據采集(使用不同版本的 SLIMBRAIN 原型系統,包括三腳架、掃描平臺等,獲取 HS、RGB、深度等圖像和視頻)、神經病理評估(對切除的病理組織進行染色和診斷)、數據預處理(生成高光譜立方體,去除無效波段,進行數據校準、光譜校正、像素歸一化及圖像裁剪旋轉)、地面真實標記(利用偽 RGB 圖像和 SAM 算法,神經外科醫生標記健康、腫瘤等像素)和數據提。ǜ鶕 GT 圖提取標記像素的反射率值)。
系統開發與驗證
開發了四代 SLIMBRAIN 原型系統,從最初的帶三腳架的 HS 快照相機系統,逐步升級為帶掃描平臺、線掃描相機、LiDAR 和深度相機的更靈活系統,采用不同光源并分析其光譜響應。通過光譜特征驗證(與聚合物參考光譜對比)、地面真實圖驗證(分析 SAM 閾值)、深度圖像驗證(虛擬視圖生成分析)和機器學習分類驗證(隨機森林模型訓練),證明了數據庫數據的質量和可用性。
數據記錄與使用
數據記錄存儲在 e-cienciaDatos 存儲庫,包含原始數據、校準文件、預處理高光譜數據、地面真實圖、患者標記數據等。用戶需簽署數據使用協議(DUA)才能訪問,數據庫網站提供導航和使用視頻,還有 Python 軟件包用于讀取數據和生成相關可視化。
SLIMBRAIN 數據庫填補了現有活體人腦成像數據庫的空白,為腦腫瘤的術中檢測和分類提供了豐富的多模態數據支持。其包含的高光譜數據和標記信息為機器學習模型的訓練提供了堅實基礎,有助于開發更精準的腦腫瘤檢測算法。此外,數據庫整合的深度和 RGB 圖像支持 3D 場景重建和實時視頻分析,能輔助神經外科醫生在手術中更精準地識別腫瘤邊界,提高手術切除的徹底性和安全性。該研究不僅推動了醫學影像技術在神經外科中的應用,還為跨學科研究提供了寶貴的數據資源,有望在未來的臨床實踐和醫學研究中發揮重要作用。