基于AI 機器學習的影像組學模型研究
2019年12月以來,由SARS-CoV-2病毒感染導致的新型冠狀病毒疾病(COVID-19)在全球開始蔓延。報道顯示,SARS-CoV-2感染患者的中位住院時間為10天,而武漢患者在發病10天后癥狀有可能加重。因此,住院時間是COVID-19臨床預后的重要指標之一。 目前,CT影像學已成為COVID-19肺炎的診斷和監測工具,主要表現為磨玻璃影、實變及混合密度影。然而,現階段的影像學研究主要集中于對病灶的定性和半定量描述,缺乏對病灶的全定量分析。因此,基于前期提出的CT定量監測COVID-19肺炎病程,團隊假設在CT病灶背后的高通量影像特征“隱藏”了患者預后轉歸的“秘密”。 本研究納入了蘭州、安康、麗水、鎮江、臨夏5家新冠肺炎定點醫院,自2020年1月23日到2月8日期間住院患者的臨床資料和首次CT資料,所有患者經RT-PCR證實SARS-CoV-2病毒感染。至2月20日,研究共納入31例治愈出院的患者(排除14例未出院患者和7例首次CT檢查無肺炎表現患者),并將10天作為住院時長的二分類閾值。基于有限的樣本量,團隊將4個中心作為訓練隊列,另外一個中心作為驗證隊列。通過自動分割肺葉和半自動分割病灶,31名患者中累計分割出72個病灶。在對病灶圖像預處理后,提取影像組學特征并篩選。為了研究影像組學特征的穩定性,團隊使用了Logistics回歸模型和隨機森林模型對篩選的特征分別進行建模和驗證。?結果發現,6個篩選出的二階特征在兩種不同分類器中均表現出良好的預測價值。在外部測試隊列中,Logistics回歸模型的AUC為0·97(95%CI 0·83-1·0), 敏感性 1·0, 特異性0·89;隨機森林模型的AUC為0·92 (95%CI 0·67-1·0),敏感性 0·75, 特異性1·0。隨后,研究又納入了2月20日-28日新出院的6名患者,利用已建立的影像組學模型可以正確預測所有6名患者的住院時間。
東南大學
2021-04-10