基于AI 機(jī)器學(xué)習(xí)的影像組學(xué)模型研究
2019年12月以來,由SARS-CoV-2病毒感染導(dǎo)致的新型冠狀病毒疾病(COVID-19)在全球開始蔓延。報(bào)道顯示,SARS-CoV-2感染患者的中位住院時(shí)間為10天,而武漢患者在發(fā)病10天后癥狀有可能加重。因此,住院時(shí)間是COVID-19臨床預(yù)后的重要指標(biāo)之一。 目前,CT影像學(xué)已成為COVID-19肺炎的診斷和監(jiān)測(cè)工具,主要表現(xiàn)為磨玻璃影、實(shí)變及混合密度影。然而,現(xiàn)階段的影像學(xué)研究主要集中于對(duì)病灶的定性和半定量描述,缺乏對(duì)病灶的全定量分析。因此,基于前期提出的CT定量監(jiān)測(cè)COVID-19肺炎病程,團(tuán)隊(duì)假設(shè)在CT病灶背后的高通量影像特征“隱藏”了患者預(yù)后轉(zhuǎn)歸的“秘密”。 本研究納入了蘭州、安康、麗水、鎮(zhèn)江、臨夏5家新冠肺炎定點(diǎn)醫(yī)院,自2020年1月23日到2月8日期間住院患者的臨床資料和首次CT資料,所有患者經(jīng)RT-PCR證實(shí)SARS-CoV-2病毒感染。至2月20日,研究共納入31例治愈出院的患者(排除14例未出院患者和7例首次CT檢查無肺炎表現(xiàn)患者),并將10天作為住院時(shí)長(zhǎng)的二分類閾值。基于有限的樣本量,團(tuán)隊(duì)將4個(gè)中心作為訓(xùn)練隊(duì)列,另外一個(gè)中心作為驗(yàn)證隊(duì)列。通過自動(dòng)分割肺葉和半自動(dòng)分割病灶,31名患者中累計(jì)分割出72個(gè)病灶。在對(duì)病灶圖像預(yù)處理后,提取影像組學(xué)特征并篩選。為了研究影像組學(xué)特征的穩(wěn)定性,團(tuán)隊(duì)使用了Logistics回歸模型和隨機(jī)森林模型對(duì)篩選的特征分別進(jìn)行建模和驗(yàn)證。?結(jié)果發(fā)現(xiàn),6個(gè)篩選出的二階特征在兩種不同分類器中均表現(xiàn)出良好的預(yù)測(cè)價(jià)值。在外部測(cè)試隊(duì)列中,Logistics回歸模型的AUC為0·97(95%CI 0·83-1·0), 敏感性 1·0, 特異性0·89;隨機(jī)森林模型的AUC為0·92 (95%CI 0·67-1·0),敏感性 0·75, 特異性1·0。隨后,研究又納入了2月20日-28日新出院的6名患者,利用已建立的影像組學(xué)模型可以正確預(yù)測(cè)所有6名患者的住院時(shí)間。
東南大學(xué)
2021-04-10