“現階段醫生需要在大量影像數據中快速診斷出新冠肺炎的病例,此外還需要診斷出病灶分布的位置、大小等來評估嚴重程度?!毖ο蜿柦榻B,針對臨床的現實需求,團隊將設計目標定位于“肺炎分類鑒別”和“關鍵病灶檢測”兩大功能,前者是為區別健康狀態、新冠肺炎、其他病毒性肺炎、細菌性肺炎,后者則為找到并分隔出磨玻璃影等病灶區域。
針對這些需求,團隊設計診斷算法模型,讓機器利用模型進行訓練,學習不同類型肺炎在CT影像表現上的不同特征,最終具備智能輔助診斷的能力。而這需要突破小樣本學習、小目標檢測等多個技術難題。
“小樣本學習”即在較少訓練數據樣本的條件下進行機器學習。在疫情發生前期,能夠獲取的新冠肺炎影像數據相對較少,且由于一線影像醫生任務繁重,無法獲得大量專家標注,因此需要算法在少量樣本的條件下“自學成才”。
為此,團隊采用基于自遷移學習的半監督學習等技巧,使算法具備一定的“小樣本學習”能力,在不增加醫生標注工作量的情況下較好地提高了算法模型的普適性。
由于CT影像切片中的病灶區域有大有小,且往往大中小病灶區域面積懸殊,如何使算法能同時檢測大、中、小各個目標是另一大難題。
團隊利用神經網絡的層次性特點與病灶區域的大小進行對應,“網絡的底層關注細節,即小病灶區域,而網絡中層到高層所關注的病灶區域則越來越大,因此模型通過不同層次的加權和融合,最終便能達到同時檢測大小病灶區域的目標。”薛向陽解釋道。
“不過,即便有診斷‘神器’,影像科醫生也是不可替代的。”薛向陽說,人是復雜的機體,病毒在不同人體內感染的反映也不一定相同?!彼硎荆斢龅綑C器未曾學習過的微小病變或疑難病例時,仍需要影像醫生的經驗和智慧。
以解決實際問題為目標,該項目在研究過程中始終與臨床應用緊密結合。無論是機器學習數據,還是測試評估數據,都來源于臨床真實病例。在算法模型定型過程中,為了檢驗模型的準確率和泛化性,團隊也利用現實疑似病例進行了測試。
掃碼關注,查看更多科技成果