人工智能標準數據庫系統建立與應用
人工智能是一項嚴重依賴數據的技術,數據量的多少會直接影響產品的性能。而醫療數據又具備其特殊性,受到了嚴格的保護和使用限制。國外由于有健全的數據管理機制和嚴格的監管,有很多公開數據集,可供研究單位使用,用于推進人工智能技術的發展。這部分公開數據集雖然也可以被我們所使用,但是受到人種差異限制,某些疾病并不適合亞洲人群(比如:歐美人種和亞洲人種存在乳腺類型差異),且歐美疾病發病率和我國也存在差異。我國醫療數據量遠遠超過國外,但是受到法規等限制,無法進行數據挖掘,嚴重限制了我國醫療人工智能技術的發展。目前國家鼓勵“產、學、研、用”綜合發展,也鼓勵科技成果轉化。但是,醫院空有數據,沒有技術,無法進行數據挖掘;研究單位和廠家空有技術,缺乏合法高質量的數據,也無法開展相關研究更無從進行產業化。
該項目已獲得“人工智能訓練標準庫的處理與檢測方法、系統”發明專利授權(專利號:CN201710546301.8),本專利的目的是能夠建立人工智能所需的標準數據庫,通過數據和訓練庫分離和提供標準數據接口的方式,在保證數據安全的前提下,為研發機構和廠家提供研發數據和驗證數據,以便促進我國醫療人工智能技術的發展,產生更多原創算法和適合我國國情的產品。
北京大學
2023-02-27