將計算機自然語言處理方法和生物本體學方法結合起來,發展一套面向生物醫學文獻的數據挖掘技術,建立了一個文獻挖掘平臺。該平臺可以對生物醫學文獻進行數據挖掘,發現隱含在文獻中的生物學實體及其聯系,發現深層次的生物醫學知識,自動獲取大量的第一手生物醫學數據。例如,挖掘與人類基因相關的信息,挖掘蛋白質相關信息,發現基因的功能,發現基因與疾病之間,發現蛋白質之間的相互作用等。/line對于一組給定的文獻,該平臺首先進行句法分析和生物學術語標定,然后進行語義分析,提煉每條語句的生物學含義,提取文獻中的生物醫學關聯特性,以發現文獻中的基因、蛋白質、疾病以及它們的關系。