由瑞士生物信息研究所和巴塞爾大學(xué)聯(lián)合舉辦的全球持續(xù)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽CAMEO(Continous Automated Model EvaluatiOn),與CASP(Critical Assessment of Techniques for Protein Structure Prediction)并列為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的最重要的兩大權(quán)威競(jìng)賽。CAMEO競(jìng)賽的得分和排名每周更新,每個(gè)參賽組每周需對(duì)約20個(gè)由權(quán)威結(jié)構(gòu)生物學(xué)家最新破解出的蛋白質(zhì)結(jié)構(gòu)進(jìn)行預(yù)測(cè)。該競(jìng)賽自舉辦以來(lái),吸引了來(lái)自世界范圍內(nèi)眾多生物計(jì)算領(lǐng)域頂級(jí)實(shí)驗(yàn)室和企業(yè)參加,包括清華大學(xué)、北京大學(xué)、谷歌、百度、騰訊和華為。
蛋白質(zhì)對(duì)于生命體至關(guān)重要,了解其空間結(jié)構(gòu)可以促進(jìn)對(duì)蛋白質(zhì)功能的原理性理解。因此,根據(jù)氨基酸序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)一直以來(lái)是生物領(lǐng)域的核心任務(wù)之一,具有重大的生物學(xué)研究意義。DeepMind開(kāi)發(fā)的AlphaFold2采用AI技術(shù),取得了與冷凍電子顯微鏡等實(shí)驗(yàn)技術(shù)相當(dāng)?shù)木人剑环Q(chēng)作結(jié)構(gòu)生物學(xué)“革命性”的突破、蛋白質(zhì)研究領(lǐng)域的里程碑,因此被《Science》和《Nature》評(píng)為2021年度十大發(fā)現(xiàn)和突破。AlphaFold2開(kāi)啟了AI+生命科學(xué)的新時(shí)代,但一切都處于起步階段,仍有許多挑戰(zhàn)性難題亟待解決。
由西湖大學(xué)李子青團(tuán)隊(duì)開(kāi)發(fā)的ManiFold,致力于為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)這一生命科學(xué)領(lǐng)域的關(guān)鍵性問(wèn)題提供可拓展的系統(tǒng)化解決方案,是一個(gè)采用AI技術(shù)、集成結(jié)構(gòu)生物學(xué)領(lǐng)域知識(shí)和高維數(shù)據(jù)流形約束解決蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的系統(tǒng)。ManiFold融合了單序列蛋白質(zhì)語(yǔ)言模型,減少了對(duì)同源序列信息的依賴(lài),增強(qiáng)了蛋白質(zhì)序列編碼器的表征能力;采用旋轉(zhuǎn)和平移等變約束增強(qiáng)了結(jié)構(gòu)解碼器;進(jìn)一步采用主鏈與側(cè)鏈迭代方式,優(yōu)化預(yù)測(cè)結(jié)果。
在最近的三個(gè)月(2022.08.05-2022.10.29),ManiFold蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)均表現(xiàn)優(yōu)異,連續(xù)三個(gè)月的綜合表現(xiàn)位居全球第一名,參賽四個(gè)月多次取得月排名、周排名第一至第三的佳績(jī)。這證明了ManiFold系統(tǒng)的優(yōu)越性和穩(wěn)定性,也展示了開(kāi)發(fā)團(tuán)隊(duì)在A(yíng)I+蛋白質(zhì)計(jì)算建模的實(shí)力。
西湖大學(xué)講席教授李子青負(fù)責(zé)的人工智能研究與創(chuàng)新實(shí)驗(yàn)室,致力于A(yíng)I基礎(chǔ)方法和AI for Science技術(shù)研究。未來(lái),團(tuán)隊(duì)將繼續(xù)致力于研究新型AI方法,解決蛋白質(zhì)結(jié)構(gòu)、蛋白質(zhì)設(shè)計(jì)和藥物研發(fā)等的前沿科學(xué)技術(shù)問(wèn)題。