1聚焦的痛點(diǎn)問題:?jiǎn)渭?xì)胞蛋白質(zhì)組學(xué)改變了傳統(tǒng)上從單細(xì)胞轉(zhuǎn)錄組水平推斷蛋白質(zhì)的不足,其發(fā)展主要受到納米級(jí)樣品和復(fù)雜的實(shí)驗(yàn)程序的限制。數(shù)量少、豐度低的蛋白質(zhì)容易受到噪聲的干擾,導(dǎo)致蛋白質(zhì)鑒定困難。與大量蛋白質(zhì)數(shù)據(jù)相比,單細(xì)胞中的蛋白質(zhì)水平較低,質(zhì)譜數(shù)據(jù)的MS/MS光譜中可檢測(cè)到的高信度碎片段離子更加稀少。許多肽段沒有產(chǎn)生足夠的碎片離子來(lái)支持自身被鑒定的置信度,這使得提高單細(xì)胞蛋白質(zhì)組質(zhì)譜數(shù)據(jù)的蛋白質(zhì)覆蓋率具有較高的挑戰(zhàn)性。2競(jìng)爭(zhēng)優(yōu)勢(shì)分析:目前單細(xì)胞蛋白質(zhì)組質(zhì)譜數(shù)據(jù)分析方法主要包括:基于蛋白質(zhì)質(zhì)譜檢索軟件來(lái)進(jìn)行單細(xì)胞蛋白質(zhì)組質(zhì)譜數(shù)據(jù)蛋白質(zhì)鑒定和定量;機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)習(xí)等方法進(jìn)行單細(xì)胞蛋白質(zhì)組質(zhì)譜數(shù)據(jù)蛋白質(zhì)鑒定和定量;如Maxquant,DART-ID,MokaPot。但上述方法缺少考慮單細(xì)胞蛋白質(zhì)MS/MS譜圖碎片離子較少,導(dǎo)致蛋白質(zhì)水平有限。本方法DeepSCP相較上述方法,顯著提升預(yù)測(cè)肽匹配譜圖數(shù)量,顯著提升鑒定肽段與蛋白數(shù)量和細(xì)胞聚類效果。
市場(chǎng)應(yīng)用前景:本發(fā)明有助于提高單細(xì)胞蛋白質(zhì)組質(zhì)譜數(shù)據(jù)的蛋白質(zhì)鑒定水平,并促進(jìn)單細(xì)胞蛋白質(zhì)組學(xué)的未來(lái)發(fā)展和應(yīng)用。
發(fā)展規(guī)劃:提供一種基于深度學(xué)習(xí)提高單細(xì)胞蛋白質(zhì)組鑒定覆蓋率的方法,提高單細(xì)胞蛋白質(zhì)組質(zhì)譜數(shù)據(jù)的肽段、蛋白的鑒定水平。
掃碼關(guān)注,查看更多科技成果