狠狠色丁香久久综合婷婷亚洲成人福利在线-欧美日韩在线观看免费-国产99久久久久久免费看-国产欧美在线一区二区三区-欧美精品一区二区三区免费观看-国内精品99亚洲免费高清


            化工儀器網(wǎng)首頁(yè)>資訊中心>項(xiàng)目成果>正文

            蛋白質(zhì)研究的AI革命
            2025年04月07日 11:02:52 來(lái)源:化工儀器網(wǎng) 作者:羊舌木 點(diǎn)擊量:1766

            近期,發(fā)表于《自然-機(jī)器智能》的一項(xiàng)研究引人注目,名為InstaNova的蛋白質(zhì)測(cè)序AI脫穎而出。該款A(yù)I能夠識(shí)別傷口中的致病蛋白和海水樣本中微生物產(chǎn)生的未知蛋白。

              近年來(lái),人工智能(AI)已徹底改變了蛋白質(zhì)研究領(lǐng)域,其不僅助力研究人員輕松預(yù)測(cè)蛋白質(zhì)的3D結(jié)構(gòu),更在蛋白質(zhì)測(cè)序方面展現(xiàn)出巨大潛力,相關(guān)成就榮膺2024年諾貝爾化學(xué)獎(jiǎng)。時(shí)至今日,科學(xué)家們已經(jīng)推出了20多種蛋白質(zhì)測(cè)序AI。美國(guó)華盛頓大學(xué)蛋白質(zhì)組學(xué)AI開(kāi)發(fā)人員William Noble指出:“很明顯,這是該領(lǐng)域的發(fā)展方向。”
             
              蛋白質(zhì)的復(fù)雜性遠(yuǎn)超DNA和RNA,人類基因組雖僅包含約2萬(wàn)個(gè)基因,卻能產(chǎn)生1000萬(wàn)種不同的蛋白質(zhì)。傳統(tǒng)上,生物學(xué)家通過(guò)將蛋白質(zhì)分解成肽(由5到20個(gè)氨基酸組成的短片段)來(lái)識(shí)別蛋白質(zhì),并利用質(zhì)譜儀測(cè)量這些短片段的重量,與數(shù)據(jù)庫(kù)中已知肽的重量進(jìn)行匹配。
             
              然而,這種方法存在明顯局限,質(zhì)譜法發(fā)現(xiàn)的高達(dá)70%的肽并不存在于現(xiàn)有數(shù)據(jù)庫(kù)中。丹麥技術(shù)大學(xué)蛋白質(zhì)組學(xué)專家Timothy Patrick Jenkins形象地比喻道:“傳統(tǒng)蛋白質(zhì)組學(xué)有點(diǎn)像利用搜索引擎進(jìn)行搜索。如果它不在數(shù)據(jù)庫(kù)中,你就搜索不到它。”
             
              近期,發(fā)表于《自然-機(jī)器智能》的一項(xiàng)研究引人注目,名為InstaNova的蛋白質(zhì)測(cè)序AI脫穎而出。該款A(yù)I能夠識(shí)別傷口中的致病蛋白和海水樣本中微生物產(chǎn)生的未知蛋白。
             
              AI的出現(xiàn)為蛋白質(zhì)測(cè)序帶來(lái)了新的突破。它們不會(huì)費(fèi)力尋找匹配的已知肽,而是計(jì)算所有可能由給定長(zhǎng)度肽化學(xué)修飾產(chǎn)生的潛在肽片段的重量,并嘗試將其組裝成全長(zhǎng)蛋白質(zhì)。
             
              為了提高準(zhǔn)確性,蛋白質(zhì)測(cè)序AI在數(shù)百萬(wàn)個(gè)已知肽及其組裝方式的基礎(chǔ)上進(jìn)行訓(xùn)練,習(xí)得氨基酸鏈結(jié)合的最常見(jiàn)方式。這種方法類似于大型語(yǔ)言模型,如ChatGPT在大量文本上訓(xùn)練以學(xué)習(xí)語(yǔ)法規(guī)則,蛋白質(zhì)組學(xué)AI則習(xí)得了一種蛋白質(zhì)“語(yǔ)法”,為給定的一組肽提供了最可能的序列。
             
              2021年,Noble和同事推出了第一個(gè)使用深度神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)測(cè)序AI——Casanovo,2024年發(fā)表于《自然-通訊》的論文中。Casanovo擅長(zhǎng)識(shí)別訓(xùn)練數(shù)據(jù)中沒(méi)有的新肽序列,尤其在識(shí)別免疫系統(tǒng)攻擊癌癥時(shí)靶向的細(xì)胞表面肽以及海水樣本中的未知蛋白質(zhì)方面表現(xiàn)出色。
             
              而Jenkins和同事們開(kāi)發(fā)的InstaNova,則在深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上引入了擴(kuò)散模型。在與Casanovo的面對(duì)面測(cè)試中,InstaNova與升級(jí)款I(lǐng)nstanNova+結(jié)合,在9種生物的實(shí)驗(yàn)室蛋白質(zhì)混合物中鑒定出42%的肽。在實(shí)際應(yīng)用中,InstaNova從感染的腿部傷口中鑒定出1225種人血白蛋白特有的肽,是傳統(tǒng)方法檢索結(jié)果的10倍,其中254種為數(shù)據(jù)庫(kù)中沒(méi)有的新肽。
             
              蛋白質(zhì)測(cè)序AI的應(yīng)用領(lǐng)域遠(yuǎn)不止于此。英國(guó)劍橋大學(xué)蛋白質(zhì)組學(xué)研究員Matthew Collins正在測(cè)試幾種蛋白質(zhì)測(cè)序AI工具分析考古樣本的能力。他指出,大多數(shù)情況下,樣本中的蛋白質(zhì)在地下經(jīng)過(guò)漫長(zhǎng)歲月后發(fā)生了化學(xué)變化,或者它們來(lái)自早已滅絕的動(dòng)植物,因此不太可能存在于傳統(tǒng)蛋白質(zhì)和肽數(shù)據(jù)庫(kù)中,而這些AI模型尤其適用于混亂環(huán)境中蛋白質(zhì)的檢測(cè)。利用AI工具,Collins團(tuán)隊(duì)已在尼安德特人遺址中發(fā)現(xiàn)兔子蛋白質(zhì)的特征,并在古代巴西的盆中發(fā)現(xiàn)魚(yú)類肌肉蛋白質(zhì)特征。
             
              隨著AI技術(shù)的不斷發(fā)展,蛋白質(zhì)研究領(lǐng)域正迎來(lái)前所未有的變革。從預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)到精準(zhǔn)測(cè)序,AI正逐步揭開(kāi)蛋白質(zhì)的神秘面紗,為生命科學(xué)的研究和應(yīng)用開(kāi)辟新的道路。
             
              (資料參考來(lái)源:中國(guó)科學(xué)報(bào))
            關(guān)鍵詞

            相關(guān)閱讀 Related Reading

            查看更多+

            版權(quán)與免責(zé)聲明

            • 凡本網(wǎng)注明“來(lái)源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其他方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來(lái)源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
            • 本網(wǎng)轉(zhuǎn)載并注明自其他來(lái)源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來(lái)源,并自負(fù)版權(quán)等法律責(zé)任。
            • 如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。