文章來源公眾號(hào):智藥邦 作者:智藥邦
在生命科學(xué)領(lǐng)域,人工智能的應(yīng)用正以前所未有的速度,重塑我們對(duì)生物系統(tǒng)的理解和改造能力。
2025年9月19日,Nature發(fā)表新聞文章World’s first AI-designed viruses a step towards AI-generated life,評(píng)述了Hie、King及其同事近期的一項(xiàng)AI設(shè)計(jì)病毒的研究。
2025年9月17日,由Hie、King及其同事在bioRxiv發(fā)表研究的Generative design of novel bacteriophages with genome language models,帶來了一項(xiàng)突破性的進(jìn)展:首次利用基因組語言模型成功設(shè)計(jì)了功能性噬菌體(bacteriophage)的全基因組,并實(shí)驗(yàn)驗(yàn)證了其感染性和生物學(xué)特性。這項(xiàng)研究標(biāo)志著人工智能驅(qū)動(dòng)的全基因組設(shè)計(jì)邁出了關(guān)鍵一步。

加州斯坦福大學(xué)計(jì)算生物學(xué)家Brian Hie表示:"這是人工智能系統(tǒng)首次能夠編寫具有連貫性的基因組規(guī)模序列。下一步將是AI生成的生命。希望這類策略能夠補(bǔ)充現(xiàn)有的噬菌體療法,并最終增強(qiáng)針對(duì)特定病原體的治療手段。"
但他的同事Samuel King指出:"要設(shè)計(jì)完整的活體生物,還需要取得許多實(shí)驗(yàn)進(jìn)展。"
計(jì)算機(jī)生成的基因組
AI模型先前已被用于生成DNA序列、單蛋白及多組分復(fù)合物。但由于基因間復(fù)雜的相互作用以及基因復(fù)制與調(diào)控過程,設(shè)計(jì)完整基因組更具挑戰(zhàn)性。
Hie表示:"如今這些AI系統(tǒng)能幫助科學(xué)家操控高度復(fù)雜的生物系統(tǒng),例如完整基因組。許多重要生物功能只有通過設(shè)計(jì)完整基因組才能實(shí)現(xiàn)。"
研究人員使用能夠分析生成DNA、RNA和蛋白質(zhì)序列的AI模型Evo1和Evo2設(shè)計(jì)病毒基因組。他們首先選定ΦX174噬菌體作為設(shè)計(jì)模板——這種簡(jiǎn)單的單鏈DNA病毒包含5,386個(gè)核苷酸構(gòu)成的11個(gè)基因,具備感染宿主并在宿主體內(nèi)復(fù)制的全部遺傳元件。
圖1 Evo生成真實(shí)噬菌體基因組序列
Evo模型雖已接受200多萬個(gè)噬菌體基因組的訓(xùn)練,但研究人員通過監(jiān)督學(xué)習(xí)進(jìn)一步訓(xùn)練模型生成具有感染大腸桿菌功能的類ΦX174病毒基因組,重點(diǎn)針對(duì)抗生素耐藥菌株。研究人員評(píng)估數(shù)千個(gè)AI生成的序列后,篩選出302個(gè)可行的噬菌體方案。大多數(shù)候選方案與ΦX174的核苷酸同一性超過40%,部分方案則具有完全不同的編碼序列。
圖2 噬菌體基因組設(shè)計(jì)篩選的補(bǔ)充數(shù)據(jù)
研究人員合成了這些AI設(shè)計(jì)的基因組DNA,將其插入宿主細(xì)菌培育噬菌體。實(shí)驗(yàn)測(cè)試發(fā)現(xiàn),302個(gè)AI設(shè)計(jì)的噬菌體中有約16個(gè)表現(xiàn)出對(duì)大腸桿菌的宿主特異性感染能力。研究人員還發(fā)現(xiàn),組合使用的AI設(shè)計(jì)噬菌體可感染并殺死三種不同大腸桿菌菌株——野生型ΦX174菌株無法做到這一點(diǎn)。
圖3 合成噬菌體基因組設(shè)計(jì)候選物的比對(duì)
生物安全問題
紐約冷泉港實(shí)驗(yàn)室計(jì)算生物學(xué)家Peter Koo評(píng)價(jià):"這項(xiàng)研究展示了當(dāng)今技術(shù)的可能性,為未來更宏大的應(yīng)用奠定了基礎(chǔ)"。他同時(shí)指出,Evo模型仍需團(tuán)隊(duì)干預(yù)引導(dǎo)才能設(shè)計(jì)病毒,但整個(gè)系統(tǒng)流程表明該方法可能產(chǎn)生功能性基因組。
關(guān)于AI設(shè)計(jì)危害人類病毒的倫理問題,德國海德堡大學(xué)生物物理學(xué)家Kerstin Göpfrich表示:"這種'雙重用途困境'并非AI獨(dú)有,始終存在于生物學(xué)領(lǐng)域。"研究人員在論文中強(qiáng)調(diào)排除了涉及真核生物(包括人類)的病毒訓(xùn)練數(shù)據(jù),且研究的ΦX174噬菌體和大腸桿菌宿主系統(tǒng)具有"長(zhǎng)期的分子生物學(xué)研究安全使用史"。
研究人員希望該方法今后能安全生成AI設(shè)計(jì)的病毒,用于治療細(xì)菌耐藥性等公共衛(wèi)生問題。Göpfrich預(yù)測(cè):"這必將成為蓬勃發(fā)展的領(lǐng)域,令我無比振奮。"
意義與前景
此項(xiàng)研究首次實(shí)現(xiàn)了利用基因組語言模型設(shè)計(jì)功能完整的噬菌體基因組。其建立的計(jì)算框架(涵蓋新的基因注釋方法和多樣化的評(píng)估指標(biāo))、可控的設(shè)計(jì)流程(可引導(dǎo)至目標(biāo)基因組結(jié)構(gòu)和宿主趨向),以及實(shí)驗(yàn)驗(yàn)證策略(成功產(chǎn)生16個(gè)功能性噬菌體),為生成基因組學(xué)(generative genomics)領(lǐng)域提供了寶貴藍(lán)圖。
圖4 預(yù)測(cè)ΦX174樣序列中基因的方法
該研究的意義在于:第一,它為探索全新的、自然界中尚未發(fā)現(xiàn)的進(jìn)化空間提供了強(qiáng)大的策略。生成的噬菌體在序列多樣性和結(jié)構(gòu)創(chuàng)新方面均展示了實(shí)質(zhì)性突破,如Evo-Φ2147已達(dá)到可被歸類為新噬菌體物種的低序列同源性(<95% ANI)。第二,它為設(shè)計(jì)具有更高活力和更快裂解動(dòng)力學(xué)的高適應(yīng)性基因組提供了高效手段,這對(duì)噬菌體相關(guān)生物技術(shù)的應(yīng)用至關(guān)重要。第三,它初步證明了AI設(shè)計(jì)產(chǎn)生的多樣化噬菌體在混合療法中快速克服細(xì)菌耐藥性的巨大潛力,為解決抗生素耐藥性(antibiotic resistance)提供了新思路。最后,也為未來設(shè)計(jì)基因組更大、更復(fù)雜的生物系統(tǒng)奠定了基礎(chǔ)。
隨著基因組語言模型能力的持續(xù)提升,以及DNA合成與組裝技術(shù)的不斷發(fā)展,我們有望看到生成基因組設(shè)計(jì)擴(kuò)展到更復(fù)雜的病毒模型,甚至最終邁向完整生命體的設(shè)計(jì)。這項(xiàng)研究不僅是合成生物學(xué)(synthetic biology)與人工智能融合的里程碑,更預(yù)示著未來的生物技術(shù)工具箱中,基因組設(shè)計(jì)將與基因組測(cè)序、合成、編輯并駕齊驅(qū),成為一項(xiàng)核心技術(shù)。