在上海張江科學(xué)城的實驗室里,科學(xué)家正見證一場生命極限的突破——90攝氏度的密閉罐里,酶正在快速“瓦解”塑料。這款耐高溫的塑料降解酶,是上海交通大學(xué)洪亮教授團隊用AI設(shè)計改造的“新品”蛋白質(zhì)。
當傳統(tǒng)生物學(xué)家還在實驗室用移液槍逐個測試蛋白質(zhì)功能、組裝“理想型”蛋白質(zhì)時,洪亮團隊的AI大模型“啟明星”已構(gòu)建出億級蛋白質(zhì)的“功能圖譜”,能夠精準、高效地設(shè)計出耐熱、耐堿、耐酸等“超能”蛋白質(zhì),滿足“定制”蛋白質(zhì)的需求。
蛋白質(zhì)是生命活動的物質(zhì)基礎(chǔ),自然界中參與構(gòu)成蛋白質(zhì)的氨基酸有20種,一個蛋白質(zhì)分子通常由幾十個至上千個數(shù)量不等的氨基酸按照特定順序排列而成。排序的細微差別,可能讓蛋白質(zhì)表現(xiàn)出截然不同的功能特性,比如穩(wěn)定性、活性、親和力等。過去數(shù)十年間,生物學(xué)家只能依靠實驗方法來測定蛋白質(zhì)的結(jié)構(gòu),揭示復(fù)雜的蛋白質(zhì)結(jié)構(gòu)會耗費生物學(xué)家大量時間。2018年,谷歌DeepMind團隊發(fā)布了AI大模型AlphaFold,它能精準地解析蛋白質(zhì)的三維構(gòu)造,為科研人員更高效、更精準地進行藥物開發(fā)、疫苗設(shè)計奠定基礎(chǔ)。
“使用AI設(shè)計蛋白質(zhì)時,我們就在思考,設(shè)計的目的是滿足某些功能需求,為何不訓(xùn)練AI模型,把滿足功能需求的蛋白質(zhì)直接設(shè)計出來?”洪亮團隊決定訓(xùn)練一個與AlphaFold不同的AI大模型,挑戰(zhàn)蛋白質(zhì)功能設(shè)計的難關(guān)。
“我們利用AI技術(shù)學(xué)習(xí)不同自然環(huán)境下,各種生物體內(nèi)蛋白質(zhì)鏈條中氨基酸的排列規(guī)則。更重要的是,我們從溫度、酸堿度、壓強這3個維度,為5億個蛋白質(zhì)打上功能標簽,然后把這海量的功能標簽‘投喂’給AI大模型,使之能快速、精準地設(shè)計出耐熱、耐酸、耐堿的‘皮實’蛋白產(chǎn)品?!焙榱琳f。
如果把一個蛋白質(zhì)看作一塊模具,那么整個數(shù)據(jù)集就是裝滿90億塊模具的超級工具箱,這是迄今為止全球最大的蛋白質(zhì)數(shù)據(jù)集。由36.2億條陸地微生物蛋白質(zhì)序列、26.4億條海洋微生物蛋白質(zhì)序列、24.3億條抗體蛋白質(zhì)序列、0.6億條病毒蛋白質(zhì)序列等組成的蛋白質(zhì)數(shù)據(jù)集中,蘊藏著從地表到極地冰川、深海溝壑的“適者生存法則”。
“比如這款耐熱的塑料降解酶,我們先從‘啟明星’中挑出幾個具備耐熱功能的蛋白質(zhì)‘模具’,再使用AI技術(shù)修飾改造這些蛋白質(zhì)‘模具’的氨基酸序列,提高它的耐熱性,同步進行實驗驗證,從而避免了過去的高通量篩選,提升了蛋白質(zhì)設(shè)計與改造的效率。”洪亮說。
在上海交通大學(xué)張江校區(qū)的自動化實驗室里,機械臂正飛快地驗證著AI設(shè)計的蛋白質(zhì)。這里每天產(chǎn)生的實驗數(shù)據(jù),又會回流到AI系統(tǒng)中持續(xù)優(yōu)化蛋白質(zhì)模具,形成“數(shù)據(jù)—模型—實驗”的增強循環(huán),洪亮形象地稱之為“蛋白質(zhì)的自動駕駛模式”?!拔覀兊哪康木褪亲屧O(shè)計AI化、實驗自動化,把復(fù)雜的蛋白質(zhì)科學(xué)變成簡單的工程過程。”洪亮說。
截至目前,已有8個產(chǎn)業(yè)項目使用“啟明星”大模型設(shè)計蛋白質(zhì),成功率達70%。這種突破正在改寫產(chǎn)業(yè)規(guī)則:某生物醫(yī)藥企業(yè)利用“啟明星”設(shè)計的極度耐堿的蛋白質(zhì),使用壽命提高一倍多,每年可為企業(yè)節(jié)省上千萬元的成本。
談及未來圖景,洪亮這樣描繪:生物學(xué)家只需在電腦上輸入需求,AI就能自動生成候選蛋白質(zhì)“模具”,自動化平臺完成驗證優(yōu)化。這不僅能夠?qū)⒖蒲腥藛T從重復(fù)實驗中解放,更可能催生“定制化合成生物”的全新產(chǎn)業(yè)形態(tài)。
由中國科研團隊建立的蛋白質(zhì)大模型及部分數(shù)據(jù)集已于日前發(fā)布,并在軟件托管平臺GitHub上開源,供全世界的科研機構(gòu)接入。
站在合成生物產(chǎn)業(yè)的新賽道,洪亮說,當AI開始理解生命的“設(shè)計邏輯”,我們或許正在見證新的產(chǎn)業(yè)革命——在這個蛋白質(zhì)可以被精準“編程”的時代,從醫(yī)藥研發(fā)到環(huán)境保護,生命科學(xué)將向前邁出更大的步伐。
本文鏈接:http://m.enbeike.cn/news-8-4424-0.html用AI設(shè)計蛋白質(zhì),滿足“定制”需求
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇:上海交大曾小勤:科技傳播不應(yīng)停留于知識搬運
下一篇:第 17 屆全國大學(xué)生廣告藝術(shù)大賽山東賽區(qū)名家名師校園創(chuàng)意巡講活動在山東建筑大學(xué)舉行
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕