來源:中國電商物流網(wǎng) 發(fā)布時間:2022-2-14 10:26
2 月 10 日消息,據(jù)中國科大官網(wǎng),中國科學技術大學劉海燕教授、陳泉副教授團隊采用數(shù)據(jù)驅(qū)動策略,開辟出一條全新的蛋白質(zhì)從頭設計路線。
相關成果以“用于蛋白質(zhì)設計的以主鏈為中心的神經(jīng)網(wǎng)絡能量函數(shù)”為題于北京時間 2 月 10 日發(fā)表于 Nature。
據(jù)介紹,蛋白質(zhì)是生命的基礎,是生命功能的主要執(zhí)行者,其結構與功能由氨基酸序列所決定。目前,能夠形成穩(wěn)定三維結構的蛋白質(zhì),幾乎全部是天然蛋白質(zhì),其氨基酸序列是長期自然進化形成。在天然蛋白結構功能不能滿足工業(yè)或醫(yī)療應用需求時,想要得到特定的功能蛋白,就需要對其結構和序列進行設計。
中國科學技術大學相關團隊長期深耕計算結構生物學方向的基礎研究和應用基礎研究。劉海燕教授、陳泉副教授團隊十余年來致力于發(fā)展數(shù)據(jù)驅(qū)動的蛋白質(zhì)設計方法,建立并實驗驗證了給定主鏈結構設計氨基酸序列的 ABACUS 模型,進而發(fā)展了能在氨基酸序列待定時從頭設計全新主鏈結構的 SCUBA 模型(圖 1)。SCUBA 采用了一種新的統(tǒng)計學習策略,基于核密度估計(或近鄰計數(shù),NC)和神經(jīng)網(wǎng)絡擬合(NN)方法,從原始結構數(shù)據(jù)中得到神經(jīng)網(wǎng)絡形式的解析能量函數(shù),能夠高保真地反應實際蛋白質(zhì)結構中不同結構變量間的高維相關關系,在不確定序列的前提下,連續(xù)、廣泛地搜索主鏈結構空間,自動產(chǎn)生“高可設計性”主鏈。
▲ 圖 1.用 SCUBA 模型進行蛋白質(zhì)設計的原理。(a) SCUBA 主鏈能量面上的極小對應了蛋白質(zhì)的可設計主鏈結構,即特定氨基酸序列下的最低自由能結構;(b) SCUBA 中用神經(jīng)網(wǎng)絡表示的統(tǒng)計能量項;(c) 和(d) 用近鄰計數(shù)(NC)-神經(jīng)網(wǎng)絡(NN)方法從蛋白質(zhì)結構原始數(shù)據(jù)中學習解析能量函數(shù)的方法框架 | 圖源:中國科大官網(wǎng)
理論計算和實驗證明,用 SCUBA 設計主鏈結構,能夠突破只能用天然片段來拼接產(chǎn)生新主鏈結構的限制,顯著擴展從頭設計蛋白的結構多樣性,進而設計出不同于已知天然蛋白的新穎結構。“SCUBA 模型 + ABACUS 模型”構成了能夠從頭設計具有全新結構和序列的人工蛋白完整工具鏈,是 RosettaDesign 之外目前唯一經(jīng)充分實驗驗證的蛋白質(zhì)從頭設計方法,并與之互為補充。在論文中,團隊報道了 9 種從頭設計的蛋白質(zhì)分子的高分辨晶體結構 (圖 2),它們的實際結構與設計模型一致,其中 5 種蛋白質(zhì)具有天然蛋白質(zhì)中尚未觀察到的新型拓撲結構。
▲ 圖 2.從頭設計蛋白的高分辨晶體結構(天藍色)與設計模型(綠色)比較 | 圖源:中國科大官網(wǎng)
原文鏈接:
https://www.nature.com/ articles / s41586-021-04383-5