高毅勤(昌平實驗室領銜科學家,北京大學教授、理學部副主任)發表主題演講
演講主題:人工智慧分子模型
4月7日,由北京市昌平區人民政府、央視網主辦,國家衛健委人才交流服務中心等協辦的2023全民數字健康大會,在北京市昌平區順利舉行。大會以“數字中國 健康時代”為主題,並邀請近400位政府領導、行業協會代表、學界專家、企業代表、媒體代表出席。在主旨演講環節,昌平實驗室領銜科學家、北京大學教授、理學部副主任高毅勤就生物分子人工智慧模型課題展開演講。
高毅勤介紹,隨著計算機技術的飛速發展,人工智慧越來越多地應用於生物醫藥研發的各個方面,從分子到細胞等生物物理領域都可以運用計算機進行模擬,其中較為重要的是對藥物分子的篩選和設計。由於篩查和設計分子具體與哪些蛋白相互作用所牽涉到的分子種類很多,相互作用的種類也較為繁雜,需要對整個過程進行計算,這就要求計算結果足夠快速和準確,所以人工智慧技術將發揮出越來越大的作用。
“理解生命過程特別是整個細胞命運包括轉入調控,實際上繞不開DNA在細胞核內形成染色質的結構。”高毅勤在對比目前普遍應用的癌症治療方法後發現,癌症是系統性疾病,要從系統的角度理解這一問題。但DNA在每個細胞內的長度為2米,是一個非常複雜的結構,用實驗方法獲得比較困難,且數據很難被直接利用於疾病的診斷。所以,將人工智慧和物理模型結合起來,對數據進行新的清洗,把噪音降下來,同時對丟失的信號進行補充,有利於重構這條長長的鏈形成的三維結構,並在此基礎上對不同的病人進行對比。
在演講中,高毅勤對比了一組結直腸癌細胞內染色體的三維結構。它們雖然來自不同的病人,卻高度相似,癌旁結構也較為接近。從癌到癌旁,或是從癌旁到癌,可以明顯看到三維結構的變化,以此來理解癌症的發生。
高毅勤表示,實驗證明癌細胞內的蛋白錯誤相互作用比正常細胞內的相互作用更多,利用人工智慧可以快速搜尋出癌細胞內哪些蛋白出現了不該出現的相互作用,再依據蛋白序列進行成藥。從多維組學角度出發,從染色質結構到表觀遺傳組學,利用人工智慧的快速實驗方法都可以高效率、大批量、高通量地産生出進行干預的靶點。
目前,在人工智慧的加持下,多個國家已經開展了依據蛋白結構進行成藥的研究。高毅勤介紹,華為團隊在2019年就已經開始構建國內面向函數深度的框架,來解決蛋白結構預測的相關問題。截至目前,我國已經擁有從頭寫出代碼、從頭訓練得到的完全獨立於谷歌之外的數據,可以深度學習模型進行蛋白結構預測。它不只是一個深度學習模型,也是國內首個完全自主産權的分子動力學模擬軟體,可以進行各項搜索,也可以進行高精度結合自由能力計算。在這個框架下,不僅可以用擴散生成模型來産生想要的蛋白序列,也可以産生想要的小分子化學結構,所以它也是一個可以尋找新的藥物骨架的模型。
“實際上,我們的確可以利用人工智慧或是科學計算融合來加速我們對靶點的尋找,和對藥物的設計。”在高毅勤看來,要真正實現藥物的研發和生産,還需要很多其他因素發生作用,對藥物的物理化學屬性的具體理解還要回到量子力學範疇。他將繼續致力於搭建更完整的模型,把基於量子模型的計算和分子動力學真正充分融合在一起,同時將來自醫療的數據用深度學習模型搭建起來,建設一個真正多模態、多尺度的虛擬細胞模型,並在具體過程中不斷對其進行校正、優化,最終完成實驗與人工智慧模型的融合。這一結果也有助於在給予藥物分子的過程中,可以更清楚地掌握該分子對細胞將會産生怎樣的影響,更好地發揮相應藥效,同時避免錯誤地與其他蛋白相互作用帶來不必要的毒性。