2016年,香港云服務(wù)器 美國云主機(jī),制藥公司Sunovion給一群經(jīng)驗(yàn)豐富的員工布置了一項(xiàng)不同尋常的作業(yè)。在位于美國馬薩諸塞州馬爾伯勒的公司總部,這些藥劑師被要求玩一個(gè)游戲,以便確定誰能發(fā)現(xiàn)針對新藥的最好的先導(dǎo)化合物。他們的工作臺上是一個(gè)由上百種化學(xué)結(jié)構(gòu)組成的網(wǎng)格,其中僅有10種被標(biāo)上了關(guān)于其生物效應(yīng)的信息。專家們不得不利用辛苦獲得的化學(xué)結(jié)構(gòu)和生物學(xué)方面的知識,選擇其他可能最終成為候選藥物的分子。在11名參與者中,有10人花了好幾個(gè)小時(shí)才艱難地完成任務(wù)。不過,有1名參與者僅用了幾毫秒便輕松過關(guān)——因?yàn)樗且粋€(gè)算法。
這個(gè)電腦程序是Willem van Hoorn腦力勞動(dòng)的產(chǎn)物。van Hoorn是利用人工智能設(shè)計(jì)藥物的初創(chuàng)公司——Exscientia化學(xué)信息學(xué)部門的負(fù)責(zé)人。該公司總部位于英國敦提,想同Sunovion擴(kuò)展新興的伙伴關(guān)系,因此這次比賽事關(guān)重大。“我的信譽(yù)冒著極大的風(fēng)險(xiǎn)。”van Hoorn說。20輪游戲過后,他統(tǒng)計(jì)了得分,然后長舒了一口氣。只有一位尋找藥物的專家打敗了機(jī)器。
自此以后,Exscientia和Sunovion繼續(xù)開展合作,以發(fā)現(xiàn)精神治療藥物。“這場競賽確實(shí)幫助獲得了那些作出化學(xué)研究決定的人們的支持。”在Sunovion公司負(fù)責(zé)計(jì)算化學(xué)業(yè)務(wù)的Scott Brown表示。
探索化學(xué)宇宙
要想在化學(xué)宇宙中“航行”,最好有一幅地圖。2001年,瑞士伯爾尼大學(xué)化學(xué)家Jean-Louis Reymond開始利用計(jì)算機(jī)繪制盡可能多的化學(xué)空間。16年后,他積累了全世界最大的小分子數(shù)據(jù)庫——由1660億種化合物構(gòu)成的巨大虛擬庫。這個(gè)被稱為GDB-17的數(shù)據(jù)庫包括所有最多由17個(gè)原子構(gòu)成并且從化學(xué)角度看很合理的有機(jī)分子。這也是Reymond的計(jì)算機(jī)所能處理的數(shù)據(jù)量的上限。
為理解這些繁多的可能的藥物起點(diǎn),Reymond想到了一種組織化學(xué)宇宙的方法。受元素周期表的啟發(fā),他將化合物在一個(gè)多維空間中分組。在這個(gè)空間中,鄰近的化合物擁有相關(guān)聯(lián)的屬性。位置則根據(jù)諸如每種化合物有多少個(gè)碳原子等42個(gè)特征進(jìn)行分配。
對于每種進(jìn)入市場的藥物來說,會(huì)有幾百萬種化合物在化學(xué)性質(zhì)上和其幾乎相同。其中一些化合物的表現(xiàn)甚至比已經(jīng)獲批的藥物還好。藥劑師在沒有外界幫助的情況下幾乎不可能想象出所有這些差異。“光用紙和筆,你肯定沒辦法搞清楚這些同分異構(gòu)體。”Reymond表示。
Reymond和同事通過尋找化合物之間的相似性,辨別出在治療上有前景的被證實(shí)藥物的“近鄰”。該團(tuán)隊(duì)利用一種特定的藥物作為起點(diǎn),僅在3分鐘內(nèi)便梳理了數(shù)據(jù)庫中所有1660億種化合物,以尋找引人注目的候選藥物。在一項(xiàng)概念驗(yàn)證實(shí)驗(yàn)中,Reymond從一種同煙堿型乙酰膽堿受體(一個(gè)和神經(jīng)系統(tǒng)以及肌肉功能相關(guān)的疾病的有用靶點(diǎn))相結(jié)合的已知分子入手,編輯了一個(gè)由344種相關(guān)化合物組成的最終候選藥物名單。該團(tuán)隊(duì)合成了3種藥物,并且發(fā)現(xiàn)有兩種可強(qiáng)有力地激活上述受體,因此可能在治療衰老過程中出現(xiàn)的肌肉萎縮方面排上用場。Reymond介紹說,這種方法就像利用地質(zhì)圖弄清楚到哪里開采黃金。“你需要一些方法選擇將去哪里挖掘。”
另一種替代方法
另一種替代方法利用計(jì)算機(jī)獲得眾多金礦位置,而無須過多擔(dān)心起始地點(diǎn)。就尋找藥物而言,這意味著在巨大的化合物庫中進(jìn)行篩選,以尋找同既定蛋白相結(jié)合的小分子。首先,研究人員利用X射線結(jié)晶學(xué)拍下蛋白的快照,以確定結(jié)合部位的形狀。隨后,利用分子對接算法,計(jì)算化學(xué)家一步步地搜遍整個(gè)化合物數(shù)據(jù)庫,以尋找針對任何既定部位的最佳匹配小分子。
隨著計(jì)算能力的爆發(fā),這些算法的性能也得以改善。2016年,由Brian Shoichet領(lǐng)導(dǎo)的加州大學(xué)舊金山分校化學(xué)家在尋找一類新的止痛藥的過程中,展示了這種方法的潛力。該團(tuán)隊(duì)篩選了300多萬種市場上可買到的化合物,目標(biāo)是尋找在不干擾密切相關(guān)的β-arrestin信號通路的情況下可選擇性激活μ-阿片受體信號以緩解疼痛感的候選藥物。研究認(rèn)為,β-arrestin信號通路同阿片類藥物的副作用存在關(guān)聯(lián),包括呼吸速率下降和便秘。研究人員迅速從巨大的化合物數(shù)據(jù)庫中篩選出23種排名靠前的化合物,以供后續(xù)研究。
在試管中,7種候選藥物具有所期望的活性。進(jìn)一步的研發(fā)將其中一種轉(zhuǎn)變成PZM21—— 一種作用于μ-阿片受體但無須激活β-arrestin的化合物。目前,總部位于舊金山、由Shoichet共同創(chuàng)建的生物技術(shù)公司Epiodyne正試圖基于這些發(fā)現(xiàn)開發(fā)更加安全的止痛藥。Shoichet計(jì)劃利用相同方法尋找調(diào)節(jié)其他G蛋白偶聯(lián)受體(GPCR)的化合物。GPCR是一類據(jù)估測占到40%藥物靶點(diǎn)的蛋白家族。