在创新药物研(yan)发(fa)中,一个核心问题(ti)是(shi)如何快速发(fa)现具有理(li)想(xiang)生物学(xue)特性的新化学(xue)实体(ti)。然而,满足Lipinski's类(lei)药性的(de)(de)化学空间所包含(han)的(de)(de)理论分子(zi)数可(ke)能超过(guo)1063[1],如何更高效地探索这样巨大的多样性空间,找到具有良好的可合成性和成药性的新分子是摆在计算化学家和药物化学家面前的一道难题。针对这一问题,Reymond团队利用穷举法构(gou)建重原(yuan)子数在13到17范围之内的分子结(jie)构,建立了包含(han)有(you)166亿个化合物的GDB库[2];Levré等人从市售(shou)的炔烃和叠(die)氮化物出发通过使用Click反应规则构建了Zinclick数据库[3],该库(ku)具有较好的可合成性但(dan)结构类(lei)型相对单一(yi);此外,也有一(yi)些基于(yu)人工智能(Artificial Intelligence,AI) 方法,例如Segler等人利用LSTM模型设计集中化合物库[4],Zhavoronkov等人(ren)将基于生(sheng)成对抗(kang)网络(luo) (GANs)的(de)AI技术应用到化(hua)学(xue)空间探(tan)索[5]。虽(sui)然(ran)方法众多,但这些(xie)虚拟(ni)化合物(wu)库都面临着多样性(xing)、可合成性(xing)和成药性(xing)的(de)多方面问题(ti)。
如果将寻找药(yao)物新化学实体看做(zuo)数据科学中(zhong)的(de)采样问题,那在已(yi)知药(yao)物结(jie)(jie)构(gou)所代表的(de)数据点附近进行采样无疑(yi)是获得(de)类药(yao)分子结(jie)(jie)构(gou)的(de)高效策略之一。
近日,中国(guo)科学院上海药(yao)物(wu)(wu)研究(jiu)所蒋华良、郑明月课题组(zu)从已批准上市药(yao)物(wu)(wu)出发,采(cai)用电子等(deng)排体和化(hua)(hua)学反(fan)应(ying)转化(hua)(hua)规则构(gou)建了成药(yao)性拓展空间数(shu)据库DrugSpaceX (//drugspacex.simm.ac.cn/)。研究结果(guo)近期(qi)在线(xian)发表于Nucleic Acids Research,题为“DrugSpaceX: a large screenable and synthetically tractable database extending drug space” [6]。中国(guo)科学院上海药物研(yan)究所药物设计与发现中心 (DDDC)的(de)蒋华良和郑明(ming)月研究员为论文通讯作(zuo)者(zhe),第一(yi)作(zuo)者(zhe)是博(bo)(bo)士研究生杨天标,博(bo)(bo)士后李召(zhao)军为共同第一(yi)作(zuo)者(zhe)。
目前(qian)版本的(de)DrugSpaceX包含超过1亿种(zhong)可用于(yu)虚拟筛选的(de)新分子结(jie)构,且在类(lei)药性、可合成性和三维化学多样性空间覆盖率方面(mian)均具有突(tu)出(chu)的(de)特点 (图(tu)1),为开展虚拟筛选和药物分子设计提供了高质量的资源(yuan)。此(ci)外,DrugSpaceX还提供了(le)几个规(gui)模较小的子(zi)集,包(bao)括10%多样性子集,扩展的类药性子集,类药性子集,先导化合物子集和片段子集等,可供用户免费下载使用。
图1 DrugSpaceX数据库(ku)在类药(yao)性(xing),可合成性(xing)和结构多样性(xing)上均具有突(tu)出的特点
研究团队使用了盘状蛋(dan)白(bai)结构域受体 1 (discoidin domain receptor 1, DDR1)进行案例研究,展示(shi)了(le)如(ru)何(he)利用DrugSpaceX快速筛选活性化合(he)物(wu) (图2)。首先,以药物数(shu)据集(ji)为(wei)出(chu)发点(dian)进行基(ji)于结构的虚拟筛选,选择分子(zi)对接打分前十(shi)的药物分子(zi)。通(tong)过文献检索可以发现其中(zhong)Imatinib,Nilotinib,Ponatinib均对DDR1有交叉活(huo)性。然后,从(cong)DrugSpaceX上检索前十名药(yao)物分(fen)子第(di)一轮衍生物,再(zai)进行第(di)二轮筛选。可以发现,在(zai)第(di)一轮衍生物中对接(jie)打分(fen)前十的化合物主要(yao)集中在(zai)ponatinib周围(如图(tu)2A所(suo)示(shi)),其(qi)中(zhong)排名(ming)第3的化合物(wu)DE209841,已被(bei)Insilico Medicine最(zui)近报道的DDR1抑(yi)制(zhi)剂专利所(suo)覆(fu)盖(NO. WO2020079652A1)。图2B中显示(shi)了DE209841的预测结合模式,与Zhavoronkov等人文章报道的(de)结合(he)模式吻合(he)[5]。进(jin)一步解(jie)析重构(gou)数据集并采用相同筛选流程,可以发现对接打分和配体效率更高(gao)的新结(jie)构(gou)DE50204704。如图2C所示,该(gai)分子结构可以视作是(shi)老药Ponatinib经过对“tail” 和“linker” 片段(duan)进行两轮改造得到(dao)的。
图2 预测DDR1激酶抑制剂
除了帮(bang)助药物(wu)化(hua)学(xue)家能够进行快速的骨架跃迁(qian)和(he)分子设计, DrugSpacesX为我们提供(gong)了一种高(gao)效探索类药化(hua)学空间(jian)的思路。可以发现,通过将专(zhuan)家知(zhi)识和人工(gong)智能相互融合(he),我们可以在(zai)巨大的虚拟化(hua)学空间(jian)中更容易地找到具有(you)理想生(sheng)物效应的目标(biao)化(hua)合(he)物。此外,Christoph Gorgulla等人近期在Nature发表的文章中也(ye)指出超大规模虚筛(shai)可以提高真阳性率[7],DrugSpaceX也可以与(yu)VirtualFlow等虚拟筛(shai)(shai)选(xuan)平台结合使(shi)用(yong),通过扩大初始筛(shai)(shai)选(xuan)规模和提高筛(shai)(shai)选(xuan)库质(zhi)量两方面来(lai)进一步(bu)提(ti)升效率。目前(qian),研发团队(dui)还在对DrugSpaceX进(jin)行扩充(chong)和完善(shan),期待后(hou)续可以(yi)推出功(gong)能更为强大的(de)版本。
来源链接://mp.weixin.qq.com/s/S07nO1TEc39So2vdJUBg3A
特别声明:本(ben)文转载仅仅是(shi)出(chu)于(yu)传播信(xin)息的需要,并不(bu)意味着代表(biao)本(ben)网站观点(dian)或证实(shi)其内(nei)容的真实(shi)性。