图片源于:https://www.genengnews.com/topics/artificial-intelligence/insilico-u-toronto-researchers-develop-quantum-classical-computing-ai-model/
来自人工智能药物开发公司Insilico Medicine和多伦多大学的研究人员报告称,量子计算和人工智能(AI)可以与经典计算方法相结合,以设计和发现针对癌症驱动的KRAS蛋白的小分子候选药物。
研究人员开发了一种生成性人工智能模型,通过将量子计算机与经典计算方法相结合,设计新分子。随后,研究人员选择并合成了15种提出的分子,这些分子显示出可以抑制KRAS的能力。在这15种分子中,有两种分子显示出未来作为KRAS抑制癌症候选药物的开发潜力。
“这项研究突显了量子计算与药物发现之间的有前途的交叉,标志着量子计算机首次实验性命中,”研究人员在《自然生物技术》期刊上发表的《量子计算增强算法揭示潜在KRAS抑制剂》中总结道。“这一协同方法可能导致发现通过其他方法可能被忽视的治疗方法,同时将前临床药物发现阶段从数年缩短至几个月。”
Insilico的创始人兼首席执行官Alex Zhavoronkov博士在接受GEN Edge采访时表示,虽然研究结果显示量子计算加速药物发现早期阶段的潜力,“但并没有证明通过这种方法发现的分子比通过经典方法识别的分子更有效。”
“我们希望,随着量子计算机能力的提高,算法和结果预期会越来越好,”Zhavoronkov说。
Insilico公司在AI驱动的研发过程中探索将量子计算机纳入的可能性已有数年,旨在加速前临床药物发现。Zhavoronkov是第一篇探讨小分子药物发现中量子优势的研究的共同通讯作者,该研究发表于《化学信息与建模杂志》。
在该研究中,研究人员报告了如何一步步用变分量子电路(VQC)替代MolGAN的每部分。MolGAN是针对小分子图的隐式生成对抗网络,“GAN”。对比了电路的性能与其经典对应物。
在新发布的研究中,Zhavoronkov及其他研究人员将量子计算机与经典计算方法配对,以设计针对KRAS的新分子。KRAS存在于约四分之一的人类癌症中,驱动着细胞的失控生长。
由于其结构复杂性及其浅表结合口袋和明显可利用的结合位点的缺乏,以及对其天然配体鸟苷三磷酸(GTP)和鸟苷二磷酸(GDP)的高亲和力,KRAS长期以来被视为难以靶向的蛋白质。
KRAS G12C突变是两种FDA批准的癌症治疗的靶标。其一是Amgen的Lumakras®(sotorasib),于2021年获批用于治疗非小细胞肺癌(NSCLC)和转移性结直肠癌(mCRC)。另一种是Krazati®(adagrasib),是一种口服治疗KRAS突变结直肠癌的药物,去年获得批准。Krazati由Mirati Therapeutics开发,Mirati Therapeutics在去年的交易中被百时美施贵宝以高达58亿美元的价格收购。
“KRAS作为我们混合量子-经典模型的第一个靶标,是因为在药物发现中其挑战是众所周知的,”该研究的第一作者、来自多伦多大学物质实验室的博士后研究员Mohammad Ghazi Vakili告诉GEN Edge。“其在多种癌症中的核心角色,加上近期在靶向KRAS突变方面的突破,如KRAS G12C抑制剂,使其成为一个引人注目的起点。”
“对KRAS的计算探索提供了测试我们模型的机会,尤其在面对如此复杂的靶标时,”Ghazi Vakili说,他的研究工作与多伦多大学化学与计算机科学教授Alán Aspuru-Guzik博士共同进行。Aspuru-Guzik是此次研究的共同通讯作者之一,另一位是多伦多大学生物化学和分子遗传学教授Igor Stagljar博士。
“高质量的分子命中”
“我们目前的研究强调了量子计算在早期药物发现中的能力,特别是在生成多样化和可合成的先导化合物方面,”Ghazi Vakili说。“早期结果表明,量子-经典方法在生产传统上被视为难以处理的高质量分子命中方面表现出色。”
Zhavoronkov补充道:“在KRAS方面的成功可能为其他具有挑战性的蛋白靶标解决设定先例,展示了将量子计算整合到药物发现中的实用性。”
研究人员设定了通过混合量子-经典框架模型生成潜在的新KRAS抑制剂,该模型结合了一种量子电路出生机器(QCBM),使用一个16量子位的IBM处理器生成先验分布,和经典的长短期记忆网络(LSTM)。
“在这项研究中,重要性不在于量子计算机的速度,而在于通过添加量子计算,可以处理更大数量的数据,从而改善生成分子的质量和多样性,”Zhavoronkov表示。
QCBM作为一种量子生成模型,使用量子电路学习复杂的概率分布并生成与训练数据类似的新样本。QCBM还指导LSTM生成新的配体样本,在整个过程中充当先验。
作为经典模型,LSTM处理化学结构的序列数据,并基于该数据生成新的分子序列。这种结合使得生成的分子能够从量子模型中获取复杂的概率分布,并被经典模型串行处理,从而改善生成分子的质量和多样性,Zhavoronkov解释道。
研究人员使用自定义的110万分子数据集对混合模型进行训练,包含650种先前实验验证的KRAS抑制剂,850,000种基于现有KRAS抑制剂生成的类似物,以及250,000种来源于开源超大规模虚拟筛选平台VirtualFlow的分子。
“这种训练帮助优化了混合模型,”Zhavoronkov称。
用于训练量子-经典模型的数据集和该研究中量子-经典混合模型的生成集均达到了数百万。相比之下,Zhavoronkov指出,研究人员可以处理的分子数据量仅在数百,而一般机器学习模型处理的数据量则在数万。
研究人员使用混合模型生成了100万候选分子。随后,他们应用Insilico的生成化学平台Chemistry42过滤这些分子,包括药物类筛选、对接排名和合成可及性等多维度评估指标。
研究人员确定了15种最有前景的候选分子进行实验室测试。在预临床研究中,有两种分子因展示出令人满意的特异性和结合亲和力而脱颖而出,分别是ISM061-018-2和ISM061-022,这两者均作为潜在的全Ras抑制剂,显示出能够阻断一系列肾上腺素-血管紧张素系统(RAS)蛋白。
ISM061-018-2的靶蛋白结合效能优于其他分子,并且即使在高浓度下也未显示出明显的非特异性细胞毒性。除了野生型KRAS外,ISM061-018-2还显示出对五种其他常见突变型KRAS、野生型HRAS和NRAS的剂量依赖性抑制活性。
ISM061-022对特定的两种KRAS突变——KRAS G12R和KRAS Q61H,显示出增强的抑制活性,相比ISM061-018-2更为有效。
驱动KRAS积极结果的属性是什么?
“KRAS突变如G12D和Q61H的开关II口袋提供了小分子的一个新兴结合位点,”Ghazi Vakili表示。“我们的混合模型利用QCBM生成的量子先验来探索高维化学空间,从而识别出有效结合这一具有挑战性靶位点的分子。”
开发计划仍为时尚早
Zhavoronkov表示,对于最有前景的潜在KRAS抑制剂,讨论开发计划尚为时早,但他补充说:“我们期待利用相同的方法和思路,筛选更多无法用药物治疗的靶标,以发现值得进一步开发的新分子和模型优化的新方向。”
Insilico的管线中没有任何KRAS靶向候选药物,旗下目前已披露的20个项目处于前临床或临床阶段。公司尚未透露其在发现阶段新启动的20多个项目的详细信息。“如果对KRAS感兴趣,我们可以非常高效地从货架上产生一个候选药物,”Zhavoronkov说。
本月初,Insilico宣布其全球多中心I期临床试验的首位患者接受了ISM6331的给药,这是通过Chemistry42开发的一种新型全TEAD抑制剂,旨在治疗脊髓膜癌和其他实体肿瘤。ISM6331是Insilico全面拥有的AI药物发现管线中的领先肿瘤学项目,并已获得FDA的孤儿药资格,用于治疗脊髓膜癌。
此外,在肿瘤学领域,Insilico已授予Menarini集团子公司Stemline Therapeutics独家全球许可权,以开发和商业化一种Chemistry42开发的第二个处于前临床阶段的小分子,靶向尚未确定的广泛实体肿瘤癌症。作为交换,Stemline同意向Insilico支付2000万美元的预付款以及超过5.5亿美元的开发、监管和商业里程碑费用,以及增级版版税。
除了KRAS以外,Insilico与多伦多大学的研究人员还研究了其他长期被认为是不可靶向的靶标。虽然KRAS是主要焦点,但该框架也已与其他具有挑战性的靶点在Tartarus平台上进行了基准测试,Ghazi Vakili解释道。
评估的靶标包括与阿尔茨海默病和帕金森病等神经系统疾病相关的离子型谷氨酸受体(1YSH);对病毒复制至关重要的SARS-CoV-2主要蛋白酶(6Y2F);以及在支气管扩张和肌肉放松中起作用的β2肾上腺素能受体G蛋白偶联受体(4LDE)。
“虽然这些靶标未在本研究中合成或实验验证,但量子-经典方法在生成可行分子候选者方面取得了良好的对接分数,显示出潜力,”Zhavoronkov说。“这些蛋白质与KRAS一样,呈现出结构和功能挑战,这阻碍了传统药物发现方法的进展,突显了该混合模型在解决不同的‘不可靶向’靶标方面的多样性。”
未来的测试计划
未来如何测试通过量子与经典方法发现的分子?
“除了疗效外,分子生成中的资源效率、可扩展性和成本等因素也必须考虑到。通过解决这些方面,研究人员可以确定量子计算是否在实际药物发现应用中为经典方法提供了真正的优势,”Zhavoronkov表示。
Ghazi Vakili表示:“我们当前的研究强调了量子计算在加速早期药物发现中的能力,尤其是在生成多样化和可合成的先导化合物方面。早期结果表明,量子-经典方法在生成传统上被视为难以处理的高质量分子命中方面表现出色。”
他补充道,要评估通过量子方法识别的分子是否更有效,未来的工作将涉及:
直接比较生物效力,使用标准的前临床模型;
对量子生成的分子进行扩展的体外和体内验证;
开发强有力的性能指标,以评估量子与经典模型的比较。
研究人员已开始在一个新的不可靶向靶标蛋白上进行工作。
“这一努力测试我们混合量子-经典模型对其他具有挑战性蛋白的鲁棒性,扩展了我们方法的适用范围,”Ghazi Vakili表示。“我们计划出版一篇预印本,展示我们的方法在针对不同靶标时的扩展能力。”