江南app官方网站
联系我们

深度 AI确定17000多种疾病候选药物 罕见病的“孤儿药”不再遥远?

发表时间: 2024-10-22 作者: 工程团队

  日前,哈佛科学家开发了TxGNN,一种利用零样本学习识别现有药物新用途的AI模型,有望弥合罕见疾病的治疗缺口。

  与用于药物再利用的同类AI模型相比,TxGNN在识别候选药物方面平均提高了近50%,在预测哪些药物会有禁忌症方面,准确率也高出35%。

  这是首个专门为识别罕见疾病和无药可治病症的候选药物而开发的新办法。它从现有药物中确定了17000多种疾病的候选药物,其中许多疾病没有一点现有治疗方法。

  研究强调了TxGNN在减少药物开发时间和成本方面的潜力,从而更快地为患者提供有效的治疗方法。哈佛医学院生物医学信息学助理教授Marinka Zitnik表示:“我们大家都希望通过这个工具在疾病谱上找到新的治疗方案,尤其是针对罕见、极罕见和被忽视的疾病。”

  罕见病,顾名思义,是患病率相比来说较低的一类疾病。由于患病人数少、市场需求小,以及药物研发难度大、成本高、周期长,罕见病治疗难度居高不下,罕见病用药更被称为“孤儿药”。绝大多数罕见病患者都面临着治疗困难、药物短缺的问题。

  全球超过3亿人受超过7000种罕见或未确诊的疾病影响。令人震惊的是,仅约7%的罕见疾病有FDA批准的药物医治,许多患者仍在等待新的疗法,且大多需要终身药物医治。在这一严峻背景下,如何为罕见病寻求有效治疗药物是缓解罕见病患者治疗困境的关键一步。

  传统的药物再利用(drug repurposing)策略,虽然利用现有药物的安全性和有效性数据,可以加快新药物在临床中的应用,但这种方法往往是偶然的且机会性较强,很难系统地解决罕见病的药物研发问题。

  TxGNN是一种基于图神经网络(GNN)的基础模型,专门用于零样本药物再利用。TxGNN利用图神经网络(GNN)来分析大型医学数据集中复杂的关系和模式,包括疾病、药物和蛋白质的信息,从而解决了这一限制。这使得AI模型能够理解并预测药物怎么样影响特定疾病。

  与传统方法不同,TxGNN并不局限于现有药物和疾病的已知关系,而是通过训练一个医学知识图谱(KG),将疾病和药物之间的复杂关系嵌入到一个潜在的表示空间中,从而能够针对任何给定的疾病预测潜在的治疗药物。该知识图谱包含了17080种疾病、7957种药物、27671种蛋白质等医学概念,为TxGNN的训练提供了丰富的数据基础。

  在多次实验中,TxGNN展现出了其强大的预测能力。与8种现有的办法来进行对比,TxGNN在零样本环境下表现出了显著的优势。根据论文中的实验数据,在测试过程中,TxGNN在未经特定疾病培训的情况下将治疗预测准确率提高了高达19%。在预测禁忌症——即药物不应使用的情况时,AI模型也优于现有模型,在副作用预测上提高了23.9%。此外,它的治疗建议经常与医生针对特定疾病开具的非标签用药一致。

  这些根据结果得出,TxGNN不仅仅可以在现有治疗方案中找到潜在的新用途,更能够在没有已知治疗方案的情况下,准确地预测出可能的药物。这对于罕见病的治疗具备极其重大意义,因为罕见病中超过95%没有现有的治疗药物,而TxGNN为这些疾病快速发现新药物创造了可能性。

  除了预测能力,TxGNN还特别设计了一个解释模块,用于帮助医生和研究人员理解模型的预测逻辑。这个模块通过多跳路径(multi-hop paths),展示了药物与疾病之间的潜在联系,提供了透明的预测解释,使医学专家能够审查并了解AI的推理过程。这种透明度对于建立对AI驱动的医疗决策的信任至关重要。

  解释模块不仅仅可以指出某种药物为何对特定疾病可能有效,还能提供详细的医学知识路径,让使用者能够追溯到预测背后的科学依据。通过这项功能,TxGNN克服了许多AI模型在医学应用中的“黑箱问题”,大幅度的提升了模型的可解释性和信任度。

  研究团队对TxGNN在罕见病药物发现中的实际应用进行了验证,并取得了令人鼓舞的成果。在实验中,TxGNN的许多预测与实际的临床非处方药物使用具有高度一致性。

  在当前药物开发周期漫长、成本高昂的背景下,TxGNN为现有药物的重新利用提供了系统化的解决方案。

  未来,随着这一技术的逐渐完备,它有望成为加速药物开发、特别是使罕见病患者“有药可用”的关键驱动力。