电子系姚权铭课题组以小样本学习技术助力药物研发
2024/04/26
药物研发的流程通常漫长且成本高昂,人工智能技术通过对药物数据的快速分析建模,成为了加速药物研发过程的重要技术手段。然而,现有的深度学习模型决策过程不透明,可解释性不足,无法可靠地应用在药物研发中。此外,模型还依赖于大量的有标签数据,但在药物研发的过程中,数据获取通常伴随着高昂的成本和漫长的时间等待,这导致药物标签数据极为稀缺。常见模型在这种场景下存在预测准确性低、数据需求量大、可解释能力弱的局限。为了应对这一问题,清华大学电子工程系姚权铭助理教授课题组以小样本学习技术作为突破口,研究提升模型样本利用效率的算法,使深度学习模型能快速泛化到只有少量有标签样本的药物研发相关任务上。
图1.(a)人工智能助力药物研发的重要挑战:可解释性不足和样本数量稀缺(b)现有的药物研发相关任务研究方法存在的局限
药物研发相关的典型任务——药物互作用(Drug-Drug Interaction,DDI)预测是临床研究的重要部分。目前大约有6.7%的住院患者面临药物副反应的困扰,大约有0.32%的住院患者面临药物副反应带来的生命危险。挖掘潜在的药物间相互作用对于加速药物研发过程和加强人民健康保障都有重要意义。该任务可以建模为药物-药物互作用网络上的链路预测问题。然而,由稀缺的药物标签数据构建的药物-药物互作用网络非常稀疏,传统数据驱动方法在这种场景下表现不佳。
图2.(a)小样本学习技术启发的基于流的图神经网络(EmerGNN)的框架(b)基于流的图神经网络(EmerGNN)在预测准确性、数据需求量、可解释能力方面与基线方法的比较
针对药物标签数据稀缺的问题,课题组采用了小样本学习的方法,在医药领域首次提出了有效的深度学习方法——“药物相互作用的知识子图学习方法(Knowledge Subgraph Learning for Drug-drug Interaction Prediction,KnowDDI)”和“基于流的图神经网络与生物医学网络的新兴药物相互作用预测(Emerging Drug Interaction Prediction by Flow-based Graph Neural Network,EmerGNN)”,这两种方法分别高效地实现了现有药物潜在互作用的发掘和新药物间反应的预测。
课题组在原始药物间反应图谱的基础上引入了生物医药网络(Biomedical Network),利用其中丰富的医药学信息,构建了新的医药图谱,有效解决了监督数据不足的问题。医药图谱信息丰富,但同时也伴随着众多的噪声,准确预测药物互作用需要排除噪声干扰,挖掘有效信息。因此,课题组从医药图谱中提取目标药物之间的关系路径作为子图,并为路径设置注意力权重,基于注意力机制建立基于流的图神经网络EmerGNN,以此完成关键知识的提取与知识传递,建立了药物互作用预测的完整框架(图2.a)。在公共数据集上的大量实验表明,提出的EmerGNN在预测准确性和可解释能力上显著优于基线方法,数据需求量显著降低(图2.b)。这些成果为药物研发中的药物互作用预测提供了有效的算法和工具,增强了算法的可解释性,展现了人工智能在医药领域的重要辅助作用。这些研究成果有望应用于候选药物筛选和临床试验,对于加速药物研发和促进人类健康具有重大意义。
相关研究成果以“药物相互作用的知识子图学习方法”(Accurate and Interpretable Drug-Drug Interaction Prediction Enabled by Knowledge Subgraph Learning)为题,近期发表于《自然·通讯(医药)》(Nature Communication Medicine)。百度研究员王雅晴博士为论文第一作者,姚权铭为论文通讯作者。以“基于流的图神经网络与生物医学网络的新兴药物相互作用预测”(Emerging Drug Interaction Prediction by Flow-based Graph Neural Network)为题,近期发表于《自然·计算科学》(Nature Computational Science),第四范式(北京)技术有限公司研究员张永祺博士为论文第一作者,姚权铭为论文通讯作者。研究得到国家自然科学基金项目的支持。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025最新JCR分区及影响因子1939
-
好学术:科研网址导航|学术头条分468
-
《时代技术》投稿全攻略:一位审稿499
-
2025年国际期刊预警名单发布!600
-
2025年中科院期刊分区表重磅发3957
-
中科院已正式发布2024年预警期861
-
2025年度国家自然科学基金项目727
-
中国科协《重要学术会议目录(202733
-
2024年国家自然科学基金项目评1138
-
2024年JCR影响因子正式发布1214
-
吉林大学校长张希:学术会议中的提1391
-
SCI论文插图全攻略:从规范解析08-01
-
国际学术会议参加经验是怎么样的呢08-01
-
掠夺性会议是怎么进行判断的呢?—08-01
-
SCI论文投稿费怎么交?202408-01
-
美国梦缔雅国际集团 22918
-
北京仕而优教育科技集团有限公司 8018
-
智慧医卫(北京)信息技术研究中心 23988
-
WILL 22968
-
全国卫生产业企业管理协会抗菌产业 22960
-
北京思高乐教育科技有限公司 24055
-
亚太科学与工程研究所 23041
-
东南大学 18230
-
北京嘉园文华发展中心 1992
-
大连羽嘉会议有限公司 8697
-
广东省深圳市富士康 20921
-
世博威(上海)展览有限公司 21003
-
绵阳市会议中心 23086
-
广东海洋大学 17934
-
Science & Engine 2393
-
安徽理工大学 21181
-
西安理工大学 24349
-
河南华宸置业有限公司 17910
-
WILL 1980
-
江南大学食品学院 8072