中国科学院上海药物研究所人工智能药物设计上取得新进展
2024/03/28
![]() |
图 人工智能药物设计新方法用于(A)先导化合物发现、(B)先导化合物优化、(C)多肽药物设计
在国家自然科学基金项目(批准号:T2225002)等资助下,中国科学院上海药物研究所郑明月研究团队近期在药物设计领域取得了研究进展。通过深度学习和大数据分析,人工智能能够高效处理和解读大规模的生物信息学数据,挖掘隐藏在庞大数据集中的模式和关联,提高对潜在药物靶点的识别准确性,加速药物筛选和设计的过程。针对过去计算机药物设计中存在的问题和局限,郑明月研究团队利用先进的人工智能方法,围绕先导化合物发现、先导化合物优化以及多肽药物设计,为我国在人工智能辅助药物设计领域的发展贡献了新的理念和方法,取得了以下进展。
1. 先导化合物发现:基于序列的药物设计新范式
基于蛋白质结构的药物设计(SBDD)一般涉及多个步骤的复杂流程,有其局限性,例如许多蛋白质没有高分辨率的结构,难以获得精确的配体结合位点等。虚拟筛选的复杂流程中的误差会不断累积,将导致严重的假阳性问题。相比之下,基于序列的方法可以作为基于结构药物设计的替代方法,在无法获得高质量蛋白质3D结构的场景中发挥作用,也可与其他虚拟筛选和高通量体外筛选技术结合,加速药物发现进程。
郑明月研究团队提出了一种基于序列的药物设计新概念,采用Transformer神经网络架构和预训练蛋白质语言模型的模型TransformerCPI2.0。利用Transformer神经网络架构和预训练蛋白质语言模型,设计了直接从蛋白质序列出发进行药物设计发现的模型TransformerCPI2.0(图A)。基于模型在多种具有挑战性的药物靶标预测结果,研究团队发现了E3泛素连接酶接头蛋白SPOP的新骨架抑制剂和靶向E3泛素连接酶RNF130的结合分子。逆向应用TransformerCPI2.0对已上市药物进行蛋白质组范围的靶标筛选,成功发现雷贝拉唑抗肿瘤作用的潜在靶标ADP-核糖基化因子ARF1。“从序列到药物”的端到端学习策略可以有效地简化建模和筛选流程,更加高效地探索未知化学和生物学空间,为原创药物的发现提供新的出发点和切入点。
2. 先导化合物优化:PBCNet模型指导先导化合物的结构优化
先导化合物的结构优化(Lead optimization)是药物设计的核心环节,需要通过DMTA(设计-合成-测试-分析)的反复循环来提高化合物活性、特异性、成药性等性质。长期以来,该过程高度依赖药物化学家的经验以及大量的人力和资源投入。
郑明月研究团队提出了全新人工智能方法PBCNet(pairwise binding comparison network)用于指导先导化合物的结构优化(图B)。该方法采用孪生图卷积神经网络架构,通过比较一组相似配体的结合模式差异来预测二者之间的相对结合亲和力,可以较好地兼顾计算速度和精度。研究团队设计了多种测试场景,发现PBCNet模型的排序能力和预测精度均显著优于Schrödinger Glide、MM-GB/SA和多个近期报道的深度学习模型,在部分测试体系上的误差已接近于化学精度(
)。在仅使用少量的结构活性数据对模型进行微调后PBCNet的排序性能已经可以接近或超过Schrödinger FEP+,并且在计算速度方面相对FEP+有多个数量级的优势。对比结果显示,使用PBCNet可以使先导化合物优化项目平均加速约4.7倍,平均节省约30%的资源投入。
3. 多肽药物设计:GVP-MSA模型辅助蛋白质定向进化
定向进化是生产具有改良或全新性质蛋白质的一种有效方法。传统的定向进化实验流程包括反复的诱变和高通量筛选,实验费时费力。机器学习辅助定向进化的方法的难点在于使用有限的蛋白质突变效应实验数据建立准确的蛋白质适应度图景,即目标蛋白的序列突变体-功能的函数映射关系。
郑明月研究员和廖苍松研究员团队提出了一种迁移学习深度神经网络模型GVP-MSA(图 C)。模型利用预训练的蛋白质语言模型处理目标蛋白的同源序列(MSA, multiple sequence alignment)信息,利用E-(3)等变的图神经网络提取蛋白质三维结构信息,使用多任务学习的方式有效地学习整合不同维度、不同功能的蛋白质数据,从而泛化到新的目标蛋白体系。模型适用于多种测试场景:单点突变效应的随机和按位置外推,对新蛋白质突变效应的零样本预测,以及由单点突变效应预测多点突变效应,均有良好的表现,验证了适应度图景迁移学习的有效性。这一工作为机器学习辅助定向进化提供了新的思路,有助于更加高效地探索蛋白质序列突变空间,快速设计具有改良或全新特性的蛋白质序列。
综合而言,这一系列研究成果标志着我国在人工智能辅助药物设计领域的不断创新和进步。这些新方法的引入为药物设计提供了更高效、更精准的工具,为未来的药物研发和创新奠定了坚实基础。研究成果发表在多个高水平国际期刊,包括《自然·通讯》(Nature Communications)、《自然·计算科学》(Nature Computational Science)、《细胞·系统》(Cell Systems)杂志等。
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年第八届计算机科学与技术在教 109
-
2026年3月高含金量国际学术会议合 88
-
2026资源、化学化工与应用材料国际 1265
-
2026年人工智能教育技术与数据科学 246
-
2026年图像处理与数字创意设计国际 1041
-
2026年机械工程,新能源与电气技术 5524
-
2026年材料科学、低碳技术与动力工 1312
-
2026年第二届无线与光通信国际会议 2080
-
第七届多组学科研与临床应用大会 02-05
-
2026年制药学、生物技术与植物学国 02-04
-
2026年节能技术、低碳发展与可持续 02-04
-
2026年导航控制、传感技术与卫星应 02-04
-
2026年经济转型与商业文化国际学术 02-04
-
2026年体育科学、运动健康与创新管 02-04
-
2026创意城市、设计与社区建设国际 02-04
-
2025年两院院士增选有效候选人4066
-
2025最新JCR分区及影响因子10070
-
好学术:科研网址导航|学术头条分5098
-
2025年国际期刊预警名单发布!5129
-
2025年中科院期刊分区表重磅发16711
-
中国科协《重要学术会议目录(2010250
-
吉林大学校长张希:学术会议中的提6245
-
bbrc期刊,bbrc期刊处于S02-03
-
siam期刊,siam期刊发的最02-03
-
了望期刊,瞭望期刊02-03
-
共享经济期刊,共享经济学术论文02-03
-
期刊代理网,从哪里找期刊代理02-03
-
light期刊,Light期刊综02-03
-
传承 期刊,传承期刊投稿点评02-03
-
期刊勘误,期刊勘误时会索要原始数02-03
-
大连渤海明珠酒店 18484

-
广东宏展科技有限公司 24127

-
中国电子商务案例中心 2327

-
中国抗癌协会肿瘤标志专委会 8161

-
武汉青博盛学术服务有限公司 23190

-
河南理工大学经济管理学院 18239

-
天津师范大学管理学院 21271

-
EAGEW 24197

-
中国装配式建筑网 24211

-
上海市同济大学 23666

-
中国人民大学统计学院 21336

-
深圳技术大学 8362

-
的萨达是大事我 18183

-
中商联数据委员会 21285

-
浙江湖州长兴娇家有限公司 21201

-
管理与信息工程国际会议组委会 2107

-
中国医药教育协会培训部 2271

-
海洋国旅国际会展部 18328

-
北京颜路医学科技有限公司 8156

-
ggicecc 18241

















727













































