- 怎么在知网sci论文查重啊 47
- 北京大学物理学院高鹏课题组与合作 55
- 北大团队揭示肺炎克雷伯菌耐药新机 99
- 北京大学心理与认知科学学院方方课 60
- 出书书号需要自己申请吗? 68
- 上海交通大学黄兴溢教授团队在聚合 42
- 分子生物实验员sci论文发表技巧 48
- 关于《天津药学》期刊 34
- 深圳研究生院潘锋/李舜宁团队在基 25
- 论文查重怎么搞 44
- 中国科学技术大学化学与材料科学学 43
- 优秀的教育心理学论文题目推荐 38
- 《中国寄生虫学与寄生虫病杂志》期 38
- 参与学术会议的具体步骤与注意事项 67
- 论文发sci三区要带导师吗 34
- 中国海洋石油总公司 23381
- 南开大学商学院 20410
- 中国造船工程学会工艺委员会 23410
- 北京新线国际展览有限公司 23402
- 南京海昌中药集团有限公司 22430
- 中国科学院大学 1405
- 厦门海峡旅行社有限公司 22422
- 南京航空航天大学 20425
- 华侨大学化工学院 17401
- 博锐国际展览有限公司 23381
- 上海顺展展览服务有限公司 7402
- 中国社会发展研究院会议中心 17386
- 宁夏大学人文学院 22401
- 万利达集团有限公司 20404
- 中国医师协会胸外科医师分会 22396
- 南宁市三好物业管理有限公司 20381
- 武汉大学 7366
- 北京富来宫温泉山庄 1390
- 昆明理工大学 20397
- 上海市护理学会 1414
中国科学院上海药物研究所人工智能药物设计上取得新进展
2024/03/28
图 人工智能药物设计新方法用于(A)先导化合物发现、(B)先导化合物优化、(C)多肽药物设计
在国家自然科学基金项目(批准号:T2225002)等资助下,中国科学院上海药物研究所郑明月研究团队近期在药物设计领域取得了研究进展。通过深度学习和大数据分析,人工智能能够高效处理和解读大规模的生物信息学数据,挖掘隐藏在庞大数据集中的模式和关联,提高对潜在药物靶点的识别准确性,加速药物筛选和设计的过程。针对过去计算机药物设计中存在的问题和局限,郑明月研究团队利用先进的人工智能方法,围绕先导化合物发现、先导化合物优化以及多肽药物设计,为我国在人工智能辅助药物设计领域的发展贡献了新的理念和方法,取得了以下进展。
1. 先导化合物发现:基于序列的药物设计新范式
基于蛋白质结构的药物设计(SBDD)一般涉及多个步骤的复杂流程,有其局限性,例如许多蛋白质没有高分辨率的结构,难以获得精确的配体结合位点等。虚拟筛选的复杂流程中的误差会不断累积,将导致严重的假阳性问题。相比之下,基于序列的方法可以作为基于结构药物设计的替代方法,在无法获得高质量蛋白质3D结构的场景中发挥作用,也可与其他虚拟筛选和高通量体外筛选技术结合,加速药物发现进程。
郑明月研究团队提出了一种基于序列的药物设计新概念,采用Transformer神经网络架构和预训练蛋白质语言模型的模型TransformerCPI2.0。利用Transformer神经网络架构和预训练蛋白质语言模型,设计了直接从蛋白质序列出发进行药物设计发现的模型TransformerCPI2.0(图A)。基于模型在多种具有挑战性的药物靶标预测结果,研究团队发现了E3泛素连接酶接头蛋白SPOP的新骨架抑制剂和靶向E3泛素连接酶RNF130的结合分子。逆向应用TransformerCPI2.0对已上市药物进行蛋白质组范围的靶标筛选,成功发现雷贝拉唑抗肿瘤作用的潜在靶标ADP-核糖基化因子ARF1。“从序列到药物”的端到端学习策略可以有效地简化建模和筛选流程,更加高效地探索未知化学和生物学空间,为原创药物的发现提供新的出发点和切入点。
2. 先导化合物优化:PBCNet模型指导先导化合物的结构优化
先导化合物的结构优化(Lead optimization)是药物设计的核心环节,需要通过DMTA(设计-合成-测试-分析)的反复循环来提高化合物活性、特异性、成药性等性质。长期以来,该过程高度依赖药物化学家的经验以及大量的人力和资源投入。
郑明月研究团队提出了全新人工智能方法PBCNet(pairwise binding comparison network)用于指导先导化合物的结构优化(图B)。该方法采用孪生图卷积神经网络架构,通过比较一组相似配体的结合模式差异来预测二者之间的相对结合亲和力,可以较好地兼顾计算速度和精度。研究团队设计了多种测试场景,发现PBCNet模型的排序能力和预测精度均显著优于Schrödinger Glide、MM-GB/SA和多个近期报道的深度学习模型,在部分测试体系上的误差已接近于化学精度()。在仅使用少量的结构活性数据对模型进行微调后PBCNet的排序性能已经可以接近或超过Schrödinger FEP+,并且在计算速度方面相对FEP+有多个数量级的优势。对比结果显示,使用PBCNet可以使先导化合物优化项目平均加速约4.7倍,平均节省约30%的资源投入。
3. 多肽药物设计:GVP-MSA模型辅助蛋白质定向进化
定向进化是生产具有改良或全新性质蛋白质的一种有效方法。传统的定向进化实验流程包括反复的诱变和高通量筛选,实验费时费力。机器学习辅助定向进化的方法的难点在于使用有限的蛋白质突变效应实验数据建立准确的蛋白质适应度图景,即目标蛋白的序列突变体-功能的函数映射关系。
郑明月研究员和廖苍松研究员团队提出了一种迁移学习深度神经网络模型GVP-MSA(图 C)。模型利用预训练的蛋白质语言模型处理目标蛋白的同源序列(MSA, multiple sequence alignment)信息,利用E-(3)等变的图神经网络提取蛋白质三维结构信息,使用多任务学习的方式有效地学习整合不同维度、不同功能的蛋白质数据,从而泛化到新的目标蛋白体系。模型适用于多种测试场景:单点突变效应的随机和按位置外推,对新蛋白质突变效应的零样本预测,以及由单点突变效应预测多点突变效应,均有良好的表现,验证了适应度图景迁移学习的有效性。这一工作为机器学习辅助定向进化提供了新的思路,有助于更加高效地探索蛋白质序列突变空间,快速设计具有改良或全新特性的蛋白质序列。
综合而言,这一系列研究成果标志着我国在人工智能辅助药物设计领域的不断创新和进步。这些新方法的引入为药物设计提供了更高效、更精准的工具,为未来的药物研发和创新奠定了坚实基础。研究成果发表在多个高水平国际期刊,包括《自然·通讯》(Nature Communications)、《自然·计算科学》(Nature Computational Science)、《细胞·系统》(Cell Systems)杂志等。
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
中国农业科学院团队与福建省农业科学院团队在水稻种质资源解析与利用上取得新进展
北京大学深圳研究生院潘锋/杨卢奕团队在《化学》期刊发表钠金属负极界面稳定性的重要突破
清华大学物理系刘永椿研究组合作提出大尺度薛定谔猫态制备新方法
北京大学张艳锋课题组与合作者在新型自插层相硒化铁纳米材料的可控制备及其磁性研究方面取得重要进展
清华大学于浦教授团队与海外合作者在关联氧化物铁磁极化金属态研究方面取得进展
北京大学物理学院沈路路课题组与合作者精确量化全球能源行业甲烷温室气体排放
环境学院戴瀚程课题组在Nature Food发文揭示粮食系统增效是我国实现碳中和的关键
第四届计算机图形学、图像与虚拟化研究国际会议(ICCGIV 2024)(2024-05-17)
第九届机电控制技术与交通运输国际学术会议(ICECTT 2024)(2024-05-24)
2024年教育政策与实践研讨会(ICEPP 2024)(2024-05-24)
第三届机电一体化与机械工程国际会议(ICMME2024)(2024-05-24)
2024年电子器件、传感控制技术与光学机械工程国际学术会议(EDSCTOE 2024)(2024-05-25)
第十四届地质和地球物理学国际会议(ICGG 2024)(2024-05-31)
2024年食品工程与农业科学国际会议(ICFEAS 2024)(2024-06-02)
2024年第三届网络、通信与信息技术国际会议(CNCIT 2024)(2024-06-07)
第十届机械工程、材料和自动化技术国际会议(MMEAT 2024)(2024-06-21)
2024年先进机器人,自动化工程与机器学习国际会议(ARAEML 2024)(2024-06-28)
2024年化工、材料与检测技术国际会议(CMTT 2024)(2024-6-22)
2024年经济研究与智慧金融国际会议(ICERSF 2024)(2024-5-21)
第八届会计与财务管理国际研讨会 (AFM 2024)(2024-10-25)
2024年电子商务与大数据经济国际会议 (EBDE 2024)(2024-5-30)
2024年计算机工程、智能控制技术与自动化系统国际研讨会(CEICTAS 2024)(2024-5-25)
2024年商业文化、管理创新与经济发展国际会议(ICBCMIED 2024)(2024-5-25)
2024年节能环保与环境工程国际会议(ECEPEE 2024)(2024-5-27)
2024年数字经济与区块链国际学术会议(IACDEB 2024)(2024-5-26)
2024年国防科技工业与经济发展国际会议(NDSTED 2024)(2024-6-22)
2024软件数据与人工智能国际会议(IACSDAI 2024)(2024-6-30)