当前位置:首页 >> 学术资讯 >> 科研信息

西安交大人机所博士生研究成果在《自然》子刊《自然机器智能》发表

2026/05/12

文章导读
你以为AI制药的瓶颈在于算力,其实卡住脖子的是天然产物那“捉摸不透”的结构。传统模型面对这些复杂的分子往往“束手无策”,导致药物研发周期漫长且成本高昂。西安交大联合团队在《自然机器智能》上抛出的新模型NaFM,没有死磕通用算法,而是利用“母核感知”策略,精准捕捉到了分子骨架与生物活性间的隐秘关联。这一突破不仅解决了长期困扰学界的分布偏移难题,更让药物筛选的准确率有了质的飞跃——但这套模型究竟是如何从看似杂乱的数据中“读”出进化规律的?答案藏在它的预训练逻辑里。
— 内容由好学术AI分析文章内容生成,仅供参考。

近日,北京大学药学院联合西安交通大学人工智能与机器人研究所(以下简称“人机所”)、华盛顿大学、香港中文大学及石河子大学等单位,在小分子天然产物智能表征与药物发现研究方面取得新进展。研究团队提出了面向小分子天然产物的基础模型NaFM(Foundation Model for Natural Products),相关成果以《小分子天然产物的基础模型预训练》(Pretraining a foundation model for small-molecule natural products)为题,发表于国际高水平期刊《自然机器智能》(Nature Machine Intelligence)。

西安交大人机所博士生研究成果在《自然》子刊《自然机器智能》发表

在该研究中,西安交大人机所郑南宁院士团队深度参与了模型架构设计与人工智能方法开发工作。北京大学刘振明教授、西安交大人机所郑南宁教授以及博士生王裕淞为本文共同通讯作者,北京大学硕士生丁宇恒为第一作者。

天然产物是由微生物、动物或植物产生的代谢产物,具有结构多样性高、生物活性丰富等特点,是抗肿瘤、抗感染等药物发现的重要来源。然而,其发现过程长期面临周期长、成本高、标注数据有限等挑战。现有深度学习方法多依赖单一任务的监督学习,模型泛化能力有限;而针对合成分子的通用表征方法,也难以刻画天然产物在来源、骨架结构、合成途径与生物活性之间的复杂关联。进一步而言,天然产物在化学空间中呈现出以核心母核(scaffold)为中心的层级化分布特征,并与通用化合物空间存在显著分布偏移(distribution shift),导致现有模型难以直接迁移应用。因此,构建面向天然产物结构与生物学约束的专用预训练范式尤为迫切。为此,研究团队以分子母核为核心构建表征框架,系统刻画并对齐天然产物在生物来源、生物合成基因簇、合成途径及生物活性等多维属性之间的内在关联,提出了母核感知的预训练策略。

NaFM将掩码图学习与对比学习相结合:一方面,在天然产物分子骨架区域进行子图掩码,要求模型同时重建原子属性、化学键属性和拓扑连接信息;另一方面,以骨架相似性作为软权重,引导模型区分不同分子之间的强弱负样本关系,从而更有效地学习天然产物的进化规律与结构特征。在预训练阶段,研究团队基于COCONUT 数据库中约60万条未标注天然产物结构数据,构建了面向天然产物的分子表示学习框架。实验结果表明,相较于传统分子指纹和多种预训练图神经网络方法,NaFM在天然产物分类、来源识别、基因组挖掘、活性预测和虚拟筛选等任务中表现出更强的迁移能力和鲁棒性。

西安交大人机所博士生研究成果在《自然》子刊《自然机器智能》发表

NaFM的母核感知预训练框架。该框架结合母核子图重建与母核感知对比学习:在天然产物核心骨架区域遮蔽原子、化学键和拓扑连接信息,并基于骨架相似性加权对比学习,从而捕获天然产物生物来源、生物合成基因簇、合成途径与生物活性之间的内在关联。


版权声明:
文章来源西安交大,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年先进航空航天技术与卫星应用国际学术会议 (AATSA 2026)(2026-05-15)

2026年第四届亚洲计算机视觉、图像处理与模式识别国际会议(CVIPPR 2026)(2026-05-22)

2026年物理学、核能科学与能源科学国际会议(ICPNSES 2026)(2026-05-24)

2026年第五届网络、通信与信息技术国际会议(CNCIT 2026)(2026-05-29)

第九届统计与数据科学国际研讨会(SDS)(2026-05-29)

第十届土木建筑与结构工程国际学术会议(I3CSE 2026)(2026-05-29)

第五届艺术设计与数字化技术国际学术会议(ADDT 2026)(2026-06-05)

第五届信号处理与通信安全国际学术会议(ICSPCS 2026)(2026-06-05)

第八届能源系统与电气电力国际学术会议(ICESEP 2026)(2026-06-05)

2026年智能机器人与控制技术国际会议(CIRCT 2026)(2026-06-12)

2026能源化学、光电材料与工程技术国际会议(ECOMET 2026)(2026-6-15)

2026年可持续能源、热力学与机械工程国际会议(SETME 2026)(2026-5-17)

2026电子、电路与信息工程国际会议(ECIE 2026)(2026-5-21)

2026年大数据与信息管理国际会议(IACBDIM 2026)(2026-6-28)

2026年社会文化与艺术设计国际会议(ICSCAD 2026)(2026-5-15)

2026年水利,水电与能源系统国际会议(ICWRHES 2026)(2026-6-25)

2026年人工智能、智能感知与先进制造国际会议(IAISM 2026)(2026-5-14)

2026知识产权运营、科研管理与金融经济国际会议(IPORMFE 2026)(2026-6-27)

2026年文化传播、艺术与新媒体国际会议(CCANM 2026)(2026-5-31)

第五届环境遥感与地理信息技术国际学术会议(ERSGIT 2026)(2026-9-18)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。