当前位置:首页 >> 学术资讯 >> 科研信息

西安交大人机所博士生研究成果在《自然》子刊《自然机器智能》发表

2026/05/12

文章导读
你以为AI制药的瓶颈在于算力,其实卡住脖子的是天然产物那“捉摸不透”的结构。传统模型面对这些复杂的分子往往“束手无策”,导致药物研发周期漫长且成本高昂。西安交大联合团队在《自然机器智能》上抛出的新模型NaFM,没有死磕通用算法,而是利用“母核感知”策略,精准捕捉到了分子骨架与生物活性间的隐秘关联。这一突破不仅解决了长期困扰学界的分布偏移难题,更让药物筛选的准确率有了质的飞跃——但这套模型究竟是如何从看似杂乱的数据中“读”出进化规律的?答案藏在它的预训练逻辑里。
— 内容由好学术AI分析文章内容生成,仅供参考。

近日,北京大学药学院联合西安交通大学人工智能与机器人研究所(以下简称“人机所”)、华盛顿大学、香港中文大学及石河子大学等单位,在小分子天然产物智能表征与药物发现研究方面取得新进展。研究团队提出了面向小分子天然产物的基础模型NaFM(Foundation Model for Natural Products),相关成果以《小分子天然产物的基础模型预训练》(Pretraining a foundation model for small-molecule natural products)为题,发表于国际高水平期刊《自然机器智能》(Nature Machine Intelligence)。

西安交大人机所博士生研究成果在《自然》子刊《自然机器智能》发表

在该研究中,西安交大人机所郑南宁院士团队深度参与了模型架构设计与人工智能方法开发工作。北京大学刘振明教授、西安交大人机所郑南宁教授以及博士生王裕淞为本文共同通讯作者,北京大学硕士生丁宇恒为第一作者。

天然产物是由微生物、动物或植物产生的代谢产物,具有结构多样性高、生物活性丰富等特点,是抗肿瘤、抗感染等药物发现的重要来源。然而,其发现过程长期面临周期长、成本高、标注数据有限等挑战。现有深度学习方法多依赖单一任务的监督学习,模型泛化能力有限;而针对合成分子的通用表征方法,也难以刻画天然产物在来源、骨架结构、合成途径与生物活性之间的复杂关联。进一步而言,天然产物在化学空间中呈现出以核心母核(scaffold)为中心的层级化分布特征,并与通用化合物空间存在显著分布偏移(distribution shift),导致现有模型难以直接迁移应用。因此,构建面向天然产物结构与生物学约束的专用预训练范式尤为迫切。为此,研究团队以分子母核为核心构建表征框架,系统刻画并对齐天然产物在生物来源、生物合成基因簇、合成途径及生物活性等多维属性之间的内在关联,提出了母核感知的预训练策略。

NaFM将掩码图学习与对比学习相结合:一方面,在天然产物分子骨架区域进行子图掩码,要求模型同时重建原子属性、化学键属性和拓扑连接信息;另一方面,以骨架相似性作为软权重,引导模型区分不同分子之间的强弱负样本关系,从而更有效地学习天然产物的进化规律与结构特征。在预训练阶段,研究团队基于COCONUT 数据库中约60万条未标注天然产物结构数据,构建了面向天然产物的分子表示学习框架。实验结果表明,相较于传统分子指纹和多种预训练图神经网络方法,NaFM在天然产物分类、来源识别、基因组挖掘、活性预测和虚拟筛选等任务中表现出更强的迁移能力和鲁棒性。

西安交大人机所博士生研究成果在《自然》子刊《自然机器智能》发表

NaFM的母核感知预训练框架。该框架结合母核子图重建与母核感知对比学习:在天然产物核心骨架区域遮蔽原子、化学键和拓扑连接信息,并基于骨架相似性加权对比学习,从而捕获天然产物生物来源、生物合成基因簇、合成途径与生物活性之间的内在关联。


版权声明:
文章来源西安交大,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年智慧教育与数据挖掘国际学术会议(SEDM 2026)(2026-06-27)

2026仪器仪表、先进材料与智能制造国际会议(ICIAMIM 2026)(2026-07-02)

2026年第五届机器学习、云计算与智能挖掘国际会议(2026-07-10)

2026年IEEE第三届先进机器人, 自动化工程与机器学习国际会议(ARAEML 2026)(2026-07-24)

第六届互联网技术与教育信息化国际学术会议 (ITEI 2026)(2026-07-24)

第五届航空航天工程与系统国际研讨会(ISAES 2026)(2026-07-24)

第十届教育、管理与社会科学国际学术会议 (ISEMSS 2026)(2026-07-24)

第六届电气工程与机电一体化技术国际学术会议(ICEEMT 2026)(2026-07-24)

第五届能源与电力系统国际学术会议 (ICEEPS 2026)(2026-07-24)

第九届声学、振动、噪声控制国际研讨会(CAVNC 2026)(2026-08-07)

2026年可持续发展、城市工程与公共服务管理国际会议 (DPSM 2026)(2026-9-15)

2026年人文地理、旅游管理与文化产业国际会议(IHGTM 2026)(2026-7-29)

2026年气候变化适应、环境科学与韧性城市建设国际会议(ESCCR 2026)(2026-8-25)

2026年人工智能、智能感知与先进制造国际会议(IAISM 2026)(2026-7-29)

2026年热传递与电子科学与技术国际会议(ICHTEST 2026)(2026-8-16)

2026年机电系统、精密仪器与测量控制国际会议(ICESPIMC 2026)(2026-7-16)

2026年智慧城市、社会治理与公共服务创新国际会议(SGSCP 2026)(2026-9-2)

2026导航定位、车辆工程与定位算法国际会议(ICNVEPA 2026)(2026-8-15)

2026年清洁能源、环境资源与能源材料国际会议(IEREM 2026)(2026-7-5)

2026年算力、智能计算与机器学习国际学术会议(CPICML 2026)(2026-7-26)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区