当前位置:首页 >> 学术资讯 >> 科研信息

上海交大计算机学院联合变革性分子前沿科学中心发表化学合成大模型

2025/09/06

文章导读
你是否想过,AI能像化学家一样设计并优化未知反应?上海交大团队发布全新化学合成大模型Chemma,无需量子计算,仅用15次实验就攻克了未报道的N杂环交叉偶联反应,产率高达67%。它在单步逆合成、产率预测等多项任务中刷新世界纪录,Top-1准确率达72.2%,推荐配体准确率93.7%。通过“Co-Chemist”人机协作框架,Chemma不仅能理解分子结构,还能生成新催化剂、溶剂,真正实现开放空间中的自主探索。模型已开源上线,正重塑有机合成的未来范式。
— 内容由好学术AI分析文章内容生成,仅供参考。

依托上海交通大学AI for Science科学数据开源开放平台,在上海市人工智能重大专项的支持下,上海交通大学计算机学院AI for Science团队许岩岩副教授、金耀辉教授、杨小康教授等人联合上海交通大学变革性分子前沿科学中心朱峰副教授团队,在人工智能化学有机合成领域(AI for Chemistry)取得重大原创突破。相关研究于2025年7月1日,以“Large language models to accelerate organic chemistry synthesis”为题在线发表在《Nature Machine Intelligence》,展现通用人工智能大模型赋能有机化学合成的巨大潜力。

上海交大计算机学院联合变革性分子前沿科学中心发表化学合成大模型

自2023年初,计算机学院AI for Science团队开始构建白玉兰科学大模型,涵盖化学合成、蛋白质结构解析、流体力学、城市科学等基础与新兴学科。作为白玉兰科学大模型的成果之一,该研究首次实现化学大语言模型加速有机合成全流程。无需量子计算,仅依靠化学知识理解和推理能力,实现了在单步/多步逆合成、产率预测、选择性预测、反应优化等多个基准任务上,超越以往所有已知的最佳结果。建立了“Co-Chemist”人机协作的主动学习框架,在一项全新的、未曾报道的Suzuki-Miyaura交叉偶联反应中,仅用15次实验就成功找到了合适的配体和溶剂,实现了67%的分离产率,充分验证了其在加速真实化学发现中的巨大价值,解决了实验科学中反复试错的重大难题,为大型语言模型加速有机化学合成提供了新的研究范式和方法。

论文信息

Zhang, Y., Han, Y., Chen, S. et al. Large language models to accelerate organic chemistry synthesis. Nat Mach Intell 7, 1010–1022 (2025).

模型在线试用网址:https://ai4chem.sjtu.edu.cn

研究背景

化学合成作为创造变革性分子的基础方法,对生命科学、材料和能源的各个领域产生了重大影响。尽管过去几十年化学仪器取得了长足进步,但面对浩瀚的反应空间和复杂的分子结构,化学家们仍需反复查阅文献、设计方案并进行湿实验验证。为了改变这一现状,传统的AI方法,如基于密度泛函理论(DFT)计算或贝叶斯优化的模型,虽然在特定任务上取得了进展,但存在明显局限:它们通常严重依赖专家知识进行特征工程和分子参数化,需要高通量实验平台提供大量数据,并且大多只能在专家预先设定的“封闭反应空间”(如一个固定的配体或溶剂库)内进行优化,这可能导致错过性能更优的未知选择。

近年来,以GPT为代表的大语言模型展现了强大的通用能力,但在化学领域的应用仍处于初级阶段,其化学专业能力有限,难以自主探索和优化未报道的反应。为了克服上述挑战,研究者们提出了一个核心问题:我们能否构建一个深度融合化学知识的大语言模型,它既能像人类化学家一样从SMILES分子式和反应数据中理解化学结构和规律,又具备LLM的强大生成能力,从而能够在开放的反应空间中进行真正的探索与发现?因此,该研究设计提出白玉兰化学合成大模型(称之为Chemma),旨在成为能够与化学家互动、辅助实验决策、并最终加速有机合成进程的生成式AI助手。Chemma 能从SMILES序列中学习分子表征,理解化学结构;通过海量反应数据预训练,Chemma能像化学家一样学习反应物、产物和条件之间的复杂关系;Chemma的生成能力使其能够设计全新的分子(如推荐新配体),从而突破预设条件的限制,指导探索新反应(下图所示)。

上海交大计算机学院联合变革性分子前沿科学中心发表化学合成大模型

图1: Chemma协助有机化学合成的功能与应用场景。科学家可以围绕四项主要任务与Chemma交流,包括正向反应预测、逆合成、条件生成和性能预测(如产率和选择性)。

创新成果

团队实现在多个化学基准任务上性能验证。在USPTO-50k数据集上,Chemma在单步逆合成任务中实现了72.2%的Top-1准确率,显著优于文献报道的最优Top-1准确率57.7%。在多步合成测试中,Chemma能够设计合理的反应步骤,并通过专家验证;对于产率预测/选择性预测(区域选择性与对映选择性)任务,Chemma无需DFT特征,对高通量实验数据预测R2达到了0.88;对于配体/催化剂推荐任务,Chemma可在预设条件下给出最优配体,在多数测试组合中,其推荐配体带来更高中位产率,同时准确率达到93.7%。依托变革性分子前沿科学中心,针对特定反应,Chemma可在线设计生成20多种催化剂,10多种试剂,和多种添加剂,同时实现实验优化,快速提高化学实验效率。

上海交大计算机学院联合变革性分子前沿科学中心发表化学合成大模型

图 2: Chemma在不同有机合成任务上的性能评估,包括正向反应预测、逆合成、条件生成和性能预测(如产率和选择性)。

除了预测能力之外,Chemma还可作为“数据生成器”,在数据稀疏的情况下,通过生成高质量伪数据来提升传统实验优化算法(BO)的性能。实验验证在Suzuki–Miyaura与Buchwald–Hartwig反应中大幅减少了实验次数,相比传统BO算法需要50次以上,Chemma-BO仅用10-15次实验就能达到98%以上的产率,反应优化效率提高50%。

上海交大计算机学院联合变革性分子前沿科学中心发表化学合成大模型

图 3: Chemma合成数据用于提高产率预测和反应优化,评估三种不同方法(Chemma-BO、GPT-4和BO)在铃木-宫浦和布赫瓦尔德-哈特维希反应上的平均累计最大观察产率。

该模型不能能够实现反应预测,还能从未知反应空间中探索实现反应设计和优化。在变革性分子前沿科学中心朱峰副教授的大力支持下,团队开展了湿实验验证。对于一个未报道N杂环交叉偶联反应,研究人员将Chemma集成入主动学习框架,探索反应适配的配体与溶剂。通过“人-机协作”的主动学习循环,第一轮尝试失败后,Chemma进行实验数据反馈和在线微调,在第二轮便精准地推荐了高效的配体(PAd3),最终仅用15次实验,就成功实现了67%的分离产率。此任务展示了Chemma在开放反应空间中辅助探索未知反应条件的潜力。

上海交大计算机学院联合变革性分子前沿科学中心发表化学合成大模型

图 4:Chemma驱动的反应探索和优化的主动学习框架。通过主动学习框架对未见文献报道的反应(α-芳基 N 杂环的合成)进行配体和溶剂的探索。

研究意义

研究团队另辟蹊径,将化学反应视作自然语言任务,学习其结构与规律,在多个有机化学任务中表现优异,展现出良好的人机协作能力。特别是在无需DFT的条件下实现产率与选择性的精准预测,以及在开放空间中完成自主优化,充分证明了语言模型在化学合成中的适用性。

作者信息

上海交通大学计算机学院博士生张雨为本文第一作者,变革性分子前沿科学中心博士生韩阳和陈帅在湿实验方面做出重要贡献。计算机学院许岩岩副教授、金耀辉教授、杨小康教授、上海交通大学变革性分子前沿科学中心朱峰副教授为本文通讯作者。丁奎岭院士对本研究给予了宝贵的建议和指导,本研究得到了上海市人工智能重大专项资助,以及上海交通大学AI for Science科学数据开源开放平台支持。

团队介绍

上海交通大学计算机学院AI for Science团队在杨小康教授、金耀辉教授、许岩岩副教授带领下,包括十余位博士后与硕博研究生,重点研究生成式人工智能,特别是科学大模型赋能化学研究,针对有机化学合成、自动化实验等重大问题提出了一系列创新解决方案。团队发布了首个化学合成大语言模型——白玉兰科学大模型,是首个具备反应生成与“人在环路”反馈优化能力、能够指导实验探索的化学大模型,具有分子设计、逆合成线路规划、反应条件生成、反应产率预测、实验条件优化迭代等化学合成全功能。团队研究成果已发表于Nature Energy, Nature Computational Science (封面), Nature Machine Intelligence, Science Advances, 以及CCF A类会议。团队所属的人工智能教育部重点实验室计算资源丰富,积累大量数据和基础模型,并与化学与化工学院、变革性分子前沿科学中心团队紧密合作,形成交叉学科研究体系。


版权声明:
文章来源上海交大,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年智慧交通与检测技术国际会议(ITDT 2026)(2026-03-25)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-03-27)

2026年人工智能教育技术与数据科学国际学术会议(AIETDS 2026)(2026-03-27)

2026年IEEE第八届软件工程和计算机科学国际会议(CSECS 2026)(2026-04-17)

第十五届春季国际工程与技术大会 (SCET 2026)(2026-04-17)

2026年金融科技、创新与信息技术国际会议(2026-04-18)

2026年多尺度人工智能国际会议(MAI 2026)(2026-04-24)

第三届机器学习与智能计算国际学术会议(MLIC 2026)(2026-04-24)

2026 空天信息与产业创新国际学术研讨会暨第二届中国——塞尔维亚空天技术与产业应用研讨会(ISA3I 2026)(2026-04-24)

数字化教育系统与计算机科学国际学术会议(2026-04-24)

2026年计算机网络、微芯片与移动计算国际会议(INMMC 2026)(2026-4-30)

2026年艺术鉴赏、美学与视觉传达设计国际会议(ICAAAVCD 2026)(2026-5-29)

2026年光电子学、纳米材料与电子器件国际会议(IONED 2026)(2026-3-30)

2026年语言处理与机器翻译国际会议(ICLPMT 2026)(2026-5-28)

2026年可持续发展,新能源与电力国际会议(SDNEE 2026)(2026-3-29)

2026设计、美学与语言国际会议(ICDAL 2026)(2026-3-29)

2026年生物信息学与生物力学工程国际会议(ICBBE 2026)(2026-3-29)

2026年激光、测量测绘与光学工程国际会议(ICLSOE 2026)(2026-3-27)

2026商业、经济发展与贸易国际会议(ICBEDT 2026)(2026-4-29)

2026年计算机应用、数据驱动与机器学习国际会议(ADDML 2026)(2026-3-28)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

学术科研网址导航,430+站,定制学术书签

2026年第五届云计算、计算机视觉和图像处理.

2026年动力学与机械工程国际学术研讨会 (.

2026年IEEE第八届软件工程和计算机科学.

2026年第八届计算机图形学、图像与可视化国.

第八届信息科学、电气与自动化工程国际学术会议.

第三届机器学习与智能计算国际学术会议(MLI.

第六届自动化控制、算法与智能仿生国际学术会议.

2026 年第三届计算,机器学习与数据科学国.

第十三届先进制造技术与材料工程国际学术会议 .

第二届人工智能与产品设计国际学术会议 (AI.

2026年多尺度人工智能国际会议(MAI 2.

2026年量子计算与人工智能国际学术会议(I.

2026年第六届计算机视觉与模式分析国际学术.

第七届机械仪表与自动化国际学术会议(ICMI.

2026年第四届亚洲机器学习、算法与神经网络.

2026年第四届亚洲计算机视觉、图像处理与模.

2026年人工智能与数据挖掘国际学术会议(A.

2026年IEEE第七届计算,网络与物联网国.

2026年第五届网络、通信与信息技术国际会议.

2026年智能机器人与控制技术国际会议(CI.

2026年传感器技术、自动化与智能制造国际会.

2026年智能系统与计算国际会议 (ICIS.

2026年电子, 通信与计算机科学国际会议 .

2026年IEEE第三届先进机器人, 自动化.

2026年第七届控制, 机器人与智能系统国际.