北京大学深研院新材料学院莫凡洋团队AI4S新进展——开发智能柱层析预测模型新方法
2025/06/19
近日,深圳研究生院新材料学院长聘副教授莫凡洋团队在柱层析分离技术领域取得重要进展。研究团队通过结合自动化实验与机器学习方法,成功开发出柱层析分离条件的智能预测模型。柱层析作为有机化学实验室最常用的分离纯化手段、有机合成工作者的基本实验技能,其分离条件的确定——如层析柱规格、上样方式、流动相选择、产品接收技巧等——需要实验人员富有经验。然而相关经验的积累通常需要长周期的培养与反复实践,其形成的认知体系深度绑定于特定实验系统与研究者个体,呈现个体差异大、难以标准化、知识传递升级乏力的实际,严重迟滞了该项技术创新的迭代速率。
自动化与机器学习结合建立柱层析预测模型
针对以上问题,研究团队开展柱层析机器学习预测模型研究。首先构建了自动化实验平台,系统采集了218种有机化合物在6365次柱层析实验中的保留体积数据,建立了标准化数据集。该数据集不仅包含详细的分子结构特征,还整合了洗脱剂比例、上样质量、层析柱规格等关键实验参数。这一标准化数据采集方式,可将传统依赖经验的分离过程转化为可量化分析的科学问题。
特征工程
基于这些实验数据,研究团队开发了分位数几何增强图神经网络(QGeoGNN)模型。该模型通过构建原子-键图(GraphG)和键-角图(GraphH)双重图表征,实现了对分子三维结构特征和实验条件的协同建模。其中,原子-键图精确描述了分子的拓扑结构,而键-角图则有效捕捉了分子的空间构型特征。研究还创新性地将实验参数嵌入图神经网络的边特征,使模型能够同时考虑分子特性和实验条件的影响。实验验证表明,该模型对保留体积的预测决定系数R²超过0.9,显著优于传统经验方法。此外,模型采用的分位数学习技术还能提供预测结果的置信区间,为实验设计提供更多参考信息。
不同算法训练结果对比
在实际应用验证中,研究团队选取了包括Claisen重排反应、钯催化偶联反应、氰基加成反应等在内的多类经典有机反应体系进行系统测试。结果显示,该智能预测系统对不同规格层析柱(4g—40g)和多种溶剂体系(如石油醚/乙酸乙酯、二氯甲烷/甲醇等)均表现出良好的适用性。研究提出的分离概率(Sp)指标能够定量评估特定条件下混合物的分离效果,为实验设计提供了可靠的量化依据。通过核磁共振验证,由模型预测的分离条件所得产物纯度均达到预期标准。前述研究结论充分证明了开发的智能预测模型在化学研究中的实用价值。
实验验证
这项研究不仅为有机合成中的纯化工艺优化提供了新的技术手段,也为人工智能在化学领域的应用开辟了新方向。相关数据集和模型代码已在GitHub平台开源,旨在为后续研究深化与拓展提供便利。
相关成果以“Intelligent Column Chromatography Prediction Model Based on Automation and Machine Learning”为题,于2025年5月29日在线发表于Cell Press旗下化学领域旗舰期刊Chem。论文通讯作者是莫凡洋,第一作者是课题组博士生吴文超。该工作以人工智能驱动有机合成化学基础学科领域的纯化优化问题为研究主题,这一“标准化数据集建设-预测模型开发-合成化学体系实际应用验证”的研究工作体现了新材料学院AI4S交叉研究的阶段性成果。
文章来源北京大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年两院院士增选有效候选人116
-
2025最新JCR分区及影响因子2461
-
好学术:科研网址导航|学术头条分641
-
2025年国际期刊预警名单发布!770
-
2025年中科院期刊分区表重磅发4295
-
中国科协《重要学术会议目录(202964
-
吉林大学校长张希:学术会议中的提1619
-
2025年国自然正式放榜!08-27
-
SCI论文中的数据引用,如何避免08-15
-
EI核心期刊和普通期刊有什么本质08-15
-
国内期刊EI与核心有什么区别?三08-15
-
怎么查找前几年的EI期刊源?科研08-15
-
如何准确验证论文是否被SCI收录08-15
-
机械类EI期刊投稿全攻略:从实验08-15
-
SCI论文DOI号查找全攻略:学08-15
-
第二军医大学 20880
-
上海中铁快运 17989
-
杭州宝盛水博园大酒店有限公司 2044
-
扬州大学信息工程学院 18086
-
ASTIRC 24113
-
复旦大学附属眼耳鼻喉科医院 8003
-
广州国际大健康博览会高峰论坛 18425
-
nogara 17916
-
亚洲商业协会有限公司 18028
-
北京永康中医药研究院 2089
-
厦门海峡旅行社有限公司 23054
-
北京国宏经纬文化发展有限公司 18213
-
武汉科技大学 23029
-
北京中经蓝山文化交流有限公司 17967
-
吉 林 大 学 18290
-
云南水富云天化股份公司 17937
-
同心学术联合会 20955
-
北京农业工程学会 18120
-
中国灾害防御协会风险分析专业委员 21071
-
上海麦峰医学科技有限公司 23005