生物医学交叉研究院黄牛实验室系统评估
2024/11/11
清华新闻网11月11日电 在科学研究中,常常存在大问题和小问题之分。大问题能够更新我们对世界的认知,具有深远影响,也易于获得较多的关注和研究投入;而小问题往往因为缺乏轰动效应,解决难度却不见得小,常常处于悬而未决的状态。但从科学假说到应用落地,其间需要跨越一条漫长且深邃的转化研究沟壑,其中大小问题相互交织、彼此转化。小问题的研究有可能为解决大问题提供关键线索,反之,大问题的解决也可能带来对小问题的全新理解。因此,每一个小问题的解决都是科学进步和技术落地不可或缺的一部分。
在计算化学领域,“小分子构象采样”便是这样一个看似不起眼的小问题,甚至被部分从业人员认为是“已解决的科学问题”。在过去的十数年间,基于结构的虚拟筛选已被广泛应用于药物筛选的早期阶段。通过分子对接这种方式,可以快速高效地评估配体-受体的相互作用,处理规模高达109的化学分子库,对于发现潜在的结构多样的先导化合物具有重要意义。其中,小分子构象采样为评估化学小分子与受体的相互作用赋予了必要的柔性,对虚拟筛选的成功率有着显著影响。目前,已有多种构象采样方法在“晶体结构构象再现”任务中表现优异,并获得了广泛认可。但这些方法的多样性和准确性在实际应用中,尤其是“虚拟筛选分子对接”任务中,缺乏系统的测试和比较,这一情况限制了研究人员对这些方法的选择和使用,成为一个亟待解决的“小问题”。
10月30日,清华大学生物医学交叉研究院黄牛实验室在《计算化学杂志》(Journal of Computational Chemistry)上发表了题为 “评估分子对接中的小分子构象采样方法”(Assessing Small Molecule Conformational Sampling Methods in Molecular Docking) 的研究论文。黄牛团队借助分子对接软件UCSF DOCK3.7,对七种基于不同算法的小分子构象采样方法进行了公平比较,深入分析了构象采样方法在分子对接任务中的表现,阐明了小分子构象采样对于对接结果的影响。研究发现,采样方法的采样能力与其在对接任务中的对接性能之间存在显著差距,并且不同采样方法在不同场景中的对接效果和筛选能力也各有差异。基于测试结果,研究人员为分子对接过程中小分子构象采样方法的选择提供了建议,为进一步提升构象采样的性能提出了新的技术方案。
为了在DOCK3.7中对不同构象采样方法进行公平比较,研究人员设计了db2_converter工作流程。通过统一采样数量等参数设定,并引入PoseBusters测试套件以过滤不合理构象,该流程能够生成数量相当且适用于对接的合理构象集。随后,研究人员在类药小分子-蛋白复合物晶体结构数据集Platinum Diverse Dataset上,将采样构象集、对接结果和晶体结构进行对比,评估了采样方法的采样能力及其与DOCK3.7结合后的对接性能。结果表明,各采样方法的对接性能相比采样能力均显著下降。例如,表现最佳的CCDC Conformer Generator的采样能力为0.98,而其对接能力则为0.59。进一步系统分析对接结果后,研究人员发现不同采样方法之间的性能差异主要来源于对采样自由度,尤其是二面角的覆盖程度不同。而采样能力和对接能力的差异则与采样能力评估标准的局限性有关——该标准将采样构象与晶体构象间的RMSD小于2Å作为符合标准的判据,但这种评估未能充分涵盖形成关键相互作用的子结构翻转情况。一些满足该标准的构象在关键子结构上发生了翻转,因此在分子对接中缺乏必要的相互作用,导致评分较低,难以被筛选出。此外,对接能力相较于采样能力的大幅下降,还可以部分归因于分子对接过程中的刚性受体处理。一些可能有效的对接构象由于分子间的碰撞被过滤,从而减少了对接的成功率。
研究人员还在DUDE-Z数据集上测试了各采样方法在分子对接中的回顾性筛选能力。DUDE-Z数据集包含43个已知蛋白靶标,每个靶标下有数十个已知活性小分子,每个活性小分子对应50个物理性质相似但结构不同的诱饵分子。筛选能力反映了对接软件从化合物库中富集活性小分子的能力。整体来看,ConfGenX展现了较优的回顾性筛选能力,其LogAUC和EF1的中位数分别为19.07和8.71。由于不同靶点的活性分子化学结构各异,且结合口袋的性质不同,采样方法在各靶点上的筛选能力表现出较大差异。具有不同采样偏好的方法在不同靶点上各自展现出最佳的筛选能力。
基于这一结论,研究人员推测不同采样方法的结果可能具有互补性。为验证这一点,研究人员尝试将采样方法进行两两组合,以考察组合采样方法对上述分子对接任务的影响。结果表明,在对接能力和筛选能力上,组合采样方法能够进一步提升分子对接的整体表现。
综上所述,研究人员将六种传统采样方法(Omega、BCL::Conf、CCDC Conformer Generator、ConfGenX、Conformator、RDKit ETKDGv3)和一种基于深度学习的构象生成模型(Torsional Diffusion)与分子对接软件UCSF DOCK3.7结合,系统评估了多种采样方法在分子对接任务中的对接能力和筛选能力。结果显示,尽管采样方法在整体采样上表现优异,但在分子对接任务中的表现差异明显,这主要归因于不同方法在可旋转键的二面角采样范围上的独特偏好,对进一步发展构象采样方法提供了清晰的方案。研究指出,在分子对接中,除了关注打分函数的精度,还需重视小分子构象采样的数量和质量。结合多种采样方法的优势有望进一步提升对接表现。
黄牛实验室的2020级博士生夏前程为论文第一作者,黄牛研究员为通讯作者。其他作者包括黄牛实验室的付秋禹、沈成,以及挪威卑尔根大学的鲁斯·布伦克(Ruth Brenk)博士。研究得到美国加利福尼亚大学旧金山分校的彭士明博士和约翰·欧文(John Irwin)博士的帮助。研究由北京市科委和清华大学共同资助。
论文链接:
文章来源清华大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年6月优质国际学术会议推荐 430
-
2026年智慧教育与数据挖掘国际学术 199
-
2026年第17届机械与航空航天工程 421
-
2026资源、化学化工与应用材料国际 2009
-
2026年图像处理与数字创意设计国际 1818
-
2026年机械工程,新能源与电气技术 6286
-
2026年材料科学、低碳技术与动力工 1986
-
2026年地质灾害、遥感技术与智能预 05-27
-
2026年机器人技术、控制与工业自动 05-27
-
2026年虚拟现实、人机交互与仿真模 05-27
-
2026年农业传感器、精准灌溉与智慧 05-27
-
2026年经济发展、产业升级与教育培 05-27
-
2026年算法,模式识别与深度学习国 05-27
-
2026年图像处理,计算机视觉与多媒 05-27
-
2026年大数据,电子信息工程与智慧 05-27
-
中国科协发布2025年《重要学术208
-
2026年新锐分区(原中科院期刊3653
-
2025年两院院士增选有效候选人4617
-
2025最新JCR分区及影响因子13107
-
好学术:科研网址导航|学术头条分6061
-
2025年国际期刊预警名单发布!6242
-
2025年中科院期刊分区表重磅发22747
-
吉林大学校长张希:学术会议中的提7318
-
西安交大人文学院妥建清教授在《中05-23
-
中国科大实现液晶中涡旋线向拓扑孤05-23
-
新型多功能水性环氧防腐涂层研究取05-23
-
研究揭示树种多样性抑制土壤激发效05-23
-
铍-9离子精密测量研究取得进展05-23
-
氨分解制绿氢催化剂研究获进展05-23
-
南京大学物理学院彭茹雯和王牧研究05-23
-
上海英致商务咨询有限公司 2217

-
昆明医科大学 18603

-
上海市上海大学 23420

-
ZL 23324

-
北京科技大学腐蚀与防护中心 21475

-
汉鼎国际 24315

-
中关村精准医学基金会 8568

-
武汉赛思 24387

-
北京华斯泰生物医学科技有限公司 2673

-
HKSME 23572

-
河北北方大厦 21403

-
重庆迎宾酒店式短租公寓 23437

-
北京城市学院 18345

-
世纪金源酒店集团营销中心 23329

-
GRES 24264

-
中国商业经济应用与管理研究分会 23414

-
中国仪器仪表学会近红外光谱分会 23594

-
清华大学 21488

-
上海光学精密机械研究所慕尼黑展览 23432

-
科学研究中心 21297




















590





































