当前位置:首页 >> 学术资讯 >> 科研信息

清华大学生命学院龚海鹏课题组合作开发生成模型TopoDiff,利用全局几何感知提升蛋白质骨架设计能力

2025/07/18

文章摘要
清华大学龚海鹏课题组联合多方开发出蛋白质骨架生成模型TopoDiff,该模型通过无监督学习掌握蛋白质全局几何特征,大幅提升生成结构的多样性和折叠空间覆盖度。其实现“自顶向下”设计方法,将整体结构与原子细节生成分离,增强可控性。实验验证设计出具有全新拓扑结构的β折叠蛋白,部分结构已通过X射线晶体解析证实。该成果发表于《自然-机器智能》,填补了评估指标空白,为蛋白质设计开辟新路径。
— 此摘要由好学术AI分析文章内容生成,仅供参考。

 从头(de novo)蛋白质设计,旨在创造具有全新结构与功能的蛋白质分子,是生物医药与合成生物学等领域的关键前沿技术。近年来,以扩散模型为代表的生成式人工智能,为这一领域带来了革命性的推动力。在此背景下,如何引导这些强大的生成模型,使其不仅能创造出合理且新颖的结构,更能系统性地、可控地覆盖更加广阔和多样的蛋白质折叠宇宙,成为了推动该领域向前发展的关键议题。

清华大学生命学院龚海鹏课题组与合作者近日在《自然-机器智能》(Nature Machine Intelligence)发表了题为“利用全局几何潜在编码改进基于扩散的蛋白质骨架生成”(Improving diffusion-based protein backbone generation with global-geometry-aware latent encoding)的研究论文。该研究面对当前蛋白质设计领域中扩散生成模型(diffusion-based generative models)的关键瓶颈,提出了深度生成模型框架TopoDiff。TopoDiff通过无监督地学习一个能够捕捉蛋白质全局几何特征的低维潜空间(latent space),显著提升了生成蛋白质骨架的多样性和对自然蛋白质折叠空间的覆盖度,并实现了新颖的多维度、可解释的生成过程控制。研究团队通过该方法成功设计并验证了一系列具有全新拓扑形式的β折叠蛋白。

为解决这些挑战,研究团队提出了一种遵循“自顶向下”(top-down)设计哲学的生成模型框架。其关键创新在于“解耦”——将一体化的结构生成问题分解为“定义全局几何蓝图”与“构建原子细节”两个功能模块。它引入一个统一的、固定维度的低维隐空间,专门用于表征和调控蛋白质的宏观几何布局,而将复杂的原子坐标采样交由条件扩散模型完成。

这样的设计思想通过一个双阶段流程得以实现:首先,通过联合训练,使编码器学会“理解”并绘制蛋白质的几何蓝图,而解码器则学会“执行”该蓝图指令;随后,再训练一个轻量级的潜空间扩散模型,用于学习并采样新的、多样的全局几何编码。最终,整个生成过程演变为先采样一个全局编码,再由解码器据此生成完整结构,实现了从宏观到微观的清晰、可控的设计流程。

清华大学生命学院龚海鹏课题组合作开发生成模型TopoDiff,利用全局几何感知提升蛋白质骨架设计能力

TopoDiff整体框架

为验证模型是否真正理解了蛋白质的结构规律,研究团队利用训练好的编码器对CATH、SCOPe等多个数据库的结构进行编码和降维可视化。结果显示,在完全无监督的训练模式下,TopoDiff学到的潜空间流形与不同数据库的人工注释高度吻合。不同折叠类型的蛋白质在潜空间中自动聚类成清晰的区域。这种由数据驱动学到的连续空间表示,有效克服了不同分类体系因划分标准主观性(subjectivity)与离散性(discreteness)带来的不一致问题,为理解不同蛋白质折叠之间的连续过渡关系,乃至发现潜在的分类模糊区域和错误注释,提供了全新的、更客观的视角。

为定量评估模型对已知折叠空间的覆盖能力,解决现有指标的空白,团队首次在蛋白质设计领域引入了“覆盖度”(Coverage)评估指标。与多个前沿模型的性能基准测试结果显示,TopoDiff在保持高可设计性的同时,其覆盖度指标显著优于所有基线模型,尤其是在传统模型代表性不足的折叠类型上,展现出明显的优势,有效修正了采样偏差。更有趣的是,其独特的隐空间设计解锁了多种全新的可控生成模式,如属性引导生成、隐编码插值、全局与局部协同控制等,极大地丰富了蛋白质设计的工具箱。

清华大学生命学院龚海鹏课题组合作开发生成模型TopoDiff,利用全局几何感知提升蛋白质骨架设计能力

TopoDiff生成性能基准评测

为了最终检验TopoDiff在真实世界中的设计潜力,团队挑战了设计全新拓扑β蛋白这一公认难题。利用模型的可控生成能力,团队在计算层面高效地筛选出候选设计,并通过多种实验手段,验证了多个设计具有明确的单体状态、正确的二级结构和出色的热稳定性。其中,设计B10的高分辨率X射线晶体结构被成功解析,其结构与计算模型高度吻合,更重要的是,其展现出一种在自然界中前所未见的全新蛋白质拓扑结构。这一“从计算到现实”的成功闭环,强有力地证明了TopoDiff有能力突破自然演化的边界,探索并创造全新的蛋白质结构宇宙,为未来功能分子的理性设计开辟了新的道路。

清华大学生命学院龚海鹏课题组合作开发生成模型TopoDiff,利用全局几何感知提升蛋白质骨架设计能力

新颖β蛋白的从头设计及实验验证

清华大学生命学院副教授龚海鹏与北京生命科学研究所、清华大学生物医学交叉研究院研究员徐纯福为论文的通讯作者,清华大学生命学院2021级博士生张昱阳、北京生命科学研究所2022级博士生刘宇航、加州大学圣迭戈分校2024级博士生马子惠为论文共同第一作者。清华大学蛋白质晶体平台教师李敏、范仕龙为研究提供了重要帮助。研究得到科技部、国家自然科学基金和北京生物结构前沿研究中心的经费支持。


版权声明:
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年智慧交通与检测技术国际会议(ITDT 2026)(2026-03-25)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-03-27)

2026年人工智能教育技术与数据科学国际学术会议(AIETDS 2026)(2026-03-27)

2026年IEEE第八届软件工程和计算机科学国际会议(CSECS 2026)(2026-04-17)

第十五届春季国际工程与技术大会 (SCET 2026)(2026-04-17)

2026年金融科技、创新与信息技术国际会议(2026-04-18)

2026年多尺度人工智能国际会议(MAI 2026)(2026-04-24)

第三届机器学习与智能计算国际学术会议(MLIC 2026)(2026-04-24)

2026 空天信息与产业创新国际学术研讨会暨第二届中国——塞尔维亚空天技术与产业应用研讨会(ISA3I 2026)(2026-04-24)

数字化教育系统与计算机科学国际学术会议(2026-04-24)

2026年土木工程、环境与安全工程国际会议(CEESE 2026)(2026-3-31)

2026年第九届信息科学与系统国际会议 (ICISS 2026)(2026-8-27)

2026系统架构、机械工程与动力学国际会议(ICSAMED 2026)(2026-3-29)

2026年生物技术、食品质量与农业国际会议(ICAFQB 2026)(2026-3-31)

2026年电化学、储能与能源转换国际会议(ICEESEC 2026)(2026-3-26)

2026旅游、产业经济与社会服务国际学术会议(TIESS 2026)(2026-3-30)

2026工业设计、新媒体技术与人机交互国际会议(THCI 2026)(2026-4-26)

2026公共管理与公共关系国际会议(ICPMPR 2026)(2026-3-30)

2026文学、教育创新与新媒体发展国际学术会议(LEINMD 2026)(2026-3-30)

2026年大数据、云计算与智能数据挖掘国际会议(ICBDIM 2026)(2026-3-26)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

学术科研网址导航,430+站,定制学术书签

2026年第五届云计算、计算机视觉和图像处理.

2026年动力学与机械工程国际学术研讨会 (.

2026年IEEE第八届软件工程和计算机科学.

2026年第八届计算机图形学、图像与可视化国.

第八届信息科学、电气与自动化工程国际学术会议.

第三届机器学习与智能计算国际学术会议(MLI.

第六届自动化控制、算法与智能仿生国际学术会议.

2026 年第三届计算,机器学习与数据科学国.

第十三届先进制造技术与材料工程国际学术会议 .

第二届人工智能与产品设计国际学术会议 (AI.

2026年多尺度人工智能国际会议(MAI 2.

2026年量子计算与人工智能国际学术会议(I.

2026年第六届计算机视觉与模式分析国际学术.

第七届机械仪表与自动化国际学术会议(ICMI.

2026年第四届亚洲机器学习、算法与神经网络.

2026年第四届亚洲计算机视觉、图像处理与模.

2026年人工智能与数据挖掘国际学术会议(A.

2026年IEEE第七届计算,网络与物联网国.

2026年第五届网络、通信与信息技术国际会议.

2026年智能机器人与控制技术国际会议(CI.

2026年传感器技术、自动化与智能制造国际会.

2026年智能系统与计算国际会议 (ICIS.

2026年电子, 通信与计算机科学国际会议 .

2026年IEEE第三届先进机器人, 自动化.

2026年第七届控制, 机器人与智能系统国际.