当前位置:首页 >> 学术资讯 >> 科研信息

北京师范大学人工智能学院教授崔振团队在《自然-机器智能》发文:提出面向蛋白质结构预测的二维视觉扩散学习范式

2026/04/21

文章导读
当你面对孤儿蛋白或快速变异的病毒序列时,是否曾因传统AI方法依赖海量同源数据而束手无策?现有方案不仅耗时漫长、显存爆炸,更在缺乏模板时预测失效。北京师范大学崔振团队却反其道而行,竟将三维结构难题拆解为二维视觉扩散任务。他们提出的TDFold框架,无需搜索同源信息,仅凭单序列就能实现百倍推理加速,且显存占用仅为竞品三成。这种颠覆性的“图像生成”逻辑究竟如何绕过传统瓶颈,让普通显卡也能跑通顶级预测?答案可能彻底改写你对蛋白质解码的认知。
— 内容由好学术AI分析文章内容生成,仅供参考。

近日,人工智能学院崔振教授团队在《自然-机器智能》(Nature Machine Intelligence)上在线发表研究论文“Two-Dimensional Geometric Template Diffusion for Boosting Single-Sequence Protein Structure Prediction”。论文首次将三维蛋白质结构预测问题建模为二维视觉扩散学习任务,提出二维几何模板扩散框架TDFold,构建“二维图像到三维结构”重建的新范式,形成“蛋白质几何空间—视觉图像编码、二维拓扑几何—视觉扩散生成、三维结构—图网络解码”的系统化技术路径,实现了预测性能更优、资源消耗更低、推理效率更高的目标,为三维构象解析提供了全新解决方案。


北京师范大学人工智能学院教授崔振团队在《自然-机器智能》发文:提出面向蛋白质结构预测的二维视觉扩散学习范式 


人工智能技术的快速发展正加速驱动科学发现。三维结构智能解码技术正突破传统方法对海量同源信息的依赖,以更高效、更普适的方式揭示蛋白质结构规律,为精准医学、药物合成与研发等领域开辟新可能。传统主流AI方法(如同源建模)高度依赖已知同源信息,需通过大规模数据库搜索获取多序列比对和结构模板,不仅消耗大量计算资源与时间,成本高昂,更对缺乏同源数据的孤儿蛋白、快速进化的病毒蛋白形成了显著的技术瓶颈。


为解决上述问题,研究团队将视觉生成大模型引入蛋白质结构预测,提出二维几何模板扩散学习框架TDFold,形成了系统化的技术路径:


第一阶段:蛋白质几何空间到视觉空间的编码映射


利用二维矩阵与图像结构同构的特点,将二维几何模板矩阵信息离散化编码为图像的多通道特征表示,为引入预训练的视觉扩散模型(如Stable Diffusion)提供统一的表示基础。


第二阶段:序列引导的视觉扩散几何模板生成


受视觉生成模型启发,将蛋白质序列视为“文本描述”,二维几何模板视为“多通道图像”,借助LoRA适配器将蛋白质领域知识融入视觉扩散模型,使模型学会根据序列提示“绘制”几何图像,实现从序列到几何模板的生成式建模。


第三阶段:模板注入的双分支图网络三维重建


在获得二维几何模板作为结构约束后,采用双分支协同学习架构:一个分支从生成的几何模板中提取残基级空间约束,另一分支学习细粒度原子级特征。两路特征深度融合后送入SE(3)-等变图神经网络(SE(3)-EGNN),最终输出蛋白质三维结构(图1)。

 

北京师范大学人工智能学院教授崔振团队在《自然-机器智能》发文:提出面向蛋白质结构预测的二维视觉扩散学习范式 

图1:TDFold模型架构以及二维模板扩散过程


在针对低同源性孤儿蛋白的预测任务中,TDFold在Orphan与Orphan25两个数据集上均显著优于现有对比方法。以2DCO_A和6XN9_A为例,传统方法检索到的模板与天然结构差异显著,而TDFold所生成的残基间距离矩阵与天然结构高度吻合,充分说明孤儿蛋白的生成几何模板质量远超搜索模板(图 2)。在同源性丰富的通用蛋白预测任务中,TDFold同样展现出卓越性能。在国际公认的CASP数据集上,采用单序列预测模式的TDFold取得了最优结果。以T1046s2-D1与T1106s2-D1为例,其生成的残基间距离图像与天然结构及搜索模板均保持高度一致,进一步验证了模型在通用蛋白场景下生成可靠几何信息的能力(图3)。上述结果表明,TDFold所构建的视觉生成模型能够有效学习蛋白质二维几何模板的数据分布,并依据氨基酸序列提示完成扩散生成,充分验证了将视觉扩散模型迁移至该技术范式的有效性与潜力。


北京师范大学人工智能学院教授崔振团队在《自然-机器智能》发文:提出面向蛋白质结构预测的二维视觉扩散学习范式

 图2:TDFold在孤儿蛋白的二维几何模板生成和三维结构预测性能达到最优水平


北京师范大学人工智能学院教授崔振团队在《自然-机器智能》发文:提出面向蛋白质结构预测的二维视觉扩散学习范式

图3:TDFold在通用蛋白的二维几何模板生成和三维结构的单序列预测性能达到最优水平


许多快速演化的病毒蛋白(如冠状病毒的非结构蛋白及辅助蛋白)毒株间序列同源性常低于20%,以逃避免疫应答并实现宿主适应性进化。这类蛋白在病毒致病中至关重要,但极低同源性给结构预测带来巨大挑战。本研究在CASP14–16病毒靶标(如SARS-CoV-2 ORF8辅助蛋白T1064,同源序列不足20)上测试发现,TDFold显著优于AlphaFold2、AlphaFold3及ESMFold,展现了同源信息匮乏下病毒结构预测的优越能力,对理解免疫逃逸机制及药物研发具有重要价值(表1)。


表1:TDFold在快速进化的病毒蛋白的三维结构预测均优于对比方法

北京师范大学人工智能学院教授崔振团队在《自然-机器智能》发文:提出面向蛋白质结构预测的二维视觉扩散学习范式 


在计算效率方面,TDFold展现出显著优势。以长度为500的蛋白质为例,TDFold推理仅需约10秒,相比耗时超1000秒的AlphaFold2/RoseTTAFold实现100倍加速,相比ESMFold(约100秒)也有10倍提升。显存占用方面,TDFold仅需约7GB,约为ESMFold(20GB)的30%。更关键的是,TDFold的资源消耗几乎不随序列长度增加而增长(长度从100增至500时,时间增幅<10%,显存增幅仅40%),而对比方法通常呈o(n³)增长。这些特性充分证明了tdfold在计算效率上的卓越优势(图4)。


北京师范大学人工智能学院教授崔振团队在《自然-机器智能》发文:提出面向蛋白质结构预测的二维视觉扩散学习范式 

图4:TDFold在预测长序列蛋白质(=500氨基酸)的推理效率远优于对比方法


综上,本研究提出了一种基于二维几何模板扩散的蛋白质结构预测框架——TDFold。该框架能够从蛋白质序列提示中高效生成可靠的残基间几何信息,并利用序列与所生成的几何特征进行结构预测,从而省去了耗时的同源搜索步骤。TDFold对同源信息匮乏的序列(如孤儿蛋白、快速演化的病毒蛋白等)表现出较强的鲁棒性。该方法可在配备单张NVIDIA 4090(24GB)显卡计算机上完成高效训练与推理。其推理时间上的显著优势,使其尤其适用于高吞吐量的大规模预测任务。


北京师范大学人工智能学院教授崔振是独立通讯作者,南京理工大学计算机学院博士生王旭东和副教授张桐是该论文的共同第一作者。该工作得到了国家自然科学基金和中央高校基金的支持。


版权声明:
文章来源北京师范大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

第五届能源、电力与电气国际学术会议(ICEPET 2026)(2026-04-24)

数字化教育系统与计算机科学国际学术会议(2026-04-24)

2026年多尺度人工智能国际会议(MAI 2026)(2026-04-24)

第三届机器学习与智能计算国际学术会议(MLIC 2026)(2026-04-24)

2026 空天信息与产业创新国际学术研讨会暨第二届中国——塞尔维亚空天技术与产业应用研讨会(ISA3I 2026)(2026-04-24)

第五届智能系统、通信与计算机网络国际学术会议(ISCCN 2026)(2026-04-24)

第四届语言与文化传播国际学术会议(ICLCC 2026)(2026-04-24)

2026冶金工程、桥隧建设与土木工程国际会议(MEBTCCE 2026)(2026-04-30)

第四届绿色建筑国际会议(ICOGB 2026)(2026-05-08)

2026年先进航空航天技术与卫星应用国际学术会议 (AATSA 2026)(2026-05-15)

2026年文化传播、艺术与新媒体国际会议(CCANM 2026)(2026-5-31)

2026年传感器、机电系统与自动化国际会议(ICSESA 2026)(2026-4-28)

2026公共管理、数字经济与互联网技术国际学术会议(IACPMDEIT 2026)(2026-4-28)

2026年人工智能、机器学习与多模态国际学术会议(AIMLM 2026)(2026-7-24)

2026年数字经济、金融科技与风险管理国际会议(IDEFTR 2026)(2026-5-30)

2026年信息光学与通信网络国际学术会议(ICIOCN 2026)(2026-4-27)

2026年教育研究,哲学与人文科学国际会议(ICERPH 2026)(2026-5-28)

2026年大数据、数理统计与计算科学国际学术会议(BDMSCS 2026)(2026-5-30)

2026年智慧城市与未来交通创新国际会议(ICSCFTI 2026)(2026-4-25)

2026机械工程、工程材料与自动化国际会议(MEEMA 2026)(2026-4-25)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。