当前位置:首页 >> 学术资讯 >> 科研信息

北京大学-清华大学生命科学联合中心来鲁华课题组及其合作者研究出多层级的图神经网络推动蛋白质功能预测的发展

2024/03/29

高通量测序的进展推动了蛋白质序列数量的快速增长。尽管如此,由于实验研究需要较长的周期并且费用昂贵,大部分蛋白质序列缺乏功能注释。因此,具备自动而准确推断蛋白质功能的计算方法变得至关重要。

深度学习的进展推动了各种蛋白质功能预测模型的发展。蛋白质的三维结构与功能密切相关,然而,结构相似的蛋白质可能具有高度多样的序列。仅仰赖基于序列的模型(如1D CNN或Transformer)可能难以捕捉到长程的功能位点规律。随着蛋白质结构预测研究的突破性进展,获取蛋白质接触图或三维结构的方法变得更加容易。这为图神经网络(GNN)提供了更多优势,它可以编码蛋白质的三维结构信息以预测其功能。然而,目前的GNN模型仍然面临过度平滑的问题,而且简单的池化方法难以准确突显重要的残基节点贡献。

北京大学化学与分子工程学院、定量生物学中心、北京大学-清华大学生命科学联合中心来鲁华课题组与北京大学数学科学学院、定量生物学中心邓明华课题组合作发展了一种新的蛋白质功能预测模型:HEAL(Hierarchical graph transformEr with contrAstive Learning)。HEAL利用Hierarchical Graph Transformer(HGT)来学习蛋白质的结构信息。该方法通过引入模仿功能motif的超节点,与蛋白质图中的残基节点进行交互,并通过池化操作生成蛋白质图的嵌入表示。为了增强网络的表达能力,HEAL还引入了图对比学习,以最大化不同视图之间的相似性。此外,HEAL模型还利用AlphaFold2预测蛋白质结构的功能信息,以提升在实际应用场景中的性能表现。

 HEAL模型对蛋白质的建图方式及网络架构

HEAL模型在被广泛使用的PDBch测试集上展现出了卓越的性能,不仅超越了传统的基于序列比对的方法(Blast和FunFams),还超越了基于序列特征的1D CNN深度学习模型DeepGO和基于结构特征的GNN模型DeepFRI。为了测试模型在缺乏实验解析结构与已标注同源序列的更真实场景下的应用,研究者构建了更具挑战性的AFch测试集,并将HEAL模型与前述的DeepFRI、以及结合同源序列比对和1D CNN序列模型的DeepGOPlus进行了比较。研究结果表明,在这个更具挑战性的应用场景下,HEAL模型显示出了更大的潜力和优势。

相关工作近日发表在Bioinformatics上,北京大学北大-清华生命科学联合中心博士研究生顾仲晖与北京大学数学科学学院罗霄博士为共同第一作者。北京大学定量生物学中心的博士研究生陈佳晓对于该工作的完成做出了重要贡献。文章的通讯作者为北京大学化学与分子工程学院、定量生物学中心、北京大学-清华大学生命科学联合中心来鲁华教授和北京大学数学科学学院、定量生物学中心邓明华教授。该研究得到了国家重点研发计划、国家自然科学基金、中国医学科学院创新单元、北京分子科学国家研究中心和北大-清华生命科学联合中心的资助。


版权声明:
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年智慧教育与数据挖掘国际学术会议(SEDM 2026)(2026-06-27)

2026仪器仪表、先进材料与智能制造国际会议(ICIAMIM 2026)(2026-07-02)

2026年第五届机器学习、云计算与智能挖掘国际会议(2026-07-10)

2026年IEEE第三届先进机器人, 自动化工程与机器学习国际会议(ARAEML 2026)(2026-07-24)

第六届互联网技术与教育信息化国际学术会议 (ITEI 2026)(2026-07-24)

第五届航空航天工程与系统国际研讨会(ISAES 2026)(2026-07-24)

第十届教育、管理与社会科学国际学术会议 (ISEMSS 2026)(2026-07-24)

第六届电气工程与机电一体化技术国际学术会议(ICEEMT 2026)(2026-07-24)

第五届能源与电力系统国际学术会议 (ICEEPS 2026)(2026-07-24)

第九届声学、振动、噪声控制国际研讨会(CAVNC 2026)(2026-08-07)

2026年电力系统、人工智能与能源互联网国际会议(PSAIEI 2026)(2026-7-13)

2026年船舶制造、动力机械与电机系统国际会议(ICPME 2026)(2026-8-18)

2026年预防医学、食品营养与生命健康国际学术会议(PMFNLH 2026)(2026-7-16)

2026年国防科技、国家治理与信息安全国际学术会议(DTNGIS 2026)(2026-6-29)

2026年工程力学与结构工程国际会议(EMSE 2026)(2026-7-27)

第七届生物医用材料国际研讨会 (ICBM 2026)(2026-8-7)

2026年智能交通技术、物流与供应链管理国际会议(ITLSM 2026)(2026-7-24)

2026年地质学、地球化学与资源勘查国际会议(ICGGRE 2026)(2026-7-24)

2026年航空航天、能源工程与低空运输国际会议(AEELAT 2026)(2026-8-20)

第十届计算机科学与智能控制国际会议(2026-9-25)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区