当前位置:首页 >> 学术资讯 >> 科研信息

北京大学-清华大学生命科学联合中心来鲁华课题组及其合作者研究出多层级的图神经网络推动蛋白质功能预测的发展

2024/03/29

高通量测序的进展推动了蛋白质序列数量的快速增长。尽管如此,由于实验研究需要较长的周期并且费用昂贵,大部分蛋白质序列缺乏功能注释。因此,具备自动而准确推断蛋白质功能的计算方法变得至关重要。

深度学习的进展推动了各种蛋白质功能预测模型的发展。蛋白质的三维结构与功能密切相关,然而,结构相似的蛋白质可能具有高度多样的序列。仅仰赖基于序列的模型(如1D CNN或Transformer)可能难以捕捉到长程的功能位点规律。随着蛋白质结构预测研究的突破性进展,获取蛋白质接触图或三维结构的方法变得更加容易。这为图神经网络(GNN)提供了更多优势,它可以编码蛋白质的三维结构信息以预测其功能。然而,目前的GNN模型仍然面临过度平滑的问题,而且简单的池化方法难以准确突显重要的残基节点贡献。

北京大学化学与分子工程学院、定量生物学中心、北京大学-清华大学生命科学联合中心来鲁华课题组与北京大学数学科学学院、定量生物学中心邓明华课题组合作发展了一种新的蛋白质功能预测模型:HEAL(Hierarchical graph transformEr with contrAstive Learning)。HEAL利用Hierarchical Graph Transformer(HGT)来学习蛋白质的结构信息。该方法通过引入模仿功能motif的超节点,与蛋白质图中的残基节点进行交互,并通过池化操作生成蛋白质图的嵌入表示。为了增强网络的表达能力,HEAL还引入了图对比学习,以最大化不同视图之间的相似性。此外,HEAL模型还利用AlphaFold2预测蛋白质结构的功能信息,以提升在实际应用场景中的性能表现。

 HEAL模型对蛋白质的建图方式及网络架构

HEAL模型在被广泛使用的PDBch测试集上展现出了卓越的性能,不仅超越了传统的基于序列比对的方法(Blast和FunFams),还超越了基于序列特征的1D CNN深度学习模型DeepGO和基于结构特征的GNN模型DeepFRI。为了测试模型在缺乏实验解析结构与已标注同源序列的更真实场景下的应用,研究者构建了更具挑战性的AFch测试集,并将HEAL模型与前述的DeepFRI、以及结合同源序列比对和1D CNN序列模型的DeepGOPlus进行了比较。研究结果表明,在这个更具挑战性的应用场景下,HEAL模型显示出了更大的潜力和优势。

相关工作近日发表在Bioinformatics上,北京大学北大-清华生命科学联合中心博士研究生顾仲晖与北京大学数学科学学院罗霄博士为共同第一作者。北京大学定量生物学中心的博士研究生陈佳晓对于该工作的完成做出了重要贡献。文章的通讯作者为北京大学化学与分子工程学院、定量生物学中心、北京大学-清华大学生命科学联合中心来鲁华教授和北京大学数学科学学院、定量生物学中心邓明华教授。该研究得到了国家重点研发计划、国家自然科学基金、中国医学科学院创新单元、北京分子科学国家研究中心和北大-清华生命科学联合中心的资助。


版权声明:
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2025艺术、服装设计与纺织科学国际会议(FDTS 2025)(2025-07-26)

第八届声学、振动、噪声控制国际研讨会(CAVNC 2025)(2025-08-09)

2025年矿山工程、地质工程与环境工程国际会议(ICMEGEEE 2025)(2025-08-10)

标准化、信息化、智能化(AI)赋能科技成果评估转化与高价值专利布局高级研修班(8月青岛)(2025-08-13)

第六届清洁能源与电力工程国际学术会议(ICCEPE 2025)(2025-08-15)

2025年可信大数据与人工智能国际会议(ICTBAI2025)(2025-08-21)

2025年第三届智能制造与自动化前沿国际会议(CFIMA 2025)(2025-08-22)

第六届物联网、人工智能与机械自动化国际学术会议 (IoTAIMA 2025)(2025-08-22)

第五届测量控制与仪器仪表国际学术会议(MCAI 2025)(2025-08-22)

第十届工程机械与车辆工程新进展国际学术会议(ICACMVE 2025)(2025-08-22)

2025年人工智能与虚拟现实技术国际会议(ICAIVRT 2025)(2025-9-26)

2025年计算机视觉、工业设计与人工智能国际会议(CVIDA 2025)(2025-9-11)

2025年电子器件、机械工程与应用国际会议(IEDMEA 2025)(2025-9-24)

2025电子信息技术、计算技术前沿与智能信息处理国际会议(TCTIIP 2025)(2025-9-25)

2025土木工程、水利工程与交通运输国际会议(ICCEHET 2025)(2025-8-12)

2025年电力、材料与能源交互国际会议(EMEI 2025)(2025-8-12)

2025年应用数学、计算模拟与物理学国际会议(IAMCP 2025)(2025-9-10)

2025年循环经济、资源利用国际会议(ICCERU 2025)(2025-9-26)

2025年公共卫生、智能医疗与数据科学国际会议(PHIHDS 2025)(2025-8-19)

2025年冶金工程与新能源材料国际会议(ICMENEM 2025)(2025-9-16)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。