北京大学-清华大学生命科学联合中心来鲁华课题组及其合作者研究出多层级的图神经网络推动蛋白质功能预测的发展
2024/03/29
高通量测序的进展推动了蛋白质序列数量的快速增长。尽管如此,由于实验研究需要较长的周期并且费用昂贵,大部分蛋白质序列缺乏功能注释。因此,具备自动而准确推断蛋白质功能的计算方法变得至关重要。
深度学习的进展推动了各种蛋白质功能预测模型的发展。蛋白质的三维结构与功能密切相关,然而,结构相似的蛋白质可能具有高度多样的序列。仅仰赖基于序列的模型(如1D CNN或Transformer)可能难以捕捉到长程的功能位点规律。随着蛋白质结构预测研究的突破性进展,获取蛋白质接触图或三维结构的方法变得更加容易。这为图神经网络(GNN)提供了更多优势,它可以编码蛋白质的三维结构信息以预测其功能。然而,目前的GNN模型仍然面临过度平滑的问题,而且简单的池化方法难以准确突显重要的残基节点贡献。
北京大学化学与分子工程学院、定量生物学中心、北京大学-清华大学生命科学联合中心来鲁华课题组与北京大学数学科学学院、定量生物学中心邓明华课题组合作发展了一种新的蛋白质功能预测模型:HEAL(Hierarchical graph transformEr with contrAstive Learning)。HEAL利用Hierarchical Graph Transformer(HGT)来学习蛋白质的结构信息。该方法通过引入模仿功能motif的超节点,与蛋白质图中的残基节点进行交互,并通过池化操作生成蛋白质图的嵌入表示。为了增强网络的表达能力,HEAL还引入了图对比学习,以最大化不同视图之间的相似性。此外,HEAL模型还利用AlphaFold2预测蛋白质结构的功能信息,以提升在实际应用场景中的性能表现。

HEAL模型对蛋白质的建图方式及网络架构
HEAL模型在被广泛使用的PDBch测试集上展现出了卓越的性能,不仅超越了传统的基于序列比对的方法(Blast和FunFams),还超越了基于序列特征的1D CNN深度学习模型DeepGO和基于结构特征的GNN模型DeepFRI。为了测试模型在缺乏实验解析结构与已标注同源序列的更真实场景下的应用,研究者构建了更具挑战性的AFch测试集,并将HEAL模型与前述的DeepFRI、以及结合同源序列比对和1D CNN序列模型的DeepGOPlus进行了比较。研究结果表明,在这个更具挑战性的应用场景下,HEAL模型显示出了更大的潜力和优势。
相关工作近日发表在Bioinformatics上,北京大学北大-清华生命科学联合中心博士研究生顾仲晖与北京大学数学科学学院罗霄博士为共同第一作者。北京大学定量生物学中心的博士研究生陈佳晓对于该工作的完成做出了重要贡献。文章的通讯作者为北京大学化学与分子工程学院、定量生物学中心、北京大学-清华大学生命科学联合中心来鲁华教授和北京大学数学科学学院、定量生物学中心邓明华教授。该研究得到了国家重点研发计划、国家自然科学基金、中国医学科学院创新单元、北京分子科学国家研究中心和北大-清华生命科学联合中心的资助。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年6月优质国际学术会议推荐 7
-
2026年第17届机械与航空航天工程 193
-
2026年先进航空航天技术与卫星应用 324
-
2026资源、化学化工与应用材料国际 1808
-
2026年图像处理与数字创意设计国际 1632
-
2026年机械工程,新能源与电气技术 6095
-
2026年材料科学、低碳技术与动力工 1819
-
2026年艺术、文化产业与数字媒体国 04-29
-
2026年智慧教育、教育研究与文化交 04-29
-
2026年数字社会、公共管理与经济学 04-29
-
2026 政务服务、数字治理与智慧城 04-28
-
2026 制冷技术、暖通设备与环境调 04-28
-
2026 轻工材料、绿色制造与循环利 04-28
-
2026 多语言智能、翻译技术与国际 04-28
-
2026 生物育种、生态种植与现代农 04-28
-
中国科协发布2025年《重要学术12
-
2026年新锐分区(原中科院期刊2595
-
2025年两院院士增选有效候选人4402
-
2025最新JCR分区及影响因子12342
-
好学术:科研网址导航|学术头条分5673
-
2025年国际期刊预警名单发布!5837
-
2025年中科院期刊分区表重磅发20812
-
吉林大学校长张希:学术会议中的提6954
-
二维超导迈斯纳效应探测研究获进展04-29
-
研究发现笼目超导体中多重范霍夫奇04-29
-
二氧化碳加氢制高碳烯烃与航煤馏分04-29
-
靶向特定蛋白互作界面抑制乙肝病毒04-29
-
研究揭示内源信使调控膜损伤与细胞04-29
-
科学家绘制大脑星形胶质细胞转录因04-29
-
上海交大Bio-X研究院石毅与合04-29
-
宁波卓亨会展有限公司 18242

-
cocoteacongress 23409

-
杭州第一世界大酒店 23358

-
清华大学经管学院 2454

-
政协办公室联络科 18273

-
百奥泰国际会议(大连)有限公司 21180

-
湖南大学 21423

-
江苏省岩土力学与工程学会 18838

-
中国医药教育协会 2233

-
黑龙江省齐齐哈尔 18279

-
第四军医大学组织工程研发中心 18708

-
2010中国城市建设峰会 18332

-
宝安中旅大厦 21508

-
中国化工信息中心 2485

-
山东大学经济研究院 21412

-
同济大学地下系 18376

-
IAASE 8280

-
社会科学与高等教育国际会议 2601

-
西安交通大学核科学与技术学院 24384

-
中国水利教育协会 2374





















891






































