北京大学-清华大学生命科学联合中心来鲁华课题组及其合作者研究出多层级的图神经网络推动蛋白质功能预测的发展
2024/03/29
高通量测序的进展推动了蛋白质序列数量的快速增长。尽管如此,由于实验研究需要较长的周期并且费用昂贵,大部分蛋白质序列缺乏功能注释。因此,具备自动而准确推断蛋白质功能的计算方法变得至关重要。
深度学习的进展推动了各种蛋白质功能预测模型的发展。蛋白质的三维结构与功能密切相关,然而,结构相似的蛋白质可能具有高度多样的序列。仅仰赖基于序列的模型(如1D CNN或Transformer)可能难以捕捉到长程的功能位点规律。随着蛋白质结构预测研究的突破性进展,获取蛋白质接触图或三维结构的方法变得更加容易。这为图神经网络(GNN)提供了更多优势,它可以编码蛋白质的三维结构信息以预测其功能。然而,目前的GNN模型仍然面临过度平滑的问题,而且简单的池化方法难以准确突显重要的残基节点贡献。
北京大学化学与分子工程学院、定量生物学中心、北京大学-清华大学生命科学联合中心来鲁华课题组与北京大学数学科学学院、定量生物学中心邓明华课题组合作发展了一种新的蛋白质功能预测模型:HEAL(Hierarchical graph transformEr with contrAstive Learning)。HEAL利用Hierarchical Graph Transformer(HGT)来学习蛋白质的结构信息。该方法通过引入模仿功能motif的超节点,与蛋白质图中的残基节点进行交互,并通过池化操作生成蛋白质图的嵌入表示。为了增强网络的表达能力,HEAL还引入了图对比学习,以最大化不同视图之间的相似性。此外,HEAL模型还利用AlphaFold2预测蛋白质结构的功能信息,以提升在实际应用场景中的性能表现。

HEAL模型对蛋白质的建图方式及网络架构
HEAL模型在被广泛使用的PDBch测试集上展现出了卓越的性能,不仅超越了传统的基于序列比对的方法(Blast和FunFams),还超越了基于序列特征的1D CNN深度学习模型DeepGO和基于结构特征的GNN模型DeepFRI。为了测试模型在缺乏实验解析结构与已标注同源序列的更真实场景下的应用,研究者构建了更具挑战性的AFch测试集,并将HEAL模型与前述的DeepFRI、以及结合同源序列比对和1D CNN序列模型的DeepGOPlus进行了比较。研究结果表明,在这个更具挑战性的应用场景下,HEAL模型显示出了更大的潜力和优势。
相关工作近日发表在Bioinformatics上,北京大学北大-清华生命科学联合中心博士研究生顾仲晖与北京大学数学科学学院罗霄博士为共同第一作者。北京大学定量生物学中心的博士研究生陈佳晓对于该工作的完成做出了重要贡献。文章的通讯作者为北京大学化学与分子工程学院、定量生物学中心、北京大学-清华大学生命科学联合中心来鲁华教授和北京大学数学科学学院、定量生物学中心邓明华教授。该研究得到了国家重点研发计划、国家自然科学基金、中国医学科学院创新单元、北京分子科学国家研究中心和北大-清华生命科学联合中心的资助。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026资源、化学化工与应用材料国际 218
-
2026年智能制造与光学传感技术国际 235
-
2026年2月高录用率国际学术会议列 37
-
2026年第六届土木工程与建筑国际会 841
-
2026年图像处理与数字创意设计国际 90
-
2026年机械工程,新能源与电气技术 4589
-
2026年材料科学、低碳技术与动力工 307
-
2026年第二届无线与光通信国际会议 1149
-
2026 9th Internati 01-15
-
2026年土木工程智能建造与基础设施 01-15
-
2026年环境工程、生态修复与可持续 01-15
-
2026年数字健康、远程医疗与智能诊 01-15
-
2026年金融科技、智能风控与数字资 01-15
-
2026年智慧农业、食品工程与供应链 01-15
-
2026年计算建模、数学与大数据国际 01-15
-
2025年两院院士增选有效候选人2854
-
2025最新JCR分区及影响因子7970
-
好学术:科研网址导航|学术头条分3741
-
2025年国际期刊预警名单发布!3763
-
2025年中科院期刊分区表重磅发13927
-
中国科协《重要学术会议目录(208283
-
吉林大学校长张希:学术会议中的提4800
-
清华大学物理系徐勇、段文晖研究组12-25
-
清华大学-上汽通用五菱汽车人工智12-25
-
参加学术会议学术蝗虫_参加学术会12-25
-
参加学术会议图片_参加学术会议需12-25
-
参加学术会议投稿邮件_参加学术会12-25
-
参加学术会议文学_参加学术会议有12-25
-
参加学术会议文案_参加学术会议文12-25
-
参加学术会议违法_参加学术会议违12-25
-
ASTIRC 2368

-
交通运输部公路科学研究院 2539

-
中国微生物学会 24672

-
上海安泰医院 18145

-
zkppp 8235

-
SG 8373

-
KJYF 8250

-
先進成型技術學會 24206

-
IAASE 8204

-
青海电力科学研究院 18129

-
西安连成行管理有限物业 21180

-
WILL 21223

-
中华口腔医学会 23223

-
IAASE 8251

-
香港机械工程师协会 2248

-
澳門科技大學 2400

-
亚泰RFID技术协会 23419

-
上海光同投资管理有限公司 2348

-
建筑与土木工程国际会议 23249

-
第三届肌肉骨骼系统超声医学学术会 2382

















795












































