王初课题组与苏晓东课题组合作发展蛋白质金属结合位点预测新方法
2024/04/11
近日,北京大学化学与分子工程学院、北大-清华生命科学联合中心、北京大学合成与功能生物分子中心王初教授课题组与北京大学生命科学学院、蛋白质与植物基因研究国家重点实验室、北京大学生物医学前沿创新中心苏晓东教授课题组合作在Nature Chemical Biology杂志上发表了题为“Co-evolution-based prediction of metal-binding sites in proteomes by machine learning”的研究文章。在该工作中,作者开发了一种名为MetalNet的计算方法,基于机器学习和蛋白质共进化信号分析来预测蛋白质中的金属结合位点,为研究金属蛋白质组和金属生物学提供了新的工具。
金属离子具有独特的物理和化学性质,在蛋白质中发挥着稳定结构、物质运输、催化反应和信号传导等重要功能。因此,对蛋白质组中金属结合蛋白以及具体金属结合位点的鉴定有助于加深人们对蛋白质功能的理解和认识。最近,通过从多序列比对中计算得到残基之间的共进化信号并结合机器学习,科学家们可以实现对蛋白质结构和蛋白-蛋白相互作用的精准预测。受此启发,作者探究了共进化信号在蛋白质金属结合位点上的分布情况,并发展了基于共进化信号和机器学习预测蛋白质组中金属结合蛋白和金属结合位点的计算方法。

作者以残基对的氨基酸类型频率矩阵作为输入,将金属结合的半胱氨酸、组氨酸、天冬氨酸和谷氨酸(“CHED”)共进化残基对作为正样本,将非金属结合的CHED共进化残基对作为负样本,用于训练得到预测效果良好的机器学习模型。鉴于金属结合位点通常有多个残基与金属离子配位,作者将机器学习模型预测的残基对组装成残基网络,通过基于图模型的过滤器得到一个相对完整的网络簇,将预测方法的准确度进一步提升。总的来说,该方法只需要将多序列比对衍生的共进化信息作为输入,而不依赖于任何已知的序列或结构基序来进行预测。
作者将该命名为MetalNet的预测方法用于对多个蛋白质组数据集进行预测,在原核物种数据集中预测的潜在金属结合蛋白接近一半可以被同源蛋白中的结构直接支持或从其他蛋白质数据库中获得间接支持。作者还在生化和结构水平上验证了MetalNet预测得到的几个此前未被注释的全新金属结合蛋白,包括一个来自大肠杆菌的蛋白citX中的锌结合位点。最后,作者将MetalNet应用于人剪接体蛋白质组的预测,可以准确预测得到目前已经解析的剪接体蛋白结构中报道的所有已知锌离子结合位点,展示了MetalNet预测真核蛋白金属结合位点的潜力。
王初、苏晓东和王初课题组的刘源副研究员为该论文的共同通讯作者。北京大学化学与分子工程学院2017级博士研究生程瑶、2018届博士毕业生王浩博、北京大学生命科学学院2022届博士毕业生徐华和刘源为该论文的共同第一作者。王初课题组的马斌,陈学敏、曾欣和王相贺等合作者也为该课题作出了贡献。该工作得到了国家自然科学基金委、北京分子科学国家研究中心等的经费支持。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年第五届机器学习、云计算与智 26
-
2026年第二届计算机视觉与机器学习 627
-
2026年6月优质国际学术会议推荐 1157
-
2026年智慧教育与数据挖掘国际学术 813
-
2026年第11届生物医学信号与图像 697
-
2026资源、化学化工与应用材料国际 2559
-
2026年图像处理与数字创意设计国际 2369
-
2026年机械工程,新能源与电气技术 6849
-
2026年材料科学、低碳技术与动力工 2524
-
2026年海洋科学、水利工程与环境管 06-18
-
2026年环境工程、材料科学与循环经 06-18
-
2026年航空动力、流体力学与热物理 06-18
-
2026年地球化学、核物理与地质学国 06-18
-
2026年微机电、物理学与建模仿真国 06-18
-
2026年机械工程、电子技术与自动化 06-18
-
2026 JCR影响因子正式发布272
-
中国科协发布2025年《重要学术858
-
2026年新锐分区(原中科院期刊5648
-
2025年两院院士增选有效候选人5280
-
好学术:科研网址导航|学术头条分6842
-
2025年国际期刊预警名单发布!7028
-
2025年中科院期刊分区表重磅发24788
-
吉林大学校长张希:学术会议中的提8093
-
研究表明太阳耀斑终端激波可作为地06-24
-
研究揭示藻—菌共生体系强化养殖尾06-24
-
双功能手性双核镍催化研究获进展06-24
-
研究发现银河系中心极端环境下大质06-24
-
废塑料升级利用研究取得进展06-24
-
硒太阳能电池研究取得进展06-24
-
南京大学王涛团队首次发现110亿06-24
-
北京化工大学 21373

-
中国能源学会 24444

-
河南省科学院 23761

-
昆明博世会展有限公司 18283

-
中国江苏常州 21348

-
北京师范大学 24420

-
百奥泰国际会议(大连)有限公司 24369

-
北京市华夏中医药发展基金会 2863

-
安徽省蚌埠肿瘤医院 21384

-
中国腐蚀与防护学会 18435

-
杭州第一世界大酒店 23405

-
中国建设银行 18331

-
VFEAVW 2245

-
中国稀土学会 23368

-
WWX 23277

-
深圳市海伦温展览有限公司 21526

-
中国石油大学(北京)煤层气研究中 21573

-
上海聚亿展览服务有限公司 21436

-
北京彬丰文化有限公司 23348

-
武汉纺织大学机械工程与自动化学院 24702





















851









































