研究揭示蛋白高阶特征的适应性趋同演化
2025/09/29
趋同演化是生物演化中的重要现象。长期以来,演化生物学研究致力于探索表型趋同背后的分子适应性演化机制。传统研究方法聚焦于蛋白序列中单个氨基酸位点的趋同变化。但是,越来越多的证据表明,即使没有明确的位点趋同,同源蛋白仍可能通过高阶结构或理化特征的趋同演化实现功能相似性。
近日,中国科学院动物研究所邹征廷团队提出ACEP计算分析框架,利用预训练蛋白语言模型,揭示了蛋白高阶特征在功能适应性趋同演化中的重要作用。
通过在海量蛋白序列数据上进行预训练,蛋白语言模型能够捕捉序列中复杂的上下文信息和高阶特征,将蛋白序列转化为包含这些演化特征的高维嵌入向量 。研究发现,即使在已知不存在位点趋同的案例中,预训练蛋白语言模型生成的嵌入向量仍能反映蛋白高阶特征的相似性,表明高阶特征趋同是蛋白功能趋同的分子基础。
基于这一发现,研究团队设计了ACEP分析流程,其核心包括三个步骤,即计算目标类群同源蛋白嵌入向量的真实距离,通过模拟中性演化过程构建背景距离分布,基于分布对真实距离进行统计检验,判断是否存在显著的高阶特征趋同信号。同时,ACEP在多个已知案例中得到显著结果。
进一步,全基因组筛选显示,ACEP在蝙蝠与齿鲸中识别出数百个具有高阶特征趋同信号的候选基因,功能富集分析显著关联“感官感知”等条目,涵盖已知回声定位基因和多个新候选基因。部分候选基因还得到正选择检验的支持,增强了其发生适应性趋同的可信度。同时,为提升结果的可解释性,团队分析了嵌入向量趋同背后的具体高阶特征。
上述究揭示了蛋白高阶特征趋同适应性演化的机制,展示了人工智能技术在针对复杂的基因型-表型映射进行演化生物学分析时的潜力。
ACEP框架为在全基因组水平系统挖掘基因的复杂适应性趋同模式提供了新工具,代码已通过HuggingFace平台开源。
相关研究成果发表在《美国国家科学院院刊》(PNAS)上。研究工作得到国家自然科学基金和中国科学院战略性先导科技专项等的支持。
ACEP流程示意图以及在回声定位哺乳类中检测出的与“感官感知”相关的候选适应性趋同基因
文章来源【好学术】,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年两院院士增选有效候选人846
-
2025最新JCR分区及影响因子4072
-
好学术:科研网址导航|学术头条分1543
-
2025年国际期刊预警名单发布!1568
-
2025年中科院期刊分区表重磅发5722
-
中国科协《重要学术会议目录(204320
-
吉林大学校长张希:学术会议中的提2454
-
电子科技大学严鹏教授团队在PRL09-29
-
清华大学化工系张强团队合作在固态09-29
-
中山大学肖智勇团队发现月震正在引09-29
-
中山大学马骏:让鼻咽癌患者“活得09-29
-
中山大学张慧东团队发现锂暴露导致09-29
-
中山大学彭福华汤常永邱伟团队揭示09-29
-
中山大学张辉杨念生团队研究揭示巨09-29
-
中山大学谢曦蒋乐伦团队发表磁驱动09-29
-
第十届(2017年)中国金融评论 23972
-
上海天佑公司 23162
-
合肥工业大学图书馆 21265
-
拉萨旭日会议服务有限公司 21082
-
中国兵工学会测试技术专业委员会 23142
-
个人 24050
-
沈阳博思有限公司 18037
-
湖北工程学院 2039
-
上海交通大学安泰经管学院 21205
-
宁波磁性材料应用技术创新中心有限 8128
-
青岛蓝海大饭店(崂山) 21142
-
北京凤凰假期国际旅行社有限公司 1936
-
南开大学商学院 21070
-
上海英致商务咨询有限公司 23070
-
江南大学食品学院 24149
-
中国地质大学 2157
-
重庆风雅会议服务有限公司 23148
-
djfdvn 24079
-
武汉市cse主办 18025
-
上海华东师范大学 18225