当前位置:首页 >> 学术资讯 >> 科研信息

高歌课题组提出基因丢失鉴定新方法

2024/04/07

作为细胞中基本的功能单位,蛋白编码基因(Protein-coding genes,以下简称基因)可以通过转录-翻译过程指导合成对于生命活动至关重要的蛋白质,进而影响生命体的生理/病理性状。因此,基因的演化与生物体的表型演化息息相关,是介导物种特异性表型及其环境适应的重要动力之一。在演化过程中生物体可以获得新的基因来执行新的功能;因此,自上世纪后期至今,新基因(Gene Birth)已成为相关领域的研究热点。另一方面,万物皆有生有灭,与不断涌现的新基因相对,现有的蛋白编码基因也可能因突变等失去原有的功能并进而从基因组中丢失。然而,受限于可用数据等多方面因素,对基因丢失(Gene Loss)及其影响长期以来尚缺乏系统研究。

近日,北京大学生物医学前沿创新中心(BIOPIC)、北京未来基因诊断高精尖创新中心(ICG)、北京大学生命科学学院生物信息中心(CBI)、蛋白质与植物基因研究国家重点实验室高歌课题组在期刊Molecular Biology and Evolution上发表了题为“Genome-wide identification of gene loss events suggests loss relics as a potential source of functional lncRNAs in humans”的生物信息学论文,在前期工作基础上提出了新的基因丢失鉴定方法LOST&FOUND,并基于该方法对人类中的基因丢失及其影响进行了系统解析。

为精准鉴定基因丢失事件,高歌团队提出了新的基因丢失鉴定方法LOST&FOUNDLOST&FOUND的具体处理流程如图1所示。LOST&FOUND结合了全基因组比对以及多物种中的直系同源基因数据,并运用最大简约法等处理方法来对基因丢失进行鉴定识别。基于多物种直系同源基因关系的推断可使LOST&FOUND避免将参考物种中的基因获得事件错误识别为待研究物种中的基因丢失事件。而全基因组比对的使用则可充分考虑基因及其上下游区段的同源性,有利于LOST&FOUND识别由大片段删除等方式造成的基因丢失事件。

图1

基于该方法,团队在人类基因组中共鉴定到155个基因丢失事件。其中,有88个基因丢失事件在人类基因组内含有同源区段残骸(relics)。有趣的是,通过将基因丢失残骸与长非编码RNA区段进行比较,团队发现,在人类基因组中,有33个基因丢失事件的发生与长非编码RNA的起源相关,并将该部分通过基因丢失起源的长非编码RNA命名为derived lncRNA(图2 A-B)。

图2

综合多方面的注释,团队发现,derived lncRNA与其它长非编码RNA不同,其往往有着更高的表达量、更低的组织表达特异性、更长的转录本结构以及更强的序列保守性(图3 A-F)。基于GWAS、共表达、已有实验检索等功能性分析的结果则表明,这部分derived lncRNA与生长发育、免疫、生殖以及抑癌作用等过程的调控均有关系。同时,超过一半的derived lncRNA均受到了正选择的作用。

图3

高歌团队开发了新的基因丢失鉴定方法并通过该方法系统性研究了人类基因组中基因丢失的发生与影响。值得注意的是,高歌团队在人类基因组中发现了33个基因丢失事件与长非编码RNA的起源相关,且这部分长非编码RNA可能具有重要功能。结合前期已发表工作1-3,这些结果提示在多个物种中,演化过程中古老的蛋白编码基因有可能“再生”为新的长非编码RNA来发挥作用,在基因生-死、编码-非编码等看似对立的概念之间建立起了有趣的联系。

高歌的博士生温正扬为该论文第一作者,高歌为该论文通讯作者。该研究得到了蛋白质与植物基因研究国家重点实验室、北京未来基因诊断高精尖创新中心等的资助。计算分析工作于北京大学高性能计算校级公共平台和北京大学太平洋高性能计算平台完成。

参考文献:

1 Duret, L., Chureau, C., Samain, S., Weissenbach, J. & Avner, P. The Xist RNA gene evolved in eutherians by pseudogenization of a protein-coding gene. Science312, 1653-1655 (2006). 

2 Zhao, Y. et al. Identification and analysis of unitary loss of long-established protein-coding genes in Poaceae shows evidences for biased gene loss and putatively functional transcription of relics. BMC Evol Biol15, 66 (2015). 

3 Hezroni, H. et al. A subset of conserved mammalian long non-coding RNAs are fossils of ancestral protein-coding genes. Genome Biol.18, 162 (2017). 



版权声明:
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年智慧交通与检测技术国际会议(ITDT 2026)(2026-03-25)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-03-27)

2026年人工智能教育技术与数据科学国际学术会议(AIETDS 2026)(2026-03-27)

2026年IEEE第八届软件工程和计算机科学国际会议(CSECS 2026)(2026-04-17)

第十五届春季国际工程与技术大会 (SCET 2026)(2026-04-17)

2026年金融科技、创新与信息技术国际会议(2026-04-18)

2026年多尺度人工智能国际会议(MAI 2026)(2026-04-24)

第三届机器学习与智能计算国际学术会议(MLIC 2026)(2026-04-24)

2026 空天信息与产业创新国际学术研讨会暨第二届中国——塞尔维亚空天技术与产业应用研讨会(ISA3I 2026)(2026-04-24)

数字化教育系统与计算机科学国际学术会议(2026-04-24)

2026年计算机应用、大数据与通信软件国际会议(CABDCS 2026)(2026-3-30)

2026年防灾减灾、结构抗震与建筑国际会议(DPRSA 2026)(2026-4-27)

2026哲学、科学教育与文化传播国际会议(ICPSECC 2026)(2026-4-30)

2026年通讯技术与计算机信息国际会议(ICCTCI 2026)(2026-4-27)

2026经济体系、管理心理与工商管理国际会议(ESMPBM 2026)(2026-4-27)

2026年深度学习,区块链与机器学习国际会议(DLBML 2026)(2026-3-28)

2026年材料化学与能源科学国际会议(ICESMC 2026)(2026-5-27)

2026年经济发展、管理应用与商业智能国际会议(IEDMB 2026)(2026-3-27)

2026年食品科学,生物学与农业发展国际会议(FSBAD 2026)(2026-3-27)

2026 社会学、管理学与金融经济国际会议(SMFE 2026)(2026-3-29)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

学术科研网址导航,430+站,定制学术书签

2026年第五届云计算、计算机视觉和图像处理.

2026年动力学与机械工程国际学术研讨会 (.

2026年IEEE第八届软件工程和计算机科学.

2026年第八届计算机图形学、图像与可视化国.

第八届信息科学、电气与自动化工程国际学术会议.

第三届机器学习与智能计算国际学术会议(MLI.

第六届自动化控制、算法与智能仿生国际学术会议.

2026 年第三届计算,机器学习与数据科学国.

第十三届先进制造技术与材料工程国际学术会议 .

第二届人工智能与产品设计国际学术会议 (AI.

2026年多尺度人工智能国际会议(MAI 2.

2026年量子计算与人工智能国际学术会议(I.

2026年第六届计算机视觉与模式分析国际学术.

第七届机械仪表与自动化国际学术会议(ICMI.

2026年第四届亚洲机器学习、算法与神经网络.

2026年第四届亚洲计算机视觉、图像处理与模.

2026年人工智能与数据挖掘国际学术会议(A.

2026年IEEE第七届计算,网络与物联网国.

2026年第五届网络、通信与信息技术国际会议.

2026年智能机器人与控制技术国际会议(CI.

2026年传感器技术、自动化与智能制造国际会.

2026年智能系统与计算国际会议 (ICIS.

2026年电子, 通信与计算机科学国际会议 .

2026年IEEE第三届先进机器人, 自动化.

2026年第七届控制, 机器人与智能系统国际.