北京大学生命科学学院张蔚课题组和合作者开发基于深度学习的基因渐渗推断方法
2024/04/07
解决分类群之间的演化关系是演化生物学的基本任务之一。在大数据时代,随着测序技术和分析方法的发展,多项研究发现类群之间的杂交和基因渐渗可能强烈地影响了生命之树,并在物种形成和适应过程中起到重要作用。然而,现有基因渐渗检测方法仍具有一定局限性,如依赖大样本量、受限的系统发育关系或精确的种群演化历史等。因此,在基因流广泛存在的背景下,评估物种之间的复杂关系仍具挑战。同时,基于深度学习的算法已迅速成为处理统计应用的有效替代方法,特别是与大数据集有关的应用。目前已有涉及基因渐渗推断的基于深度学习的相关方法的应用报道,但多是针对具体分类群的初步尝试,其一般适用性和可推广性受到限制。
6月1日,北京大学生命科学学院、蛋白质与植物基因研究国家重点实验室、北大-清华生命科学联合中心张蔚研究员课题组在Systematic Biology杂志在线发表题为“Inferring historical introgression with deep learning”的研究论文,提出一种基于深度学习算法检测基因渐渗的方法ERICA。该方法基于基因组序列信息,通过识别拓扑结构不一致鉴定基因组内的渐渗区域。该方法能够有效地在模拟数据和多种动植物分类群的真实基因组数据中检测渐渗信号,为利用基因组数据评估类群之间的演化关系提供了一种具有一般适用性的新方法,有助于推动杂交和基因渐渗相关的演化研究。
研究构建了处理序列比对数据的卷积神经网络模型,以定量评估类群之间的演化关系,并通过识别特定基因流对应的拓扑结构推断渐渗区域(图1)。研究首先利用模拟数据集对神经网络进行训练和评估,并与其他广泛使用的基因渐渗检测方法进行对比。评估结果显示,神经网络模型能够有效地检测渐渗特别是适应性渐渗信号,且具有较好的泛化能力(图2)。

图1 ERICA方法设计原则和神经网络结构

图2 ERICA方法准确率评估
此外,研究者使用ERICA方法分析了适应性辐射类群袖蝶属(Heliconius)的群体基因组数据,并鉴定获得了已知的翅图案模式相关渐渗位点,表明ERICA方法能够在真实数据中检测到适应性渐渗信号,且具有较传统方法更小的随机误差。
研究者展示了ERICA方法的一个应用实例,通过将该方法应用于稻属(Oryza)基因组比对及泛基因组数据分析,获得了粳稻和籼稻之间以及从野生稻(O. rufipogon)到籼稻的渐渗位点,其中包括多个与水稻驯化性状相关的受选择区域,支持基因流在籼稻驯化过程中起到重要作用(图3)。研究发现,籼稻和野生稻(O. nivara)与热带粳稻之间存在基因流,且渐渗基因可能与热带粳稻对热带环境的适应与抗逆性有关。

图3 稻属物种基因组渐渗模式
综上所述,该研究开发了一种新的基因渐渗检测方法,其能够高效处理基因组序列数据,准确推断局部的渐渗信号,有助于深入理解类群之间的复杂演化历史,以及基因渐渗在物种适应中发挥的作用。值得一提的是,为满足研究人员的广泛要求,该方法包括一个在线提交门户和一个本地版本的工具包。因此,该研究不仅提供了一种先进的基因渐渗研究方法,并且给出了完整的研究解决方案,展示了其解决多个系统中实际问题的能力。
张蔚和北京脑科学与类脑研究中心张力研究员为本文共同通讯作者;北大-清华生命科学联合中心博士生张宇博、北京脑科学与类脑研究中心工程师朱庆杰为本文共同第一作者;北京脑科学与类脑研究中心工程师邵毅、北大-清华生命科学联合中心博士生姜焱晨和华中农业大学生命科学技术学院欧阳亦聃教授对本研究作出重要贡献。该项目得到国家自然科学基金、北京市自然科学基金、北大-清华生命科学联合中心、蛋白质与植物基因研究国家重点实验室等资助。
文章来源北京大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年4月高录用检索快国际学术会 32
-
2026年第六届计算机、控制和机器人 102
-
2026资源、化学化工与应用材料国际 1529
-
2026年人工智能教育技术与数据科学 535
-
2026年图像处理与数字创意设计国际 1294
-
2026年机械工程,新能源与电气技术 5759
-
2026年材料科学、低碳技术与动力工 1546
-
2026年第二届无线与光通信国际会议 2307
-
2026年增材制造、3D打印与创新设 03-13
-
2026年车辆工程与新能源汽车国际会 03-13
-
2026年精密机械、仪器仪表与传感技 03-13
-
2026年机器人技术、智能装备与自动 03-13
-
2026年通信系统、网络与信号处理国 03-13
-
2026年智能制造、工业互联网与数字 03-13
-
2026年环境治理、生态修复与碳中和 03-13
-
2026年中科院期刊分区表(新锐10
-
2025年两院院士增选有效候选人4281
-
2025最新JCR分区及影响因子11266
-
好学术:科研网址导航|学术头条分5427
-
2025年国际期刊预警名单发布!5541
-
2025年中科院期刊分区表重磅发18728
-
中国科协《重要学术会议目录(2011157
-
吉林大学校长张希:学术会议中的提6696
-
中国科大研制出机器人灵巧手指尖六03-11
-
研究揭示遗传多样性如何重塑微生物03-11
-
研究发现双酰胺类杀虫剂影响蜜蜂蜂03-11
-
研究揭示聚焦光场中内禀自旋纹理03-11
-
新型磁流体机器人破解临床难题03-11
-
南京大学物理学院温锦生课题组在亚03-11
-
南京大学物理学院高力波、袁国文团03-11
-
敦煌国际旅行社 18349

-
中国科学院沈阳自动化研究所 18267

-
兰州大学资源环境学院 21434

-
中华中医药学会 21321

-
住房和城乡建设部干部学院 21258

-
中国交通企业管理协会 23345

-
北京九盈科泰科技有限公司 8244

-
qs 24248

-
鸿与智工业传媒集团 24305

-
艾美达(北京)医药信息咨询有限公 8173

-
河南纳智博研会议服务有限公司 24258

-
湖北研学文化发展有限公司 8225

-
黑鹰cosmos 18302

-
中国市政工程协会 18356

-
天津市塘沽区土地中心 18151

-
南京大学地球科学与工程学院 24483

-
HKISAR 24455

-
北京市清华大学 23357

-
中国航空一集团 18190

-
成夏 23357

















799













































