中国农业大学动科学院刘剑锋教授团队提出畜禽遗传资源精准鉴定新方法——HITSNP
2025/09/06
近日,我校动物科学技术学院刘剑锋教授团队在国际知名期刊《基因组研究》(Genome Research)上在线发表题为《用于品种多样性评估和血统推断的特征SNP高通量筛选方法》(A high-throughput screening method for selecting feature SNPs to evaluate breed diversity and infer ancestry)原创性研究成果。
我国畜禽种质资源丰富,开展畜禽遗传资源精准鉴定是实现种质资源有效保护和合理利用的重要基础。随着基因组测序技术的快速发展,基于基因组信息的精准鉴定已成为可能。目前品种鉴定中常用的SNP筛选方法(如基于FST等生物信息学指标的方法)在基因芯片数据中应用较多,但对于来源复杂的多品种群体高通量测序数据,这些方法难以将SNP数量有效压缩至实际应用所需的水平。同时,系谱数据缺失也增加了种质资源鉴定的难度。鉴于此,刘剑锋团队研究开发了HITSNP软件用于从高通量数据中筛选具有品种特征的SNP,并基于特征SNP进行品种多样性评估和祖先血统推断。
研究人员开发的HITSNP软件整合了ReliefRR、CCA和MRMR三种特征选择算法,能够从全基因组海量SNP中高效筛选具有品种信息的特征SNP位点。与传统方法相比,其创新性在于同时考虑SNP的品种信息量和冗余度,在不同特征SNP筛选规模下均保持高准确率和稳定性。HITSNP同样包括祖先推断模块,基于机器学习分类器可准确区分纯种与杂种个体,并预测杂种个体的祖先品种来源。
图1 HITSNP软件框架示意图
研究团队通过下载和分析已公开报道的来自全球60个不同猪种的重测序数据集进行新方法性能验证。结果显示HITSNP在不同密度(从60到60,000个特征SNP)的筛选条件下均展现出更高的准确性和稳定性:在仅筛选约60个SNP时仍能保持约0.8的品种鉴定准确率,而传统方法(如选择信号等)在SNP数量低于5,000时性能急剧下降。此外,HITSNP在交叉验证中也表现出较高的Jaccard相似性系数和极低的标准差,证实了其筛选的稳定性。
图2 HITSNP和其他四种筛选方法之间的特征SNP选择性能评估
同时,研究团队模拟了杂种数据对HITSNP的祖先推断功能进行了验证。通过构建13种不同杂交组合(包括5个亚洲地方猪种和2个欧洲商业品种作为祖先群体)的模拟数据集,研究发现基于随机森林分类器在HITSNP-CCA和HITSNP-MRMR方法选择的1000个特征SNP条件下可实现96%以上的杂种个体识别准确率。此外,使用逻辑回归分类器在祖先品种预测中同时实现了97%以上的准确率,为复杂杂种群体的遗传背景解析提供了可靠的技术方案。
图3 基于HITSNP筛选的特征SNP进行祖先推断性能评估
此外,研究人员使用最小子集搜索方法对HITSNP筛选的特征SNP数据集进行进一步缩减,探究最小特征SNP子集的可行性。通过比较顺序前向选择(SFS)和递归特征消除(RFE)两种算法,发现SFS策略在保证精度的前提下能更可靠地获得预设数量的特征SNP,特别是在HITSNP-CCA方法与贝叶斯分类器组合下,仅用200个特征SNP即可达到98.56%的测试集准确率。
图4 使用RFE和SFS策略的最小子集选择的性能评估
本研究为我国畜禽遗传资源高效精准鉴定、保护、监管开发利用提供科学依据和有力支撑。中国农业大学为论文第一完成单位,动物科学技术学院刘剑锋教授为论文通讯作者,团队博士研究生张美琳、副教授杜恒以及已毕业研究生张宇为论文的共同第一作者,团队博士研究生卓越、刘振、薛亚辉,副教授周磊等为论文合作作者。本研究获得了国家科技重大专项(2022ZD0115704),国家自然科学基金(3227200469,32302708),现代农业产业技术体系(CARS-pig-35)以及中国农业大学“2115”人才培育发展支持计划等资助。本研究工作得到中国农业大学校级高性能计算平台支持。
文章来源中国农业大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年11月优质学术会议推荐 16
-
2025年机器视觉、智能成像与模式识 392
-
2025年第七届控制与机器人国际会议 576
-
2025年智能光子学与应用技术国际学 1529
-
2025年机械工程,新能源与电气技术 1790
-
2025年计算机科学、图像分析与信号 2065
-
2025年材料化学与燃料电池技术国际 1861
-
2025年自动化前沿系统、智慧城市与 10-23
-
2025年信息光学、遥感技术与机器视 10-23
-
2025年数字人文、文化遗产与语言学 10-23
-
2025年神经科学、生物信息学与智能 10-23
-
2025年语言认知、人工智能与计算建 10-23
-
2025年社会科学、应用语言学与人文 10-23
-
2025年传统机械、动力学与智能装备 10-23
-
2025年图像处理、物理建模与结构设 10-23
-
2025年两院院士增选有效候选人1145
-
2025最新JCR分区及影响因子4758
-
好学术:科研网址导航|学术头条分2033
-
2025年国际期刊预警名单发布!1930
-
2025年中科院期刊分区表重磅发8447
-
中国科协《重要学术会议目录(205134
-
吉林大学校长张希:学术会议中的提2840
-
清华大学地学系阳坤课题组揭示全球10-20
-
历史时期极端干旱灾害的数据评估和10-20
-
“清华化学百年论坛:塑造化学的未10-20
-
研究揭示植物激素独脚金内酯作为跨10-20
-
清华大学联合研发的“46MW大容10-20
-
清华大学(软件学院)-九疆电力建10-20
-
中国农业大学土地学院马韫韬教授团10-20
-
电子科技大学光电学院本科生在一区10-20
-
工程信息研究院 18091

-
亚太科学与工程研究所 23367

-
中国医院药学杂志编辑部 23043

-
中国北京市朝阳区 18176

-
中国石油大学 18009

-
北京普瑞亿科科技有限公司 22977

-
中华两岸经文化贸繁荣促进会北京办 18025

-
中国地震局地壳应力研究所 23178

-
北京久久国际会展有限公司 23121

-
中国科学院自动化所 24094

-
武汉青博盛学术服务有限公司 23119

-
中国医促会医疗环保专业委员会 2057

-
武汉青博盛学术服务有限公司 1980

-
湖州师范学院 23048

-
中国石油兰州润滑油研究开发中心 21244

-
EAGWA 8350

-
西安周道会议策划服务有限公司 18089

-
广州南方医科大学医工学院 23109

-
WILL 24134

-
青岛明月海藻集团 23959

















98















































