我国学者与海外合作者在利用人工智能识别潜在RNA病毒研究方面取得进展
2025/06/01
图 使用人工智能对全球病毒圈的深度挖掘
在国家自然科学基金项目(批准号:82341118、32270160)等资助下,中山大学医学院施莽教授团队、阿里云李兆融团队,联合悉尼大学Edward Holmes教授团队,在人工智能(artificial intelligence,AI)算法识别潜在的RNA病毒种(species)及RNA病毒超群(supergroups)研究方面取得进展。相关成果以“利用人工智能揭示隐藏的RNA病毒圈(Using Artificial Intelligence to Document the Hidden RNA Virosphere)”为题,于2024年10月9日在《细胞》(Cell)杂志在线发表。论文链接:https://www.cell.com/cell/fulltext/S0092-8674(24)01085-7。
病毒是地球生态系统的重要组成部分,与人类健康关系密切。目前人类对病毒多样性的认识仍然非常有限,自然界病毒圈仍有大量病毒种类处于未知状态。传统的RNA病毒鉴定方法高度依赖于序列同源性比对,即通过比较未知病毒与已知病毒的序列相似性来识别。然而,由于RNA病毒种类繁多且高度分化,这种方法难以捕捉缺乏同源性或同源性极低的病毒序列。如何高效、准确地发现和鉴定新病毒仍充满挑战。
研究团队研发了一种利用蛋白质序列和结构信息的变换器架构(Transformer)深度学习语言模型“LucaProt”,该模型具有较高的准确性(假阳性率为0.014%)和特异性(假阴性率为1.72%)。进一步,利用“LucaProt”深度挖掘来自全球各类生物环境的10,487份宏转录组数据,发现超过51万条病毒基因组,代表超过16万个潜在的RNA病毒物种和180个RNA病毒超群,使现有RNA病毒超群数量增加了约9倍(图)。其中,23个超群无法通过传统的同源性分析识别,被称为病毒圈的“暗物质”。这些新发现的病毒来自地球上的各类生态环境,包含南极底泥、深海热泉、活性污泥和盐碱滩等极端环境,显著拓宽了人们对RNA病毒分布和适宜生境的理解。此外,该研究还发现迄今为止最长的RNA病毒基因组,同时揭示了多种复杂的基因组结构,展示了RNA病毒在基因组进化上的高度灵活性。
这项研究将人工智能与病毒基因组发现结合,突破了传统的病毒分离和同源性分析方法的局限,扩展了人们对病毒圈的认知。
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
好学术:科研网址导航|学术头条分232
-
《时代技术》投稿全攻略:一位审稿243
-
2025年国际期刊预警名单发布!374
-
2025年中科院期刊分区表重磅发3126
-
中科院已正式发布2024年预警期604
-
2025年度国家自然科学基金项目524
-
中国科协《重要学术会议目录(201759
-
2024年国家自然科学基金项目评896
-
2024年JCR影响因子正式发布887
-
吉林大学校长张希:学术会议中的提1103
-
如何成功度过研究生生涯,三件事助06-13
-
离开国企,圆梦985:一位青年的06-13
-
学术会议参与指南,会议交流技巧分06-13
-
刊物发表攻略:投稿技巧与注意事项06-13
-
技术创新,世界从此不同06-13
-
亚太科学与工程研究所 22899
-
武汉中会会议服务有限公司 23106
-
云南广大科技开发中心 17847
-
山东飞鲨国际展览有限公司 1908
-
WCNIS2009组委会 22847
-
电子科技大学 20927
-
湖北学而升文化传播有限公司 7868
-
北京五彩纷呈 22972
-
AMRMT 22851
-
qs 23884
-
广东瑞图万方科技优先公司 17826
-
北京三德纵横医院管理咨询公司 17890
-
新疆喀什师范学院外国语系 24027
-
北京建筑工程学院 17914
-
北京新线国际展览有限公司 1886
-
天津音乐学院 23024
-
上海唐朝酒店 17835
-
上海商图信息咨询有限公司 23095
-
PBTSs 2264
-
QQ 7854