我国学者与海外合作者在利用人工智能识别潜在RNA病毒研究方面取得进展
2025/06/01
图 使用人工智能对全球病毒圈的深度挖掘
在国家自然科学基金项目(批准号:82341118、32270160)等资助下,中山大学医学院施莽教授团队、阿里云李兆融团队,联合悉尼大学Edward Holmes教授团队,在人工智能(artificial intelligence,AI)算法识别潜在的RNA病毒种(species)及RNA病毒超群(supergroups)研究方面取得进展。相关成果以“利用人工智能揭示隐藏的RNA病毒圈(Using Artificial Intelligence to Document the Hidden RNA Virosphere)”为题,于2024年10月9日在《细胞》(Cell)杂志在线发表。论文链接:https://www.cell.com/cell/fulltext/S0092-8674(24)01085-7。
病毒是地球生态系统的重要组成部分,与人类健康关系密切。目前人类对病毒多样性的认识仍然非常有限,自然界病毒圈仍有大量病毒种类处于未知状态。传统的RNA病毒鉴定方法高度依赖于序列同源性比对,即通过比较未知病毒与已知病毒的序列相似性来识别。然而,由于RNA病毒种类繁多且高度分化,这种方法难以捕捉缺乏同源性或同源性极低的病毒序列。如何高效、准确地发现和鉴定新病毒仍充满挑战。
研究团队研发了一种利用蛋白质序列和结构信息的变换器架构(Transformer)深度学习语言模型“LucaProt”,该模型具有较高的准确性(假阳性率为0.014%)和特异性(假阴性率为1.72%)。进一步,利用“LucaProt”深度挖掘来自全球各类生物环境的10,487份宏转录组数据,发现超过51万条病毒基因组,代表超过16万个潜在的RNA病毒物种和180个RNA病毒超群,使现有RNA病毒超群数量增加了约9倍(图)。其中,23个超群无法通过传统的同源性分析识别,被称为病毒圈的“暗物质”。这些新发现的病毒来自地球上的各类生态环境,包含南极底泥、深海热泉、活性污泥和盐碱滩等极端环境,显著拓宽了人们对RNA病毒分布和适宜生境的理解。此外,该研究还发现迄今为止最长的RNA病毒基因组,同时揭示了多种复杂的基因组结构,展示了RNA病毒在基因组进化上的高度灵活性。
这项研究将人工智能与病毒基因组发现结合,突破了传统的病毒分离和同源性分析方法的局限,扩展了人们对病毒圈的认知。
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025最新JCR分区及影响因子1939
-
好学术:科研网址导航|学术头条分468
-
《时代技术》投稿全攻略:一位审稿499
-
2025年国际期刊预警名单发布!600
-
2025年中科院期刊分区表重磅发3957
-
中科院已正式发布2024年预警期861
-
2025年度国家自然科学基金项目727
-
中国科协《重要学术会议目录(202733
-
2024年国家自然科学基金项目评1138
-
2024年JCR影响因子正式发布1214
-
吉林大学校长张希:学术会议中的提1391
-
SCI论文插图全攻略:从规范解析08-01
-
国际学术会议参加经验是怎么样的呢08-01
-
掠夺性会议是怎么进行判断的呢?—08-01
-
SCI论文投稿费怎么交?202408-01
-
武汉奔诚文化传播有限公司 8306
-
东北财经大学 2027
-
《中国神经再生研究(英文版)》杂 21247
-
嘉定优势会展服务社 18034
-
International As 7902
-
自家人家政有限公司 18101
-
轻工业环境保护研究所 18091
-
河北省保定学院体育系 20879
-
西安华线石油科技有限公司 7888
-
东南大学数学系 18079
-
中国全科医学杂志社 23187
-
维科信息产业研究中心 2002
-
湖南会议接待服务中心 24049
-
中国电子商务案例中心 2093
-
中国物流与采购联合会 21303
-
北京米嘉科技服务有限公司 8012
-
武汉会议策划公司 22995
-
怀思会议 22885
-
中山大学附属第三医院 21034
-
北京市建设科技发展中心 18196