清华大学生命学院鲁志团队合作提出用于疾病诊断的cfRNA片段组学分析策略
2025/05/17
液体活检是近年来发展起来的新型无创诊断技术,可以实时动态地监测人体的健康和疾病状态。细胞游离RNA(cell-free RNA,cfRNA)由于具有高度的敏感性、动态性和组织溯源能力,为肿瘤、自身免疫疾病、孕期疾病、神经退行性疾病等复杂性疾病的无创检测带来了新的希望。cfRNA广泛存在于血液等多种人类体液中,通常被包裹在细胞外囊泡(EV)中或与蛋白结合形成核糖核酸蛋白复合体(RNP)。然而cfRNA本身高度碎片化、异质性高且信噪比低(病灶来源的cfRNA占比低),为其灵敏识别和临床应用带来了诸多挑战。另一方面,被核小体或转录因子保护的碎片化cfRNA的片段组学近年来已有很多研究的积累,被证明在肿瘤诊断和预后等多个场景均有一定应用潜力,而具有广阔临床应用前景的cfRNA中的片段化特征则由于生物信息学分析方法的缺乏很少被研究。
5月8日,清华大学生命学院鲁志团队、北京协和医院李梦涛团队、北京口腔医院秦力铮团队的毛明惠在《基因组生物学》(Genome Biology)杂志上发表题为“细胞游离RNA峰值分析揭示具有临床潜力的高频保护的短片段区域”(Peak analysis of cell-free RNA finds recurrently protected narrow regions with clinical potential)的论文,开发了针对cfRNA数据的片段化分析方法cfPeak,填补了cfRNA片段化分析的空白,为cfRNA片段组学的发展铺平了道路。
图1. 文章主题概览示意图
鲁志团队多年来一直专注于cfRNA相关的技术开发和临床应用研究,在这项最新发表的工作中,研究人员通过统计建模与机器学习方法开发了一个新型的生物信息学方法cfPeak,该方法在真实和模拟数据集中均表现出比其他峰值鉴定方法更敏锐的片段化峰区识别能力。该研究为cfRNA片段组学的系统分析提供了可行方案,揭示了cfRNA保护性片段在生物学及临床应用中的重要意义。同时,该研究还强调了低丰度、潜在组织来源cfRNA信号在液体活检中的临床应用价值。
为了确认在体液细胞外数据中也可以检测到稳定的cfRNA信号,研究人员对比了细胞内CLIP-seq(CL-CLIP-seq)、细胞内小RNA-seq(CL-smRNA-seq)和细胞外小RNA-seq(CF-smRNA-seq)的读段覆盖图谱。使用经典的CLIPper工具进行传统的峰值/峰区的识别/检出。在已知cfRNA种类的转录本中展示了四个示例区域(峰区所在转录本)。总体上,对于未捕获或未免疫共沉淀的测序数据,如CL-和CF-smRNA-seq,不同转录本类型中均存在可稳定识别的峰区信号。
图2.在细胞内外的RNA测序数据中识别到长RNA前体上频繁出现的碎片化信号峰区
考虑到本研究之前提到的不同工具的差异,在使用传统的峰区识别工具探索片段化cfRNA时,可能会面临建模不恰当或参数不适合的风险。为此,研究人员引入了信号峰区识别方法cfPeak来填补这一空白。cfPeak借鉴了其他方法的多项优点,整体可分解为六个主要模块(图3A),并搭建了片段化cfRNA峰区分析的整个流程(图3B)。
为了在理想条件下更好地评估不同方法的性能和检测极限,研究人员还对血浆cfRNA的多组织来源特点进行了简化和建模,将其视为由主要来源(如血细胞来源)和次要来源(如结肠组织/细胞来源)组成,并人工生成了测试数据集(图3C)。研究人员进一步在该人工数据集中测试了cfPeak,发现其能够更敏感地检测到RNA混合物中次要来源的低丰度峰区(在50%、5%和0.5%次要来源比例下的召回率分别为90%、90%和70%),这些峰区在传统方法中常被忽略或遗漏(图3D)。
图3.cfPeak的模块和cfPeak-pipe的流程结构以及在人工数据中的评测效果
在被应用到肿瘤液体活检时,cfPeak在体液数据中有效识别了与结直肠癌相关的cfRNA信号峰(图4AB),并提供了有关实体瘤位点(图4CD)和口腔癌转移(图4EF)的信息。临床应用中的结果揭示了癌组织起源的低丰度cfRNA的重要性,表明cfPeak具有在血浆样本中识别出具有癌症检测、癌种区分及转移状态指示能力的片段化cfRNA峰区信号的潜力。
图4.cfPeak在几种临床场景中的应用
总的来说,该研究通过建立cfPeak峰区识别方法和cfPeak-pipe分析框架,填补了cfRNA片段化分析的空白,为体液cfRNA片段组学的科学发现及其在各类疾病检测中的广泛应用搭建了桥梁。
鲁志副教授、李梦涛主任医师、毛明惠主任医师为论文通讯作者;清华大学生命学院已毕业博士生鲍鹏飞、北京大学前沿交叉学院2021级博士生王泰惟和清华大学生命学院已毕业博士生刘晓帆为论文共同第一作者。
研究得到来自国家重点研发计划、国家自然科学基金、“生物信息学”教育部重点实验室、“绿色生物制造”全国重点实验室、清华大学精准医疗研究院、清华大学国强研究院、合肥综合性国家科学中心大健康研究院等的支持。
文章来源清华大学新闻网,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年11月优质学术会议推荐 16
-
2025年机器视觉、智能成像与模式识 392
-
2025年第七届控制与机器人国际会议 576
-
2025年智能光子学与应用技术国际学 1529
-
2025年机械工程,新能源与电气技术 1790
-
2025年计算机科学、图像分析与信号 2065
-
2025年材料化学与燃料电池技术国际 1861
-
2025年自动化前沿系统、智慧城市与 10-23
-
2025年信息光学、遥感技术与机器视 10-23
-
2025年数字人文、文化遗产与语言学 10-23
-
2025年神经科学、生物信息学与智能 10-23
-
2025年语言认知、人工智能与计算建 10-23
-
2025年社会科学、应用语言学与人文 10-23
-
2025年传统机械、动力学与智能装备 10-23
-
2025年图像处理、物理建模与结构设 10-23
-
2025年两院院士增选有效候选人1145
-
2025最新JCR分区及影响因子4758
-
好学术:科研网址导航|学术头条分2033
-
2025年国际期刊预警名单发布!1930
-
2025年中科院期刊分区表重磅发8447
-
中国科协《重要学术会议目录(205134
-
吉林大学校长张希:学术会议中的提2840
-
清华大学地学系阳坤课题组揭示全球10-20
-
历史时期极端干旱灾害的数据评估和10-20
-
“清华化学百年论坛:塑造化学的未10-20
-
研究揭示植物激素独脚金内酯作为跨10-20
-
清华大学联合研发的“46MW大容10-20
-
清华大学(软件学院)-九疆电力建10-20
-
中国农业大学土地学院马韫韬教授团10-20
-
电子科技大学光电学院本科生在一区10-20
-
中国机械工程学会表面工程分会 21699

-
兰州大学资源环境学院 21254

-
会议服务 24246

-
北京腾达信息咨询公司 18112

-
耐奥公共关系机构 17936

-
中南民族大学 24167

-
csae@ieee-csae.o 2119

-
灵创国际交流中心 18179

-
北京信息名址管理中心 23074

-
华东理工大学 21078

-
山东大学 18057

-
北京理工大学自动化学院 23196

-
武汉大学 8215

-
乔氏企业管理 8093

-
北京全卫联合医学科学研究院 2130

-
上海屹桥文化传媒有限公司 1965

-
中金国研 2033

-
哈尔滨工业大学 23084

-
上海商图信息咨询有限公司 8098

-
北京环球北方国际展览有限公司 18004

















238















































