清华大学 交叉信息院曾坚阳团队开发出能预测T细胞受体和抗原表位相互作用的深度学习模型
2024/04/12
T细胞受体和抗原表位的相互作用是机体免疫系统的重要组成部分,这种相互作用可以激活T细胞,从而识别和攻击感染机体的病原体。因此,研究T细胞受体和抗原表位的结合位点是理解机体免疫系统如何工作的关键。
T细胞在适应性免疫反应中对表位的识别是至关重要的。这种识别是通过主要组织相容性复合体(MHC)分子呈递的致病抗原(epitope)与T细胞受体(TCR)相互作用来实现的,从而激活细胞介导的免疫,消除感染细胞或活化相应的免疫细胞。因此,深入了解TCR-epitope的结合机制对于癌症免疫学、自身免疫抗原发现和疫苗设计具有重要意义。然而,由于这种识别机制的内在复杂性,TCR-epitope相互作用的实验检测和确定通常既费时又昂贵。为了解决这一问题,清华大学交叉信息研究院曾坚阳团队开发了TEIM模型,通过小样本学习(Few-shot learning)的思想来准确预测TCR-epitope在残基水平的相互作用和结合信息。模型首先在粗粒度的TCR-epitope序列结合信息上进行预训练,然后在细粒度的残基相互作用信息上进行进一步微调。验证试验和分析表明,TEIM模型具有优良的预测性能。进一步,通过三个应用场景:突变序列的结合构象预测、TCR库的结合模式分析和结合机制的挖掘,研究团队进一步说明TEIM模型可以帮助研究者更全面和深入地解析T细胞受体和抗原表位的相互作用。该研究有效使用深度学习框架建模多层级的T细胞受体和抗原表位的相互作用,并且融合了大规模预训练思想和少样本学习策略,为揭示T细胞识别表位这一生物问题提供了有效工具。
图1.TEIM模型结构和评估效果(a) TEIM-Seq和TEIM-Res的模型结构以及训练流程。除了最后一个模块外,TEIM-Seq和TEIM-Res模型共享相似的架构。它们都有特征提取器来分别学习CDR3和抗原表位的序列特征,然后将它们扩展到不同的维度以形成交互特征图。接下来,主要由二维卷积神经网络(2D CNN)组成的交互提取器用于提取成对残基交互信息。此外,由自动编码器生成的表位特征向量被馈送到交互提取器中以获取全局表位信息。最后,TEIM-Seq使用结合预测模块聚合所有成对交互来预测结合得分(即结合概率),而TEIM-Res使用由2D CNN层组成的残基级预测模块来预测距离矩阵和接触矩阵。训练流程包括两个阶段:首先在序列级结合数据上预训练TEIM-Seq,然后在残基粒度的结合数据上微调TEIM-Res。(b) TEIM-Res和其它基线方法相比,在三种不同数据划分设置下的性能表现。(c) TEIM-Res和平均基线的不同距离阈值内残基对的均方/相对误差。(d) GalaxyPepDock和TEIM-Res之间的性能比较。(e) TEIM-Res、平均基线和PepNN在预测结合矩阵任务上的性能比较
近日,清华大学交叉信息研究院曾坚阳团队成功开发了能预测T细胞受体和抗原表位相互作用的深度学习模型,相关成果以“利用深度学习表征T细胞受体和表位之间的相互作用构象”(Characterizing the interaction conformation between T cell receptors and epitopes with deep learning)为题,于3月27日发表在《自然》(Nature)子刊《自然·机器智能》(Nature Machine Intelligence)上。
该论文通讯作者为清华大学交叉信息研究院曾坚阳副教授和赵诞助理研究员,第一作者为清华大学交叉信息研究院硕士毕业生彭鑫港(现为北京大学智能学院和人工智能研究院博士生)和2021级博士研究生雷逸品。该研究得到青年基金项目、科技部重点研发项目以及南京图灵人工智能研究院等的支持。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年两院院士增选有效候选人116
-
2025最新JCR分区及影响因子2461
-
好学术:科研网址导航|学术头条分641
-
2025年国际期刊预警名单发布!770
-
2025年中科院期刊分区表重磅发4295
-
中国科协《重要学术会议目录(202964
-
吉林大学校长张希:学术会议中的提1619
-
2025年国自然正式放榜!08-27
-
SCI论文中的数据引用,如何避免08-15
-
EI核心期刊和普通期刊有什么本质08-15
-
国内期刊EI与核心有什么区别?三08-15
-
怎么查找前几年的EI期刊源?科研08-15
-
如何准确验证论文是否被SCI收录08-15
-
机械类EI期刊投稿全攻略:从实验08-15
-
SCI论文DOI号查找全攻略:学08-15
-
黄山市富伟会议会展公司 24131
-
哈尔滨工程大学 2319
-
CC 8037
-
AME2017组委会 21109
-
中华医学会行为医学分会 18161
-
北京中外联企业文化交流中心 1902
-
南京世通展览服务有限公司 1913
-
广东技术师范学院 1979
-
天地一脉文化传播公司 18099
-
国际工学技术出版协会 23084
-
山东济南刘华商务 17914
-
三联公司 18045
-
MHTD 2025
-
山西广播电视局 20968
-
中国环境科学学会 21184
-
南京雅苏达教育咨询有限公司 21118
-
赛诺瑞 7969
-
长江三峡集团 21013
-
科奥(河南)教育科技有限公司 8482
-
中国企业联合会 21063