研究人员研发出抗体语言模型
2026/05/11
近日,中国科学院合肥物质科学研究院研发出基于表型感知对比学习的抗体语言模型BCRInsight。该模型通过对海量序列的自监督学习,实现了对复杂免疫信号的深度解码,在抗体结合位点预测和B细胞亚群分析等任务上均达到当前最佳性能。
B细胞受体(BCR)免疫库蕴含丰富的生物学信号,决定抗原识别的特异性,记录B细胞激活、成熟及演化过程。传统方法难以解析抗体序列的复杂语义,单细胞测序技术成本高昂,因此亟需研发低成本、高效、可深度提取复杂生物语义的新型计算工具。
研究团队构建了基于12层Transformer编码器、约8600万个可训练参数的深度学习框架BCRInsight。与传统仅依赖掩码的语言模型不同,团队引入表型感知对比学习策略,在8000万条人类BCR序列的大规模数据集上完成预训练。在输入设计上,模型将氨基酸序列与基因注释等元数据,进行类似自然语言处理中“句子对”的联合编码。
实验显示,BCRInsight展现出优异的泛化与表征能力。在B细胞亚群分析中,模型能够从高度复杂的bulk BCR-seq数据中低成本地反卷积出B细胞亚群组成比例,准确率超越现有模型;在抗体结合位点预测测试中,其AUROC达0.962,性能优于九种先进方法。在未接触任何三维结构监督信号的条件下,该模型凭借自注意力机制感知蛋白三维结构,聚焦于决定抗原识别的关键HCDR3环区及结构支撑位点。
这一研究为实现从阅读免疫语言到编写免疫语言的跨越,以及指导疾病特异性抗体的人工设计与优化提供了支撑。
相关研究成果发表在Briefings in Bioinformatics上。
BCRInsight模型框架
文章来源合肥物质科学研究院,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年第五届机器学习、云计算与智 26
-
2026年第二届计算机视觉与机器学习 627
-
2026年6月优质国际学术会议推荐 1157
-
2026年智慧教育与数据挖掘国际学术 813
-
2026年第11届生物医学信号与图像 697
-
2026资源、化学化工与应用材料国际 2559
-
2026年图像处理与数字创意设计国际 2369
-
2026年机械工程,新能源与电气技术 6849
-
2026年材料科学、低碳技术与动力工 2524
-
2026年海洋科学、水利工程与环境管 06-18
-
2026年环境工程、材料科学与循环经 06-18
-
2026年航空动力、流体力学与热物理 06-18
-
2026年地球化学、核物理与地质学国 06-18
-
2026年微机电、物理学与建模仿真国 06-18
-
2026年机械工程、电子技术与自动化 06-18
-
2026 JCR影响因子正式发布272
-
中国科协发布2025年《重要学术858
-
2026年新锐分区(原中科院期刊5648
-
2025年两院院士增选有效候选人5280
-
好学术:科研网址导航|学术头条分6842
-
2025年国际期刊预警名单发布!7028
-
2025年中科院期刊分区表重磅发24788
-
吉林大学校长张希:学术会议中的提8093
-
研究表明太阳耀斑终端激波可作为地06-24
-
研究揭示藻—菌共生体系强化养殖尾06-24
-
双功能手性双核镍催化研究获进展06-24
-
研究发现银河系中心极端环境下大质06-24
-
废塑料升级利用研究取得进展06-24
-
硒太阳能电池研究取得进展06-24
-
南京大学王涛团队首次发现110亿06-24
-
北京农业工程学会 18403

-
电子科技大学 18547

-
河南永城煤化工 18380

-
北京艾尚国际展览有限公司 2411

-
中国生物化学与分子生物学委员会 21348

-
北京华矩咨询管理科技有限公司 8492

-
聊城大学传媒 技术学院 8412

-
百奥泰国际会议(大连)有限公司 21247

-
湖北研学博科文化传播有限公司 24344

-
KLSD 21473

-
时代嘉道企业咨询机构 21329

-
北京国科企研信息咨询中心 2599

-
临沂师范学院 21474

-
沈阳市东北大学 18313

-
北京恒跃展览有限公司 8354

-
中南大学湘雅医院 21275

-
上海歌闻展览有限公司 8406

-
北京中天紫微教育科技有限公司 18450

-
四川大学华西医院 23639

-
中国针灸推拿协会 24701





















78










































