研究人员研发出抗体语言模型
2026/05/11
近日,中国科学院合肥物质科学研究院研发出基于表型感知对比学习的抗体语言模型BCRInsight。该模型通过对海量序列的自监督学习,实现了对复杂免疫信号的深度解码,在抗体结合位点预测和B细胞亚群分析等任务上均达到当前最佳性能。
B细胞受体(BCR)免疫库蕴含丰富的生物学信号,决定抗原识别的特异性,记录B细胞激活、成熟及演化过程。传统方法难以解析抗体序列的复杂语义,单细胞测序技术成本高昂,因此亟需研发低成本、高效、可深度提取复杂生物语义的新型计算工具。
研究团队构建了基于12层Transformer编码器、约8600万个可训练参数的深度学习框架BCRInsight。与传统仅依赖掩码的语言模型不同,团队引入表型感知对比学习策略,在8000万条人类BCR序列的大规模数据集上完成预训练。在输入设计上,模型将氨基酸序列与基因注释等元数据,进行类似自然语言处理中“句子对”的联合编码。
实验显示,BCRInsight展现出优异的泛化与表征能力。在B细胞亚群分析中,模型能够从高度复杂的bulk BCR-seq数据中低成本地反卷积出B细胞亚群组成比例,准确率超越现有模型;在抗体结合位点预测测试中,其AUROC达0.962,性能优于九种先进方法。在未接触任何三维结构监督信号的条件下,该模型凭借自注意力机制感知蛋白三维结构,聚焦于决定抗原识别的关键HCDR3环区及结构支撑位点。
这一研究为实现从阅读免疫语言到编写免疫语言的跨越,以及指导疾病特异性抗体的人工设计与优化提供了支撑。
相关研究成果发表在Briefings in Bioinformatics上。
BCRInsight模型框架
文章来源合肥物质科学研究院,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年6月优质国际学术会议推荐 7
-
2026年第17届机械与航空航天工程 193
-
2026年先进航空航天技术与卫星应用 324
-
2026资源、化学化工与应用材料国际 1808
-
2026年图像处理与数字创意设计国际 1632
-
2026年机械工程,新能源与电气技术 6095
-
2026年材料科学、低碳技术与动力工 1819
-
2026年艺术、文化产业与数字媒体国 04-29
-
2026年智慧教育、教育研究与文化交 04-29
-
2026年数字社会、公共管理与经济学 04-29
-
2026 政务服务、数字治理与智慧城 04-28
-
2026 制冷技术、暖通设备与环境调 04-28
-
2026 轻工材料、绿色制造与循环利 04-28
-
2026 多语言智能、翻译技术与国际 04-28
-
2026 生物育种、生态种植与现代农 04-28
-
中国科协发布2025年《重要学术12
-
2026年新锐分区(原中科院期刊2595
-
2025年两院院士增选有效候选人4402
-
2025最新JCR分区及影响因子12342
-
好学术:科研网址导航|学术头条分5673
-
2025年国际期刊预警名单发布!5837
-
2025年中科院期刊分区表重磅发20812
-
吉林大学校长张希:学术会议中的提6954
-
二维超导迈斯纳效应探测研究获进展04-29
-
研究发现笼目超导体中多重范霍夫奇04-29
-
二氧化碳加氢制高碳烯烃与航煤馏分04-29
-
靶向特定蛋白互作界面抑制乙肝病毒04-29
-
研究揭示内源信使调控膜损伤与细胞04-29
-
科学家绘制大脑星形胶质细胞转录因04-29
-
上海交大Bio-X研究院石毅与合04-29
-
无锡源清天木生物科技有限公司 23594

-
世界华商杂志社 18295

-
北京航空航天大学 23412

-
北京大学计算机系 18526

-
杭州松下电器有限公司 18195

-
中国生物化学与分子生物学会 18415

-
中国环境科学学会 8170

-
SDGVUYFD 2204

-
华东理工大学 2587

-
北京富来宫温泉山庄 2166

-
香港机械工程师协会 2279

-
武汉红矮星传媒有限公司 8301

-
长江大学机械工程学院 21303

-
中国地震局地壳应力研究所 23405

-
CD 24314

-
上海商图信息咨询有限公司 23531

-
香港城市大学 23637

-
北京恒基雅泰咨询服务中心 23253

-
中国海关出版社 24568

-
上海外国语大学中国外语战略研究中 21342





















18







































