清华大学在人工智能辅助抗体设计领域取得新进展
2024/04/12
![]()  | 
    

图 研究成果MEAN与美国麻省理工学院RefineGNN的对比。(A)CDR-H3对比。图中灰色部分表示抗原,绿色和红色表示抗体的重链和轻链,左下角是真实的氨基酸序列以及算法生成的氨基酸序列,图中方框的地方是算法生成的CDR-H3的3维结构。(B)亲和力对比。图中绿色区域是数据集中原始抗体针对目标抗原的亲和力密度分布曲线,橙色和蓝色区域分别是RefineGNN和MEAN对抗体进行优化后的亲和力密度分布曲线
在国家自然科学基金项目(批准号:61925601、62006137)资助下,清华大学计算机科学与技术系、智能产业研究院刘洋教授课题组与中国人民大学高瓴人工智能学院黄文炳助理教授合作,在人工智能辅助抗体设计领域取得新进展,相关研究成果以“基于三维等变图翻译的条件式抗体设计(Conditional Antibody Design as 3D Equivariant Graph Translation)”为题,于2023年3月21日获得人工智能领域重要国际会议ICLR 2023杰出论文提名(Outstanding Paper Honorable Mention)。论文链接:https://openreview.net/pdf?id=LFHFQbjxIiP。
抗体是免疫系统用来鉴别和中和外来细菌、病毒等病原体的大型Y形蛋白质,抗体类药物在自身免疫疾病和癌症的治疗中发挥了不可估量的重要作用。抗体的设计和优化极具挑战性,主要体现在三个方面:首先,氨基酸序列的搜索空间巨大,每个CDR的氨基酸组合共有约1万亿种可能性,而抗体设计需要考虑多个CDR;其次,抗体结构存在复杂的内外部物理作用,抗体在自身氨基酸相互作用下形成的三维结构需要与抗原特别是其表位的三维结构紧密结合;最后,抗体设计需要遵循物理定律的对称性,不应受三维坐标系的平移和旋转影响。
团队提出了一种基于深度学习的抗体设计方法——多通道等变注意力网络(Multichannel Equivariant Attentive Network, 简称MEAN)。该方法巧妙地借鉴端到端神经机器翻译技术的核心思想,将抗体生成视为三维等变图翻译问题:给定抗体-抗原三维复合体,输出抗体CDR区域一维氨基酸序列和对接后的三维结构。MEAN利用等变图神经网络直接在三维空间处理蛋白质结构,有效克服了传统方法仅能在预处理阶段纳入三维结构信息的局限性,通过充分利用目标抗原的完整信息和抗体的完整可变区域对抗体的复杂内外部物理作用进行建模,高效同步生成满足物理定律对称性的抗体CDR区域一维序列和三维结构,具有很强的抗原靶向特性、表达能力和泛化能力。在靶向抗原的抗体设计任务上,MEAN的CDR氨基酸重构精度比麻省理工学院提出的RefineGNN提高了23%。在亲和力优化任务上,MEAN优化后抗体的吉布斯自由能差变化ddG比RefineGNN提高了34%。图(A)对比了MEAN与RefineGNN的差异,MEAN生成的CDR氨基酸序列“ANGDGDY”更接近真实序列“ANWAGDY”,对应的三维结构与真实结构几乎完全重合。图(B)展示了两种方法优化后的抗体对目标抗原的亲和力值分布,与原始抗体(即RAbD)的亲和力相比,经过MEAN优化后的抗体,亲和力得到大幅度提升(亲和力值越小表示结果越好),显著超过了RefineGNN。
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
- 
  2025年11月优质学术会议推荐 16
   - 
  2025年机器视觉、智能成像与模式识 392
   - 
  2025年第七届控制与机器人国际会议 576
   - 
  2025年智能光子学与应用技术国际学 1529
   - 
  2025年机械工程,新能源与电气技术 1790
   - 
  2025年计算机科学、图像分析与信号 2065
   - 
  2025年材料化学与燃料电池技术国际 1861
   - 
  2025年自动化前沿系统、智慧城市与 10-23
   - 
  2025年信息光学、遥感技术与机器视 10-23
   - 
  2025年数字人文、文化遗产与语言学 10-23
   - 
  2025年神经科学、生物信息学与智能 10-23
   - 
  2025年语言认知、人工智能与计算建 10-23
   - 
  2025年社会科学、应用语言学与人文 10-23
   - 
  2025年传统机械、动力学与智能装备 10-23
   - 
  2025年图像处理、物理建模与结构设 10-23
   
- 
  2025年两院院士增选有效候选人1145
 - 
  2025最新JCR分区及影响因子4758
 - 
  好学术:科研网址导航|学术头条分2033
 - 
  2025年国际期刊预警名单发布!1930
 - 
  2025年中科院期刊分区表重磅发8447
 - 
  中国科协《重要学术会议目录(205134
 - 
  吉林大学校长张希:学术会议中的提2840
 - 
  清华大学地学系阳坤课题组揭示全球10-20
 - 
  历史时期极端干旱灾害的数据评估和10-20
 - 
  “清华化学百年论坛:塑造化学的未10-20
 - 
  研究揭示植物激素独脚金内酯作为跨10-20
 - 
  清华大学联合研发的“46MW大容10-20
 - 
  清华大学(软件学院)-九疆电力建10-20
 - 
  中国农业大学土地学院马韫韬教授团10-20
 - 
  电子科技大学光电学院本科生在一区10-20
 
- 
  北京沃玉科技发展中心 8296

 - 
  南京工业大学 2127

 - 
  中国科学社会主义学会科学发展观研 23083

 - 
  安徽中医药大学 20980

 - 
  浙江广厦建设职业技术学院 18240

 - 
  fdf 24190

 - 
  江苏省南京市 2459

 - 
  徽州文化园华商山庄酒店有限公司 18125

 - 
  中国金属学会分析测试分会 21325

 - 
  上海麦峰医学科技有限公司 1970

 - 
  清华大学医院管理研究院 24094

 - 
  上海麦峰医学科技有限公司 8026

 - 
  天津中豪会议策划服务有限公司 2285

 - 
  河南欧诺机械制造有限公司 18474

 - 
  HTRSHE 8053

 - 
  中国药理学会临床药理专业委员会 23106

 - 
  第二届亚太运动训练科学大会 22993

 - 
  首都经济贸易大学 23240

 - 
  上海广尧商务咨询有限公司 24064

 - 
  美国信息学会 24390

 
						
					 
					















 430












































						
						