清华团队合作开发冷冻电镜颗粒挑选的持续学习方法
2024/05/08
近年来,深度学习逐渐成为冷冻电镜图像处理流程中颗粒挑选的常用方法。然而,现有基于深度学习的颗粒挑选方法无法在新数据训练中动态地向模型中积累新的知识。也就是说,现有模型在新样本上被训练后,虽然能够在最新的数据上获得良好的性能,但是往往无法保持其在旧数据上的颗粒挑选精度。此外,现有方法都是在特定数据集上训练出通用模型,当要加入新的训练数据时存储和计算成本都很高,大大限制了其在未曾见过的数据上的识别能力和精度。因此,我们需要改进现有深度学习网络训练的方式和方法。同时,现有的冷冻电镜设施每天都在产生大量的新数据。如果能发展一种持续学习的技术,在持续的应用过程中,让深度神经网络能够不断地学习和积累新数据中的新特征,不断地增强对生物样本图像识别能力,对发展现代化的自动化冷冻电镜系统具有非常重要的意义。
5月5日,清华大学生命科学学院李雪明副教授团队,清华大学电子工程系沈渊教授团队,北京科技大学计算机与通信工程学院陈健生教授团队联合在《自然•通讯》(Nature Communications)期刊在线发表研究论文,题目为“一种用于冷冻电镜颗粒挑选知识积累的范例驱动持续学习方法EPicker”(EPicker is an exemplar-based continual learning approach for knowledge accumulation in cryoEM particle picking)。该论文报道了一种范例驱动的持续学习方法在蛋白质颗粒挑选中的应用,通过在颗粒挑选过程中不断学习新的知识来扩展检测模型识别生物大分子的能力。发展持续学习方法的重要意义在于,可以使人工深度神经网络具有类似人的学习方式,在使用中持续学习新知识、新技能,从而不断增强自身能力。EPicker经过训练之后可以挑选蛋白质颗粒、囊泡和纤维等广泛的生物对象。

图1. EPicker的网络框架和持续学习的示意图
针对现有方法的不足之处,研究团队设计了一种基于持续学习的颗粒挑选算法,能够在训练神经网络的过程中不断积累新的颗粒挑选知识,提高通用模型的颗粒挑选能力。该算法通过设计双路网络结构(图1)和融合知识蒸馏、历史回放、正则化、稀疏标注方法,将新样本的知识不断积累到通用模型中去的同时,不会遗忘旧知识。这很好解决了模型在新数据上训练后无法挑选旧数据样本的问题。基于这些算法,研究团队开发了一个名为EPicker的新软件系统。为了进一步扩展方法的适用范围,团队针对广泛的生物对象设计了相应的挑选算法,包括挑选囊泡和纤维等多种不同的生物对象,支持有偏和无偏的颗粒挑选方式以满足用户的不同需求等等。通过在具有代表性和挑战性的数据集上进行大量实验,并与目前较为流行的颗粒挑选方法进行对比,验证了EPicker的有效性和优越性(图2)。实验结果表明,EPicker可以通过高效、高度自动化的持续学习过程得到精度高、召回高且泛化能力强的蛋白质颗粒挑选结果。

图2. 不同方法的颗粒挑选结果比较
清华大学生命科学学院李雪明副教授、清华大学电子工程系沈渊教授,北京科技大学计算机与通信工程学院陈健生教授为本文的共同通讯作者。清华大学电子工程系2019级硕士生张馨予,2020级硕士生赵天放为该论文的共同第一作者。本工作获得了科技部重点研发计划,国家自然科学基金委,北京市结构生物学高精尖创新中心,北京市生物结构前沿研究中心,生命科学联合中心和北京信息科学与技术国家研究中心等的资金支持。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年6月优质国际学术会议推荐 7
-
2026年第17届机械与航空航天工程 193
-
2026年先进航空航天技术与卫星应用 324
-
2026资源、化学化工与应用材料国际 1808
-
2026年图像处理与数字创意设计国际 1632
-
2026年机械工程,新能源与电气技术 6095
-
2026年材料科学、低碳技术与动力工 1819
-
2026年艺术、文化产业与数字媒体国 04-29
-
2026年智慧教育、教育研究与文化交 04-29
-
2026年数字社会、公共管理与经济学 04-29
-
2026 政务服务、数字治理与智慧城 04-28
-
2026 制冷技术、暖通设备与环境调 04-28
-
2026 轻工材料、绿色制造与循环利 04-28
-
2026 多语言智能、翻译技术与国际 04-28
-
2026 生物育种、生态种植与现代农 04-28
-
中国科协发布2025年《重要学术12
-
2026年新锐分区(原中科院期刊2595
-
2025年两院院士增选有效候选人4402
-
2025最新JCR分区及影响因子12342
-
好学术:科研网址导航|学术头条分5673
-
2025年国际期刊预警名单发布!5837
-
2025年中科院期刊分区表重磅发20812
-
吉林大学校长张希:学术会议中的提6954
-
二维超导迈斯纳效应探测研究获进展04-29
-
研究发现笼目超导体中多重范霍夫奇04-29
-
二氧化碳加氢制高碳烯烃与航煤馏分04-29
-
靶向特定蛋白互作界面抑制乙肝病毒04-29
-
研究揭示内源信使调控膜损伤与细胞04-29
-
科学家绘制大脑星形胶质细胞转录因04-29
-
上海交大Bio-X研究院石毅与合04-29
-
中国针灸推拿协会 21391

-
APISE 23244

-
2010中国城市建设峰会 18332

-
西南石油大学建筑工程学院 23366

-
北京电源行业协会 23730

-
的萨达是大事我 18259

-
北京品诺佳信息咨询有限公司 8356

-
青岛大学医学院附属医院超声科 21322

-
HKSME 21205

-
福州大学物理与信息工程学院 23377

-
《环球杂志》 21746

-
联合医学会展有限公司 18553

-
北京京西酒店 2552

-
河南开封欧帕自动化有限公司 18385

-
合肥工业大学 24550

-
农业和生物科学国际学术会议组委会 2514

-
武汉工程大学 21297

-
中国东北大学 23315

-
亚太科学与工程研究所 23331

-
上海同城优代文化营销有限公司 8255





















748






































