清华大学数学中心包承龙团队“面向蛋白质结构解析的弱配对数据生成算法”入选2025年度医学人工智能代表性算法
2025/12/19
12月12日至14日,第四届医学人工智能大会(CMAIC 2025)在苏州举行。会上,清华大学丘成桐数学科学中心副教授包承龙、2024届博士毕业生郑棣瀚以及求真书院2023级博士生张慧共同提出的“面向蛋白质结构解析的弱配对数据生成算法”入选2025年度医学人工智能代表性算法。
包承龙(左一)、张慧(左二)接受证书颁授
冷冻电子显微镜(Cryo-EM)虽已成为解析生物大分子结构的核心技术,但在实际应用中,由于复杂的成像环境和极低的信噪比,获取高质量的干净-噪声配对训练数据始终是制约AI算法性能的瓶颈。针对这一挑战,包承龙团队构建了一套基于概率图模型的弱配对数据生成理论体系。团队首先提出LUD-VAE模型,在仅有干净域数据x与退化域数据y的边缘样本条件下,用概率图显式拆分结构/内容隐变量z与成像退化/噪声隐变量z_n,并在推断不变性假设下把ELBO写成无需成对样本也可计算的形式,从而学习联合分布并由条件分布p(y|x)把任意干净样本合成逼真的退化观测,批量产出可控的配对训练对。随后,SeNM-VAE面向少量配对+大量不配对的实际情况,采用层级隐变量与混合推断,将仅配对数据、仅干净数据、仅退化数据三类数据统一到同一变分目标中,既保留可解释的退化因子,又显著增强对真实复杂噪声分布的表达能力,生成更贴近实验的配对训练样本。
CryoPROS算法架构
在此基础上,团队进一步将弱配对数据生成模型应用于冷冻电镜领域长期存在的“优势取向”难题。由于生物样本易在气液界面以特定方向吸附,导致颗粒在冰层中排列产生严重偏倚,进而引发三维重构失真。团队研发了基于条件层次化变分自编码机(cHVAE)的CryoPROS算法,该算法能在超低信噪比及采样不均衡条件下,高效生成高保真度的辅助颗粒视图。这些生成数据有效补全了实验数据的采样缺口,团队据此提出了生成数据与实验数据联合优化的计算范式,显著降低了颗粒对齐误差并提升了结构解析的稳健性。
目前,该系列成果已在多套实验数据中验证了其有效性,以计算手段突破了传统方法依赖复杂生物样本优化或特殊数据收集策略的局限。CryoPROS算法已被由哈佛大学医学院管理的国际生物软件联盟SBGrid收录。
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年6月优质国际学术会议推荐 7
-
2026年第17届机械与航空航天工程 193
-
2026年先进航空航天技术与卫星应用 324
-
2026资源、化学化工与应用材料国际 1808
-
2026年图像处理与数字创意设计国际 1632
-
2026年机械工程,新能源与电气技术 6095
-
2026年材料科学、低碳技术与动力工 1819
-
2026年艺术、文化产业与数字媒体国 04-29
-
2026年智慧教育、教育研究与文化交 04-29
-
2026年数字社会、公共管理与经济学 04-29
-
2026 政务服务、数字治理与智慧城 04-28
-
2026 制冷技术、暖通设备与环境调 04-28
-
2026 轻工材料、绿色制造与循环利 04-28
-
2026 多语言智能、翻译技术与国际 04-28
-
2026 生物育种、生态种植与现代农 04-28
-
中国科协发布2025年《重要学术12
-
2026年新锐分区(原中科院期刊2595
-
2025年两院院士增选有效候选人4402
-
2025最新JCR分区及影响因子12342
-
好学术:科研网址导航|学术头条分5673
-
2025年国际期刊预警名单发布!5837
-
2025年中科院期刊分区表重磅发20812
-
吉林大学校长张希:学术会议中的提6954
-
二维超导迈斯纳效应探测研究获进展04-29
-
研究发现笼目超导体中多重范霍夫奇04-29
-
二氧化碳加氢制高碳烯烃与航煤馏分04-29
-
靶向特定蛋白互作界面抑制乙肝病毒04-29
-
研究揭示内源信使调控膜损伤与细胞04-29
-
科学家绘制大脑星形胶质细胞转录因04-29
-
上海交大Bio-X研究院石毅与合04-29
-
天津音乐学院 23397

-
天津市南开大学 18416

-
EAGWA 8736

-
上海工程技术大学 18615

-
德捷会晤服务有限公司 18584

-
百奥泰国际会议(大连)有限公司 24340

-
FWQDS 2209

-
機械開發有限 2214

-
中国健康产业工作委员会 2491

-
二十一世纪公益基金会 24264

-
北京化工大学 24378

-
HKSME 23799

-
山东飞鲨国际展览有限公司 8441

-
中国助产士联盟 2638

-
涿州众智会务服务有限公司 8402

-
江西九江城际会议服务有限公司 2264

-
2017年第二届先进电子科学与技 24289

-
同济大学地下建筑与工程系 23417

-
PLA 91550 23709

-
志诚学术会务有限公司 24255





















109








































