清华大学数学中心包承龙团队“面向蛋白质结构解析的弱配对数据生成算法”入选2025年度医学人工智能代表性算法
2025/12/19
12月12日至14日,第四届医学人工智能大会(CMAIC 2025)在苏州举行。会上,清华大学丘成桐数学科学中心副教授包承龙、2024届博士毕业生郑棣瀚以及求真书院2023级博士生张慧共同提出的“面向蛋白质结构解析的弱配对数据生成算法”入选2025年度医学人工智能代表性算法。
包承龙(左一)、张慧(左二)接受证书颁授
冷冻电子显微镜(Cryo-EM)虽已成为解析生物大分子结构的核心技术,但在实际应用中,由于复杂的成像环境和极低的信噪比,获取高质量的干净-噪声配对训练数据始终是制约AI算法性能的瓶颈。针对这一挑战,包承龙团队构建了一套基于概率图模型的弱配对数据生成理论体系。团队首先提出LUD-VAE模型,在仅有干净域数据x与退化域数据y的边缘样本条件下,用概率图显式拆分结构/内容隐变量z与成像退化/噪声隐变量z_n,并在推断不变性假设下把ELBO写成无需成对样本也可计算的形式,从而学习联合分布并由条件分布p(y|x)把任意干净样本合成逼真的退化观测,批量产出可控的配对训练对。随后,SeNM-VAE面向少量配对+大量不配对的实际情况,采用层级隐变量与混合推断,将仅配对数据、仅干净数据、仅退化数据三类数据统一到同一变分目标中,既保留可解释的退化因子,又显著增强对真实复杂噪声分布的表达能力,生成更贴近实验的配对训练样本。
CryoPROS算法架构
在此基础上,团队进一步将弱配对数据生成模型应用于冷冻电镜领域长期存在的“优势取向”难题。由于生物样本易在气液界面以特定方向吸附,导致颗粒在冰层中排列产生严重偏倚,进而引发三维重构失真。团队研发了基于条件层次化变分自编码机(cHVAE)的CryoPROS算法,该算法能在超低信噪比及采样不均衡条件下,高效生成高保真度的辅助颗粒视图。这些生成数据有效补全了实验数据的采样缺口,团队据此提出了生成数据与实验数据联合优化的计算范式,显著降低了颗粒对齐误差并提升了结构解析的稳健性。
目前,该系列成果已在多套实验数据中验证了其有效性,以计算手段突破了传统方法依赖复杂生物样本优化或特殊数据收集策略的局限。CryoPROS算法已被由哈佛大学医学院管理的国际生物软件联盟SBGrid收录。
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年第五届机器学习、云计算与智 26
-
2026年第二届计算机视觉与机器学习 627
-
2026年6月优质国际学术会议推荐 1157
-
2026年智慧教育与数据挖掘国际学术 813
-
2026年第11届生物医学信号与图像 697
-
2026资源、化学化工与应用材料国际 2559
-
2026年图像处理与数字创意设计国际 2369
-
2026年机械工程,新能源与电气技术 6849
-
2026年材料科学、低碳技术与动力工 2524
-
2026年海洋科学、水利工程与环境管 06-18
-
2026年环境工程、材料科学与循环经 06-18
-
2026年航空动力、流体力学与热物理 06-18
-
2026年地球化学、核物理与地质学国 06-18
-
2026年微机电、物理学与建模仿真国 06-18
-
2026年机械工程、电子技术与自动化 06-18
-
2026 JCR影响因子正式发布272
-
中国科协发布2025年《重要学术858
-
2026年新锐分区(原中科院期刊5648
-
2025年两院院士增选有效候选人5280
-
好学术:科研网址导航|学术头条分6842
-
2025年国际期刊预警名单发布!7028
-
2025年中科院期刊分区表重磅发24788
-
吉林大学校长张希:学术会议中的提8093
-
研究表明太阳耀斑终端激波可作为地06-24
-
研究揭示藻—菌共生体系强化养殖尾06-24
-
双功能手性双核镍催化研究获进展06-24
-
研究发现银河系中心极端环境下大质06-24
-
废塑料升级利用研究取得进展06-24
-
硒太阳能电池研究取得进展06-24
-
南京大学王涛团队首次发现110亿06-24
-
上海光同投资管理有限公司 2528

-
中国商品学会-广东联络办 18601

-
上海中国汽车会议网 24576

-
中国兵工学会测试技术专业委员会 23500

-
ietp 21704

-
徽州文化园华商山庄酒店有限公司 18423

-
成都博展教育咨询有限公司 24568

-
中旅体育旅行社 2547

-
湖南红塬文化传播有限公司 21315

-
国际工学技术出版协会 23426

-
北京达华低碳院 2228

-
上海易标科技 18775

-
江苏如皋软件园 18333

-
飞鸟科技 21753

-
电子科技大学 2712

-
iceeac2017 24538

-
北京永康中医药研究院 2407

-
IETP 2402

-
上海电力学院 18631

-
中国中华医学会 21631





















134











































