清华大学数学中心包承龙团队“面向蛋白质结构解析的弱配对数据生成算法”入选2025年度医学人工智能代表性算法
2025/12/19
12月12日至14日,第四届医学人工智能大会(CMAIC 2025)在苏州举行。会上,清华大学丘成桐数学科学中心副教授包承龙、2024届博士毕业生郑棣瀚以及求真书院2023级博士生张慧共同提出的“面向蛋白质结构解析的弱配对数据生成算法”入选2025年度医学人工智能代表性算法。
包承龙(左一)、张慧(左二)接受证书颁授
冷冻电子显微镜(Cryo-EM)虽已成为解析生物大分子结构的核心技术,但在实际应用中,由于复杂的成像环境和极低的信噪比,获取高质量的干净-噪声配对训练数据始终是制约AI算法性能的瓶颈。针对这一挑战,包承龙团队构建了一套基于概率图模型的弱配对数据生成理论体系。团队首先提出LUD-VAE模型,在仅有干净域数据x与退化域数据y的边缘样本条件下,用概率图显式拆分结构/内容隐变量z与成像退化/噪声隐变量z_n,并在推断不变性假设下把ELBO写成无需成对样本也可计算的形式,从而学习联合分布并由条件分布p(y|x)把任意干净样本合成逼真的退化观测,批量产出可控的配对训练对。随后,SeNM-VAE面向少量配对+大量不配对的实际情况,采用层级隐变量与混合推断,将仅配对数据、仅干净数据、仅退化数据三类数据统一到同一变分目标中,既保留可解释的退化因子,又显著增强对真实复杂噪声分布的表达能力,生成更贴近实验的配对训练样本。
CryoPROS算法架构
在此基础上,团队进一步将弱配对数据生成模型应用于冷冻电镜领域长期存在的“优势取向”难题。由于生物样本易在气液界面以特定方向吸附,导致颗粒在冰层中排列产生严重偏倚,进而引发三维重构失真。团队研发了基于条件层次化变分自编码机(cHVAE)的CryoPROS算法,该算法能在超低信噪比及采样不均衡条件下,高效生成高保真度的辅助颗粒视图。这些生成数据有效补全了实验数据的采样缺口,团队据此提出了生成数据与实验数据联合优化的计算范式,显著降低了颗粒对齐误差并提升了结构解析的稳健性。
目前,该系列成果已在多套实验数据中验证了其有效性,以计算手段突破了传统方法依赖复杂生物样本优化或特殊数据收集策略的局限。CryoPROS算法已被由哈佛大学医学院管理的国际生物软件联盟SBGrid收录。
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年4月高录用检索快国际学术会 32
-
2026年第六届计算机、控制和机器人 102
-
2026资源、化学化工与应用材料国际 1529
-
2026年人工智能教育技术与数据科学 535
-
2026年图像处理与数字创意设计国际 1294
-
2026年机械工程,新能源与电气技术 5759
-
2026年材料科学、低碳技术与动力工 1546
-
2026年第二届无线与光通信国际会议 2307
-
2026年增材制造、3D打印与创新设 03-13
-
2026年车辆工程与新能源汽车国际会 03-13
-
2026年精密机械、仪器仪表与传感技 03-13
-
2026年机器人技术、智能装备与自动 03-13
-
2026年通信系统、网络与信号处理国 03-13
-
2026年智能制造、工业互联网与数字 03-13
-
2026年环境治理、生态修复与碳中和 03-13
-
2026年中科院期刊分区表(新锐10
-
2025年两院院士增选有效候选人4281
-
2025最新JCR分区及影响因子11266
-
好学术:科研网址导航|学术头条分5427
-
2025年国际期刊预警名单发布!5541
-
2025年中科院期刊分区表重磅发18728
-
中国科协《重要学术会议目录(2011157
-
吉林大学校长张希:学术会议中的提6696
-
中国科大研制出机器人灵巧手指尖六03-11
-
研究揭示遗传多样性如何重塑微生物03-11
-
研究发现双酰胺类杀虫剂影响蜜蜂蜂03-11
-
研究揭示聚焦光场中内禀自旋纹理03-11
-
新型磁流体机器人破解临床难题03-11
-
南京大学物理学院温锦生课题组在亚03-11
-
南京大学物理学院高力波、袁国文团03-11
-
上海广尧商务咨询有限公司 24448

-
International As 8331

-
中国化学化工行业中心 24384

-
国际工学技术出版协会 23291

-
大连理工大学土木水利学院结构工程 18344

-
世纪昌杰(北京)信息咨询有限公司 8595

-
中国化工学会培训中心 2279

-
江南大学食品学院 24441

-
北京彬丰文化有限公司 23244

-
International As 8298

-
英卓自动化技术有限公司 18138

-
香港中文大学 8203

-
WILL 2535

-
吉 林 大 学 18546

-
武汉科技大学 21394

-
无锡江南大学物联网学院技术中心 24651

-
上海拜尔德科技有限公司 24213

-
西安科技大学 8466

-
北京乾圆国学文化研究院 8146

-
长春理工大学 24220

















78















































