当前位置:首页 >> 学术资讯 >> 科研信息

清华大学生物医学交叉研究院黄牛课题组合作突破万亿级别虚拟筛选核心技术瓶颈

2025/12/19

清华大学生物医学交叉研究院黄牛课题组合作突破万亿级别虚拟筛选核心技术瓶颈

文章导读
你是否想过,药物研发的“十年磨一剑”困局即将被打破?清华大学黄牛课题组联合多校团队,依托国产“神威·海洋之光”超级计算机,成功研发新一代虚拟筛选框架SWDOCKP²,实现每日1.9万亿次分子对接的惊人速度,将筛选规模推向覆盖整个人类蛋白质组的量级。通过多靶标并行、构象系综重构与跨平台兼容三大创新,该技术不仅将计算效率提升一个数量级,更将构建全球最大规模的蛋白质–配体预测数据库,为AI驱动的新药发现提供核心引擎。一场由算力引爆的药物研发革命,正在悄然降临。
— 内容由好学术AI分析文章内容生成,仅供参考。

 近日,清华大学生物医学交叉研究院黄牛课题组联合山东大学、清华大学和国家超级计算无锡中心相关团队协同攻关,成功构建新一代性能可移植虚拟筛选框架SWDOCKP²,在国产最新一代“神威”超级计算机“神威·海洋之光”上,实现每日1.9万亿个蛋白质–配体分子对接的理论计算速度,将基于结构的虚拟筛选能力推向接近整个人类蛋白质组的覆盖规模。相关研究成果在高性能计算领域顶级学术会议——2025全球超级计算大会(SC25)上报告,获得广泛关注。

现代小分子药物研发流程复杂,需历经靶点发现与验证、先导化合物发现与优化、临床前研究及多阶段临床试验等关键环节。整个研发周期长达十余年,投入动辄数十亿美元。与此同时,“按需合成”(make-on-demand)虚拟化合物库规模呈爆发式增长,从十年前的百万规模飙升至十亿甚至百亿级别,既极大拓展了可探索的化学空间,也带来了前所未有的计算压力。

面对超大规模虚拟筛选的技术难题,联合团队充分发挥超级计算机的极致并行能力,采用基于物理原理的“暴力筛选”策略,正面突破计算瓶颈。团队以虚拟筛选经典软件UCSF DOCK3.7为基础,针对“神威”超级计算机架构进行深度移植、重构与优化,开发全新虚拟筛选软件SWDOCK,能够在合理的时间内高效处理数十亿乃至上百亿小分子,加速先导化合物发现流程。

尽管SWDOCK已实现重大突破,但人类蛋白质组规模的虚拟筛选仍存在亟待解决的难题。一方面,UniProt与PDB等数据库已收录超过2万个人体蛋白质的序列和结构信息,AlphaFold等工具进一步拓展了蛋白质结构资源;而另一方面,化合物库规模指数级增长。据Pharos平台统计显示,仅3.4%的人类蛋白靶点拥有获批小分子药物,大量潜在治疗靶点亟待挖掘。

为此,联合团队持续攻关,推出虚拟筛选软件升级版本SWDOCKP²。2025年11月,在美国圣路易斯召开的SC25会议上,团队作专题报告“每日万亿配体:基于复合数据库优化和多靶点对接的高性能便携式虚拟筛选”(Trillion Ligands per Day: Performance-Portable Virtual Screening via Compound Database Optimization and Multi-Target Docking),系统介绍性能可移植的跨平台虚拟筛选框架SWDOCKP²。该框架可调度“神威·海洋之光”超算3900万个计算核心,同时对接8个蛋白质靶标结构,实现每日1.9万亿个蛋白质–配体对的理论筛选速度,较此前领先水平提升一个数量级。

通过整合小分子预采样构象系综数据库、高性能优化的SWDOCK与SWDOCKP²软件,以及“神威·海洋之光”的庞大算力,联合团队不仅实现了筛选性能的跨越式提升,更具备了构建规模高达10¹³个蛋白质——配体复合物预测构象数据集的能力——该数据集将成为同类公开资源中规模最大的数据库。基于此数据集训练的人工智能模型,有望突破药物研发中数据稀缺的核心瓶颈,推动AI驱动的配体预测、结构生成等前沿应用发展。

SWDOCKP²核心创新集中在三个方面。多靶标并行:能量网格融合结合三线性SIMD插值算法优化,即针对蛋白质组规模筛选中“多同源蛋白、多功能构象”的并行对接需求,SWDOCKP²创新提出“多靶标并行处理”策略。构象系综重构使能“早淘汰”机制:在配体小分子侧,团队对化合物构象系综数据库进行精细化重构。通过对构象基础单元(confs)的排序与归并,将对接打分阶段的迭代量降低近一半。跨平台兼容:从神威走向通用CPU。为打破平台壁垒,团队在SWDOCKP²中引入基于OpenMP的AthreadS兼容层,该设计使得针对神威架构优化的应用可快速移植至通用CPU平台,大幅提升代码性能可移植性,为开源学术社区贡献关键技术支撑。

山东大学软件学院研究员段晓辉、清华大学计算机系/北京生命科学研究所联合培养博士后沈成、北京生命科学研究所/清华大学生物医学交叉研究院2022级博士生陈高伟为论文共同第一作者。段晓辉、清华大学教授杨广文、山东大学教授刘卫国以及北京生命科学研究所/清华大学生物医学交叉研究院研究员黄牛为论文共同通讯作者。


版权声明:
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年智慧交通与检测技术国际会议(ITDT 2026)(2026-03-25)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-03-27)

2026年人工智能教育技术与数据科学国际学术会议(AIETDS 2026)(2026-03-27)

2026年IEEE第八届软件工程和计算机科学国际会议(CSECS 2026)(2026-04-17)

第十五届春季国际工程与技术大会 (SCET 2026)(2026-04-17)

2026年金融科技、创新与信息技术国际会议(2026-04-18)

2026年多尺度人工智能国际会议(MAI 2026)(2026-04-24)

第三届机器学习与智能计算国际学术会议(MLIC 2026)(2026-04-24)

2026 空天信息与产业创新国际学术研讨会暨第二届中国——塞尔维亚空天技术与产业应用研讨会(ISA3I 2026)(2026-04-24)

数字化教育系统与计算机科学国际学术会议(2026-04-24)

2026年艺术、设计与教育发展国际会议(ADED 2026)(2026-4-28)

2026公共管理、数理统计与经济分析国际会议(ICPMMSEA 2026)(2026-4-30)

2026年数据挖掘、生物信息学与健康统计国际会议(ICDMBHS 2026)(2026-3-26)

2026年电子信息工程、大数据与计算机国际会议(EIEBDC 2026)(2026-3-26)

2026年矿产资源、地质勘探与测绘技术国际会议(IMGET 2026)(2026-3-29)

2026年经济发展与文化产业发展国际会议(ICEDCID 2026)(2026-5-31)

2026年电气、电子与互联网技术国际会议(ICEEIT 2026)(2026-3-29)

2026年工业自动化、模式识别与控制工程国际会议(IAPRE 2026)(2026-3-26)

2026年新能源科学、生态经济与绿色发展国际会议(NESEEGD 2026)(2026-5-28)

2026机械仪表、自动化与机器视觉国际会议(ICMIAMV 2026)(2026-3-26)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

学术科研网址导航,430+站,定制学术书签

2026年第五届云计算、计算机视觉和图像处理.

2026年动力学与机械工程国际学术研讨会 (.

2026年IEEE第八届软件工程和计算机科学.

2026年第八届计算机图形学、图像与可视化国.

第八届信息科学、电气与自动化工程国际学术会议.

第三届机器学习与智能计算国际学术会议(MLI.

第六届自动化控制、算法与智能仿生国际学术会议.

2026 年第三届计算,机器学习与数据科学国.

第十三届先进制造技术与材料工程国际学术会议 .

第二届人工智能与产品设计国际学术会议 (AI.

2026年多尺度人工智能国际会议(MAI 2.

2026年量子计算与人工智能国际学术会议(I.

2026年第六届计算机视觉与模式分析国际学术.

第七届机械仪表与自动化国际学术会议(ICMI.

2026年第四届亚洲机器学习、算法与神经网络.

2026年第四届亚洲计算机视觉、图像处理与模.

2026年人工智能与数据挖掘国际学术会议(A.

2026年IEEE第七届计算,网络与物联网国.

2026年第五届网络、通信与信息技术国际会议.

2026年智能机器人与控制技术国际会议(CI.

2026年传感器技术、自动化与智能制造国际会.

2026年智能系统与计算国际会议 (ICIS.

2026年电子, 通信与计算机科学国际会议 .

2026年IEEE第三届先进机器人, 自动化.

2026年第七届控制, 机器人与智能系统国际.