清华大学生物医学交叉研究院黄牛课题组合作突破万亿级别虚拟筛选核心技术瓶颈
2025/12/19
近日,清华大学生物医学交叉研究院黄牛课题组联合山东大学、清华大学和国家超级计算无锡中心相关团队协同攻关,成功构建新一代性能可移植虚拟筛选框架SWDOCKP²,在国产最新一代“神威”超级计算机“神威·海洋之光”上,实现每日1.9万亿个蛋白质–配体分子对接的理论计算速度,将基于结构的虚拟筛选能力推向接近整个人类蛋白质组的覆盖规模。相关研究成果在高性能计算领域顶级学术会议——2025全球超级计算大会(SC25)上报告,获得广泛关注。
现代小分子药物研发流程复杂,需历经靶点发现与验证、先导化合物发现与优化、临床前研究及多阶段临床试验等关键环节。整个研发周期长达十余年,投入动辄数十亿美元。与此同时,“按需合成”(make-on-demand)虚拟化合物库规模呈爆发式增长,从十年前的百万规模飙升至十亿甚至百亿级别,既极大拓展了可探索的化学空间,也带来了前所未有的计算压力。
面对超大规模虚拟筛选的技术难题,联合团队充分发挥超级计算机的极致并行能力,采用基于物理原理的“暴力筛选”策略,正面突破计算瓶颈。团队以虚拟筛选经典软件UCSF DOCK3.7为基础,针对“神威”超级计算机架构进行深度移植、重构与优化,开发全新虚拟筛选软件SWDOCK,能够在合理的时间内高效处理数十亿乃至上百亿小分子,加速先导化合物发现流程。
尽管SWDOCK已实现重大突破,但人类蛋白质组规模的虚拟筛选仍存在亟待解决的难题。一方面,UniProt与PDB等数据库已收录超过2万个人体蛋白质的序列和结构信息,AlphaFold等工具进一步拓展了蛋白质结构资源;而另一方面,化合物库规模指数级增长。据Pharos平台统计显示,仅3.4%的人类蛋白靶点拥有获批小分子药物,大量潜在治疗靶点亟待挖掘。
为此,联合团队持续攻关,推出虚拟筛选软件升级版本SWDOCKP²。2025年11月,在美国圣路易斯召开的SC25会议上,团队作专题报告“每日万亿配体:基于复合数据库优化和多靶点对接的高性能便携式虚拟筛选”(Trillion Ligands per Day: Performance-Portable Virtual Screening via Compound Database Optimization and Multi-Target Docking),系统介绍性能可移植的跨平台虚拟筛选框架SWDOCKP²。该框架可调度“神威·海洋之光”超算3900万个计算核心,同时对接8个蛋白质靶标结构,实现每日1.9万亿个蛋白质–配体对的理论筛选速度,较此前领先水平提升一个数量级。
通过整合小分子预采样构象系综数据库、高性能优化的SWDOCK与SWDOCKP²软件,以及“神威·海洋之光”的庞大算力,联合团队不仅实现了筛选性能的跨越式提升,更具备了构建规模高达10¹³个蛋白质——配体复合物预测构象数据集的能力——该数据集将成为同类公开资源中规模最大的数据库。基于此数据集训练的人工智能模型,有望突破药物研发中数据稀缺的核心瓶颈,推动AI驱动的配体预测、结构生成等前沿应用发展。
SWDOCKP²核心创新集中在三个方面。多靶标并行:能量网格融合结合三线性SIMD插值算法优化,即针对蛋白质组规模筛选中“多同源蛋白、多功能构象”的并行对接需求,SWDOCKP²创新提出“多靶标并行处理”策略。构象系综重构使能“早淘汰”机制:在配体小分子侧,团队对化合物构象系综数据库进行精细化重构。通过对构象基础单元(confs)的排序与归并,将对接打分阶段的迭代量降低近一半。跨平台兼容:从神威走向通用CPU。为打破平台壁垒,团队在SWDOCKP²中引入基于OpenMP的AthreadS兼容层,该设计使得针对神威架构优化的应用可快速移植至通用CPU平台,大幅提升代码性能可移植性,为开源学术社区贡献关键技术支撑。
山东大学软件学院研究员段晓辉、清华大学计算机系/北京生命科学研究所联合培养博士后沈成、北京生命科学研究所/清华大学生物医学交叉研究院2022级博士生陈高伟为论文共同第一作者。段晓辉、清华大学教授杨广文、山东大学教授刘卫国以及北京生命科学研究所/清华大学生物医学交叉研究院研究员黄牛为论文共同通讯作者。
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年4月高录用检索快国际学术会 32
-
2026年第六届计算机、控制和机器人 102
-
2026资源、化学化工与应用材料国际 1529
-
2026年人工智能教育技术与数据科学 535
-
2026年图像处理与数字创意设计国际 1294
-
2026年机械工程,新能源与电气技术 5759
-
2026年材料科学、低碳技术与动力工 1546
-
2026年第二届无线与光通信国际会议 2307
-
2026年增材制造、3D打印与创新设 03-13
-
2026年车辆工程与新能源汽车国际会 03-13
-
2026年精密机械、仪器仪表与传感技 03-13
-
2026年机器人技术、智能装备与自动 03-13
-
2026年通信系统、网络与信号处理国 03-13
-
2026年智能制造、工业互联网与数字 03-13
-
2026年环境治理、生态修复与碳中和 03-13
-
2026年中科院期刊分区表(新锐10
-
2025年两院院士增选有效候选人4281
-
2025最新JCR分区及影响因子11266
-
好学术:科研网址导航|学术头条分5427
-
2025年国际期刊预警名单发布!5541
-
2025年中科院期刊分区表重磅发18728
-
中国科协《重要学术会议目录(2011157
-
吉林大学校长张希:学术会议中的提6696
-
中国科大研制出机器人灵巧手指尖六03-11
-
研究揭示遗传多样性如何重塑微生物03-11
-
研究发现双酰胺类杀虫剂影响蜜蜂蜂03-11
-
研究揭示聚焦光场中内禀自旋纹理03-11
-
新型磁流体机器人破解临床难题03-11
-
南京大学物理学院温锦生课题组在亚03-11
-
南京大学物理学院高力波、袁国文团03-11
-
中国作物学会 21218

-
湖南诗和远方出版文化传媒有限公司 2242

-
江南大学食品学院 8467

-
南昌大学工程力学实验中心 23214

-
西安石油大学 21387

-
北京华林格环保袋制品有限公司 23207

-
百奥泰国际会议(大连)有限公司 2154

-
中国疾病预防控制中心性病控制中心 21235

-
GFFDSZ 24386

-
环境保护不核与辐射安全中心 21342

-
马德里自治大学 8345

-
四川普莱美生物科技集团有限公司 23250

-
北京中科材联光电技术发展中心 8384

-
上海市徐家汇 18668

-
哈尔滨工业大学 管理学院 23273

-
深圳鸿丰大酒店 18278

-
中国互联网经济学术峰会(2014 24348

-
云南中国国际旅行社 23192

-
江苏省医学会 21332

-
科技发展与服务中心 24330

















118














































