清华大学团队联合研发AI驱动的超高通量药物虚拟筛选平台DrugCLIP
2026/01/14
目前,人类对靶向药物的探索约覆盖人体全部可成药靶点的10%。面对数以万计的潜在靶点,如何在广阔的化学空间中,快速筛选苗头化合物,已成为该领域研究的瓶颈。清华大学智能产业研究院教授(AIR)兰艳艳联合生命学院、化学系团队创新研发AI驱动的超高通量药物虚拟筛选平台DrugCLIP,比传统方法实现了百万倍提升,在预测准确率上也取得显著突破。依托该平台,团队首次完成了覆盖人类基因组规模的药物虚拟筛选,为创新药物发现带来了新的可能性。
图1.DrugCLIP主页
目前,受限于自动移液工作站、超级计算机等工具的高昂成本,绝大多数潜在靶点和化合物仍未被充分探索。人类基因组编码2万余个蛋白,现有蛋白靶点开发只覆盖其中小部分。若使用当前最先进的分子对接工具筛选1万个蛋白靶点,假设每个靶点面对109个候选分子,则需完成约1013次蛋白-配体打分,一台计算机即使日夜不休,也需数百年才可完成计算。DrugCLIP将该计算量缩短为一台计算节点一天的机时,首次打通了从蛋白结构预测到药物发现的关键通道,实现覆盖人类基因组规模的虚拟筛选。
硬件方面,基于128核中央处理器(CPU)和8张图形处理器(GPU)的计算节点,DrugCLIP即可实现万亿级蛋白口袋小分子对打分日吞吐能力,其核心突破在于将传统的分子对接转化为蛋白口袋与小分子在向量空间中的高效语义检索,较分子对接等传统方法的速度提升百万倍。
图2.基于DrugCLIP的超高速全基因组虚拟筛选
在生命学院闫创业团队协作下,DrugCLIP模型从160万个候选分子中,为去甲肾上腺素转运体(NET)靶点筛选出约100个高评分分子。同位素配体转运实验检测显示,其中15%为有效抑制剂,其中12个分子结合能力优于现有抗抑郁药物安非他酮。
化学系刘磊团队通过DrugCLIP针对E3泛素连接酶TRIP12(thyroid hormone receptor interactor 12)进行了虚拟筛选与实验验证。通过使用TRIP12的AlphaFold结构,DrugCLIP模型从160万个候选分子中高通量筛选出约50个高评分分子。实验证实,其中10个分子与TRIP12有结合能力,两个亲和力较高的分子也对TRIP12的泛素连接酶活性有一定抑制活性。
依托DrugCLIP,联合团队首次完成了人类基因组规模的虚拟筛选项目,可覆盖约1万个蛋白靶点、2万个蛋白口袋,分析筛选超过5亿个类药小分子,总共富集出超过200万个潜在活性分子,构建了目前已知最大规模的蛋白-配体筛选数据库,该数据库已免费面向全球科研社区开放,为基础研究与早期药物发现提供了强大数据支持。
同时,筛选服务平台也已同步上线,支持对用户上传的靶点和蛋白口袋m进行定制化筛选。截至论文发表,半年来该平台已经累计服务1400余名用户完成了1.35万余次筛选。
图3.人类基因组规模筛选项目覆盖的蛋白数目与现有数据库对比(左:覆盖的靶蛋白空间,使用ESM1b编码并进行t-SNE降维可视化;右:覆盖的UniProt ID数量)
未来,DrugCLIP将与科研与产业生态伙伴深度合作,在抗癌、传染病、罕见病等方向加速新靶点与First-in-class药物(首创新药)的发现。
研究成果以“深度对比学习实现基因组级别药物虚拟筛选”(Deep contrastive learning enables genome-wide virtual screening)为题,于北京时间1月9日在线发表于《科学》(Science)。
清华大学智能产业研究院(AIR)博士后贾寅君、计算机系2024级博士生高博文、生命学院博士后谭佳鑫、化学系博士后郑济青以及智能产业研究院(AIR)博士后洪鑫为论文共同第一作者;智能产业研究院(AIR)教授兰艳艳,生命学院副教授张伟、闫创业,化学系教授刘磊为论文共同通讯作者。
研究得到国家重点研发计划、国家自然科学基金委、新基石研究基金等项目的支持,以及清华大学无锡应用技术研究院智能产业创新中心、北京智源人工智能研究院、清华-IDG/麦戈文脑科学研究院、膜生物学全国重点实验室和北京结构高精尖中心等机构的支持。
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026资源、化学化工与应用材料国际 218
-
2026年智能制造与光学传感技术国际 235
-
2026年2月高录用率国际学术会议列 37
-
2026年第六届土木工程与建筑国际会 841
-
2026年图像处理与数字创意设计国际 90
-
2026年机械工程,新能源与电气技术 4589
-
2026年材料科学、低碳技术与动力工 307
-
2026年第二届无线与光通信国际会议 1149
-
2026 9th Internati 01-15
-
2026年土木工程智能建造与基础设施 01-15
-
2026年环境工程、生态修复与可持续 01-15
-
2026年数字健康、远程医疗与智能诊 01-15
-
2026年金融科技、智能风控与数字资 01-15
-
2026年智慧农业、食品工程与供应链 01-15
-
2026年计算建模、数学与大数据国际 01-15
-
2025年两院院士增选有效候选人2854
-
2025最新JCR分区及影响因子7970
-
好学术:科研网址导航|学术头条分3741
-
2025年国际期刊预警名单发布!3763
-
2025年中科院期刊分区表重磅发13927
-
中国科协《重要学术会议目录(208283
-
吉林大学校长张希:学术会议中的提4800
-
清华大学物理系徐勇、段文晖研究组12-25
-
清华大学-上汽通用五菱汽车人工智12-25
-
参加学术会议学术蝗虫_参加学术会12-25
-
参加学术会议图片_参加学术会议需12-25
-
参加学术会议投稿邮件_参加学术会12-25
-
参加学术会议文学_参加学术会议有12-25
-
参加学术会议文案_参加学术会议文12-25
-
参加学术会议违法_参加学术会议违12-25
-
中科院合肥智能所 18231

-
深圳中亚会议公司 23226

-
中国重庆大学 21407

-
青穆文化传播有限公司 23142

-
中南大学商学院会计系 18382

-
广州讴歌文化传播有限公司 18166

-
四川中烟长城雪茄厂 2138

-
未来之星 21329

-
International As 24295

-
安徽理工大学能源与安全学院 18481

-
西安石油大学 21342

-
北京艾尚国际展览有限公司 8415

-
浙江师范大学 2335

-
HKSME 23281

-
CIENC(beijing) 18324

-
北京大学计算机系 18429

-
北京中材企联新材料技术研究中心 21131

-
中国环境科学学会 8230

-
北京耐思国际会展服务有限公司 24111

-
北京中经蓝山文化交流有限公司 18228

















44













































