当前位置:首页 >> 学术资讯 >> 科研信息

清华大学计算机系孙茂松团队提出“密度法则”揭示大模型高效化发展内在趋势

2025/11/25

文章导读
清华大学孙茂松团队揭示大模型"密度法则":大模型最大"能力密度"每3.5个月翻一番,意味着每隔3.5个月,仅需一半参数量就能实现当前最优性能。这一发现犹如AI领域的"摩尔定律",不仅解释了大模型高效化发展的内在趋势,更预示着终端智能的巨大潜力,或将彻底改变我们对大模型发展的认知。
— 内容由好学术AI分析文章内容生成,仅供参考。

 近日,清华大学计算机系教授孙茂松、副教授刘知远、助理研究员韩旭指导的研究团队与大模型开源社区OpenBMB合作,提出大模型“密度法则”概念,指出大模型的最大“能力密度”随时间呈指数级增长:2023年2月至2025年4月,大模型最大“能力密度”约每3.5个月翻一番。这意味着每隔3.5个月,即可用一半参数量的模型实现当前最优性能。这一发现为理解大模型发展规律提供了新的视角,揭示了大模型高效化发展的内在趋势。

自2020年以来,大模型在尺度定律(Scaling Law)的指导下,不断增加训练数据和模型参数的规模,在自然语言理解、生成和推理任务上取得了显著的能力提升。这推动了一系列参数量超过千亿的超大规模模型的涌现。然而,随着训练规模的膨胀,大模型训练和推理成本急剧上升。一方面,公开可用数据的增长难以匹配模型需求的指数级扩张;另一方面,计算资源和能源消耗成为大模型训练与部署的瓶颈。为应对这些挑战,研究者亟需探索大模型的可持续发展路径。

针对这一关键发展诉求,研究团队从“摩尔定律”的密度提升规律中获得启发,基于“采用相同制造工艺、经过充分训练的不同尺寸模型,其‘能力密度’应当相同”的核心假设,提出大模型“能力密度”(Capability Density)概念,用于评估大模型单位参数内蕴含的智能水平。

为了量化“能力密度”,研究团队设计了相对“能力密度”的评估框架。首先选取一系列基准模型,通过拟合这些模型在不同参数规模下的性能表现,建立参数量与性能之间的映射关系。在此基础上,研究团队设定基准模型的“能力密度”为1,作为衡量其他模型“能力密度”的基线。给定目标模型的“能力密度”被定义为“同能力的基准模型参数量与目标模型参数量的比值”。

清华大学计算机系孙茂松团队提出“密度法则”揭示大模型高效化发展内在趋势

图1.“能力密度”计算方法示意图

团队对51个近年来发布的开源大模型进行了密度分析。结果显示,这些模型的最大“能力密度”随时间呈指数增长趋势,大约每过3.5个月,参数量减半的模型就能达到当前最先进模型的性能水平。这一规律揭示了大模型技术的飞速进展,以及在算力和算法的协同作用下,大模型能力的持续提升。

清华大学计算机系孙茂松团队提出“密度法则”揭示大模型高效化发展内在趋势

图2.开源大模型“能力密度”的变化趋势图

基于“密度法则”,研究团队得出了多项推论。首先,实现相同性能的大模型所需参数量和推理成本呈指数级下降,例如GPT-3.5级别的大模型每百万词元推理价格2022年年底为20美元,到2024年8月已经降至此前的266分之一。其次,自ChatGPT发布后,“能力密度”增长显著加速,越来越多的高效开源大模型进入大众视野。再次,“密度法则”与“摩尔定律”结合,揭示了终端智能的巨大潜力——芯片计算能力与大模型“能力密度”均呈指数级增长,终端设备将能够运行更高性能的大模型,推动边缘计算的普及。

该研究强调密度优化是大模型发展的关键路径,源于架构、算法和数据处理的进步。团队已发布了MiniCPM、MiniCPM-V/o、VoxCPM等一系列端侧高“能力密度”模型。系列模型获得学术和产业界广泛认可,相关技术论文发表于《自然·通讯》(Nature Communications、《自然·机器智能》(Nature Machine Intelligence等刊物。开源模型的10次发布,全部登顶HuggingFace、GitHub国际关注榜单,并入选HuggingFace 2024年度全球最受欢迎和下载开源模型榜单。

研究成果以“大模型密度法则”(Densing Law of LLMs)为题,于11月20日作为封面文章,发表于《自然》(Nature)子刊《自然·机器智能》(Nature Machine Intelligence)。

清华大学计算机系孙茂松团队提出“密度法则”揭示大模型高效化发展内在趋势

图3.研究成果作为封面文章发表于《自然·机器智能》

清华大学计算机系博士后肖朝军为论文第一作者,韩旭、刘知远、孙茂松为论文通讯作者。研究得到国家自然科学基金、北京市科技计划项目、博士后创新人才支持计划及清华大学“水木学者”计划的支持。


版权声明:
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

第七届计算机信息和大数据应用国际学术会议(CIBDA 2026)(2026-03-20)

2026年大数据与智能制造国际学术会议(BDIM 2026)(2026-03-20)

第六届智能制造与新材料国际学术会议(IMNM 2026)(2026-03-20)

2026年智慧交通与检测技术国际会议(ITDT 2026)(2026-03-25)

2026年第五届算法、计算和机器学习国际会议(CACML 2026)(2026-03-27)

2026年第六届智能机器人系统国际会议(ISoIRS 2026)(2026-03-27)

2026年人工智能教育技术与数据科学国际学术会议(AIETDS 2026)(2026-03-27)

第六届物联网与智慧城市国际学术会议(IoTSC 2026)(2026-03-27)

第十五届春季国际工程与技术大会 (SCET 2026)(2026-04-17)

2026年金融科技、创新与信息技术国际会议(2026-04-18)

2026目标检测、跟踪与精密仪器国际会议(TDTPI 2026)(2026-3-29)

2026年教育发展与艺术、设计国际会议(ICADED 2026)(2026-4-28)

2026年信息管理、网络安全与智能物联国际会议(ICIMNSII 2026)(2026-5-23)

2026年信息网络与无线通信国际学术会议(INWC 2026)(2026-3-21)

2026年结构力学、船舶与海洋工程国际会议(ICSME 2026)(2026-4-23)

2026年可持续发展与低碳经济国际会议(SDLCE 2026)(2026-4-20)

2026能源环境、先进材料与智能制造国际会议(EEAMIM 2026)(2026-4-25)

2026政治经济学、教育与法学国际会议(ICPEEL 2026)(2026-4-24)

2026公共艺术、设计与人文发展国际会议(ICPADHD 2026)(2026-3-24)

2026年环境修复、生态与水污染治理国际学术会议(EREWPC 2026)(2026-3-28)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。
综合推荐区

学术科研网址导航,430+站,定制学术书签

2026年IEEE第六届先进电气,电子与计算.

2026年第五届云计算、计算机视觉和图像处理.

2026年第五届亚洲算法、计算与机器学习国际.

2026年动力学与机械工程国际学术研讨会 (.

2026年IEEE第八届软件工程和计算机科学.

2026年第八届计算机图形学、图像与可视化国.

第八届信息科学、电气与自动化工程国际学术会议.

2026年多尺度人工智能国际会议(MAI 2.

第三届机器学习与智能计算国际学术会议(MLI.

第六届自动化控制、算法与智能仿生国际学术会议.

2026 年第三届计算,机器学习与数据科学国.

第十三届先进制造技术与材料工程国际学术会议 .

第二届人工智能与产品设计国际学术会议 (AI.

2026年量子计算与人工智能国际学术会议(I.

2026年第六届计算机视觉与模式分析国际学术.

第七届机械仪表与自动化国际学术会议(ICMI.

2026年第四届亚洲机器学习、算法与神经网络.

2026年第四届亚洲计算机视觉、图像处理与模.

2026年人工智能与数据挖掘国际学术会议(A.

2026年IEEE第七届计算,网络与物联网国.

2026年第五届网络、通信与信息技术国际会议.

2026年智能机器人与控制技术国际会议(CI.

2026年智能系统与计算国际会议 (ICIS.

2026年电子, 通信与计算机科学国际会议 .

2026年IEEE第三届先进机器人, 自动化.