清华大学交叉信息院张景昭团队科研成果获得COLT 2025学生论文奖
2025/07/10
近日,清华大学交叉信息院博士生陈乐偲和助理教授张景昭的科研成果“求解二阶Oracle复杂度的凹凸问题”(Solving Convex-Concave Problems withSecond-Order Oracle Complexity)在机器学习理论的国际顶级会议Conference on Learning Theory(COLT)2025上获得最佳学生论文奖。
陈乐偲在会上宣读论文
该工作聚焦数值优化领域的经典问题极小极大优化问题进行探索。该问题考虑计算一个凸-凹函数的鞍点,其源自于博弈论中寻找双玩家零和博弈的Nash均衡点问题,并且在带约束优化的拉格朗日(Lagrange)函数求解问题、分布鲁棒优化问题以及机器学习中的对抗训练问题等场景中都具有重要应用。
作为数值优化的经典问题,极小极大优化问题的研究具有悠久的历史。早在1976年俄国数学家Korpelevich就提出了被沿用至今的外梯度法,并且证明该算法可以在梯度查询内找到一个ϵ-鞍点。该算法也被后续工作证明在所有一阶算法类(也即利用梯度信息的算法类)中是最优的。2012年,Monteiro和Svaiter将Korpelevich的外梯度法推广到了二阶算法,即同时利用梯度和Hessian矩阵信息的算法类(也被称为牛顿类算法),并且得到了
的迭代复杂度上界。从2012年以后,研究者们提出了大量类似的算法,并且也将算法推广到使用P阶导数信息的设定,但是对于p=2的情况都只能得到相同的
的保证。由于该问题超过十年没有突破,机器学习领域泰斗Michael I. Jordan以及优化领域泰斗Yurii Nesterov都分别在他们2022-2023年的文章中推断该问题的最优二阶复杂度就是
。
然而,该研究打破了领域中人们的普遍认知,提出了一个新的算法,并证明其可以在的二阶复杂度内寻找到任意光滑凸-凹函数的ϵ-鞍点,其中
符号隐藏了复杂度中可忽略不计的对数因子。该算法巧妙地对于极小化变量以及极大化变量同时使用Monteiro和Svaiter在2013年所提出的高阶动量加速技术,将原问题归约为求解
个条件数为常数的极小极大优化子问题,最终调用任意一个已知的收敛算法求解上述子问题都可以达到该研究的新结果。
尽管外梯度法很早就被证明是最优的一阶算法,但张景昭研究团队的本突破性成果证明了在更高阶(p≥2)的设定下,实际上存在着比外梯度法更优的算法。该结果刷新了人们对该经典问题复杂度的认知,对于启发更快速的算法设计具有重大意义。
论文第一作者为清华大学交叉信息院2023级博士生陈乐偲,论文通讯作者为交叉信息院助理教授张景昭,其他作者为香港中文大学2022级博士生刘程畅以及复旦大学副研究员罗珞。
文章来源清华大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2025年两院院士增选有效候选人116
-
2025最新JCR分区及影响因子2461
-
好学术:科研网址导航|学术头条分641
-
2025年国际期刊预警名单发布!770
-
2025年中科院期刊分区表重磅发4295
-
中国科协《重要学术会议目录(202964
-
吉林大学校长张希:学术会议中的提1619
-
2025年国自然正式放榜!08-27
-
SCI论文中的数据引用,如何避免08-15
-
EI核心期刊和普通期刊有什么本质08-15
-
国内期刊EI与核心有什么区别?三08-15
-
怎么查找前几年的EI期刊源?科研08-15
-
如何准确验证论文是否被SCI收录08-15
-
机械类EI期刊投稿全攻略:从实验08-15
-
SCI论文DOI号查找全攻略:学08-15
-
厦门大学信息科学技术学院 21120
-
长白山明华会议 21144
-
浙江师范大学 2169
-
中国化工信息中心 2160
-
东华大学 21012
-
湖北省武汉大学 18041
-
浙江大学管理学院 23232
-
北京沃特咨询有限公司 20988
-
西安财经学院 23985
-
湖北荆州沙市碧波路 21035
-
浙江大学电气工程学院 2009
-
公共汽车公司 18095
-
上海大学 21013
-
深圳市清新电源研究院 21123
-
上海容智能源科技有限公司 23017
-
上海维程计算机信息技术公司 23113
-
WILL 8033
-
个人 24017
-
中国发展战略学研究会企业战略专业 2151
-
WILL 7934