上海交大人工智能学院曹钦翔副教授团队研究成果被TOPLAS接收：以指称语义推动可组合编译器验证_科研信息_学术资讯

当前位置：首页 >> 学术资讯 >> 科研信息

2026年传感器技术、自动化与智能制造国际会议（STAIM 2026）

第二届无人系统与技术国际学术会议（UST 2026）

2026年电气自动化、自主系统与智能制造国际学术会议（EASIM 2026）

第二届算法、机器学习、图像处理国际学术会议（AMLIP 2026）

第三届计算机应用与计算机图形学国际学术会议（CACG 2026）

2026年机械自动化与智能控制国际学术会议（IC-MAIC2026）

第二届商业生成式人工智能国际学术会议（GAIB 2026）

第二届激光、光学技术与应用国际学术会议（LOTA 2026）

第十一届材料科学与工程国际学术会议(ISAMSE 2026）

第二届导航、检测与控制国际学术会议（CNDC 2026)

第三届虚拟现实、图像和信号处理国际学术会议（VRISP 2026）

2026年智能医学与图像计算国际会议 (IMIC 2026)

第三届数字媒体、通信与信息系统国际学术会议（DMCIS 2026）

2026年智能机器人与控制技术国际会议（CIRCT 2026）

第十一届计算机与信息处理技术国际学术研讨会（ISCIPT 2026）

2026年IEEE计算机通信、信息系统与网络安全国际会议(CCISC 2026)

2026年第五届算法、数据挖掘和信息技术国际会议(ADMIT 2026)

2026年人工智能与机器人系统国际会议(ICAIRS 2026)

2026年IEEE人工智能、大数据与云计算国际会议 (AIBDCC 2026)

2026年IEEE第二届电力与可持续能源技术国际会议(PSETC 2026)

上海交大人工智能学院曹钦翔副教授团队研究成果被TOPLAS接收：以指称语义推动可组合编译器验证

2026/04/25

文章导读

当你写下几行代码按下编译按钮时，可曾想过：编译器本身真的值得无条件信任吗？在软件定义一切的时代，GCC、LLVM等基础工具的错误可能导致系统性崩溃，而现有的验证方法却深陷繁琐的数学证明泥潭，难以落地。上海交大团队这篇被顶级期刊TOPLAS收录的成果，打破了数十年来操作语义的垄断，用指称语义给出了一个惊人的“降维打击”方案。它如何将复杂的单步行为证明转化为直观的整体行为刻画，从而让编译器验证像搭积木一样自然组合？这一理论突破或许将彻底改变可信软件的构建逻辑。

— 内容由好学术AI分析文章内容生成，仅供参考。

近日，上海交通大学人工智能学院曹钦翔副教授与其博士生程章、硕士生吴基洋的研究工作《Denotation-based Compositional Compiler Verification》被程序语言领域顶级期刊ACM Transactions onProgramming Languages and Systems（TOPLAS）接收。TOPLAS是程序设计语言领域历史最为悠久的顶级权威期刊，每年接收的论文仅15-25篇，2021-2025年的5年内，以中国大陆科研院所作为第一单位发表的TOPLAS论文只有3篇。曹钦翔副教授的这一研究聚焦编译器正确性验证问题，提出了一种基于指称语义的全新验证框架。

研究背景

当你写下几行C++语言代码，轻轻按下编译按钮，你可曾想过：这个将高级语言转化为机器指令的编译器，真的值得无条件信任吗？在软件定义一切的时代，编译器作为基础软件的核心一环，其正确性关乎整个数字世界的根基。事实上，GCC、LLVM等现代编译器都是实施复杂变换、运用极致优化的复杂软件，其本身的错误难以避免。对编译器的正确性进行形式化验证，是解决这一问题的根本途径。所谓编译器的形式化验证，就是要用严格的经过机器检验的数学证明论证，对于任意一个合法的源程序（例如C/C++程序），只要经过该编译器编译，该程序与编译器生成的底层程序代码具有对应的整体行为。

长期以来，主流的编译器验证研究大多建立在小步操作语义（operational semantics）和模拟关系（simulation relation）之上。由于这一语义理论体系的基础在于定义程序的每一个单步行为而非整体行为，所以当人们基于这一理论论证两个程序（源代码与底层代码）整体行为的对应性时，就需要引入繁琐证明步骤和复杂的证明技巧。

指称语义（denotational semantics）则是侧重于定义程序整体行为的程序语义理论，其理应是用于完成编译器验证的有力工具，然而，先前的学者都未能成功将此理论应用于编译器验证等更具实践性的程序语言问题中去。本项研究克服了其中的理论挑战和形式化问题，基于指称语义理论提出了把“局部正确”自然、系统地推广为“整体正确”的新方法。

研究成果

全新的指称语义形式化方法：研究团队为编译器中的各种实用程序语言提出了一套系统且易于形式化语义刻画方案。他们将程序的语法成分映射到由若干简单集合构成的语义域之中，使其直接描述程序的整体行为，进而自然地刻画程序不同层次结构之间的组合关系。基于该方案，该研究团队引入了一种新型的语义链接算子来实现开放模块的语义链接，并从代数层面揭示了开放模块的语法链接和语义链接的等价性。例如，程序多模块编译正确性的关键结论就可以归结为以下的简单代数定理：

先前的研究中，人们只知道该结论在极简的作为理论研究prototype的命令式语言中成立，本项研究第一次将该结论拓展到C语言这样的实际编程语言中。

精化代数的可组合验证方法：该研究提出全新的精化代数概念抽象程序行为集合之间的精化关系。简单来说，该精化代数通过引入一个伽马函数以统一的方式来连接源程序与目标程序之间的行为集合，并且要求该伽马函数相对于语义组合算子满足一系列公理。该研究证实了各种实用的行为精化关系以及相应的语义组合算子是精化代数的实例。同时该研究设计了两个自动化证明策略：一个证明策略（ gamma_simpl）利用精化代数的公理将源程序与目标程序之间的行为精化规约为同一类行为集合之间的等价性；另一个证明策略（solvefix）利用KAT代数的公理自动验证行为集合算式之间的等价性。

实际应用

研究团队将该框架用于 CompCert 编译器前端以及若干典型优化的验证，并在若干命令式语言原型上完成了系统性形式化。结果表明，这一方法能够有效实现从子语句到语句、从函数到模块、再从模块到整个程序的逐层组合式验证。

该方法应用到CompCert的可组合验证示例

上图展示了该研究提出的验证方法在CompCert的Cshmgen编译阶段的一个应用示例。左侧定理展示了顺序语句的可组合证明，右侧定理展示了循环语句的可组合证明。该示例通过两个关键自动化证明策略gamma_simpl和solvefix完成证明，说明该研究提出的新方法可以轻量化地实现编译器的可组合验证。

该成果体现了人工智能学院在程序语言、形式化方法与可信软件方向上的持续积累，也为高可信编译器、关键基础软件验证以及自动化证明技术的发展提供了新的研究基础。面向未来，如何让复杂软件系统“可证明地正确”，是数字基础设施建设中的关键科学问题之一。

该论文的第一作者是上海交通大学博士生程章，通讯作者是曹钦翔副教授，文章的其他合作者有：上海交通大学硕士生吴基洋和北京大学助理教授王迪。

版权声明：
文章来源上海交大，分享只为学术交流，如涉及侵权问题请联系我们，我们将及时修改或删除。

清华大学李国良带领团队在众包数据管理系统方面取得进展

研究发现携带凋亡特异L2a/L2b RNA发挥抗病毒功能

宿主亲环蛋白助力非洲猪瘟病毒复制

清华大学材料学院宋成、潘峰团队实现手性反铁磁序的零场完全翻转

大连理工大学徐铁齐教授团队与海外合作者在可循环聚酯塑料研究方面取得进展

西安交大-西农联合团队提出空间转录组多模态融合智能解析框架S3RL

研究揭示地上地下“物候同步性”是土壤长期固碳的核心机制

清华大学心理学系张丹课题组揭示噪声下非母语言语理解神经机制

清华大学航院李晓雁课题组在二维材料扭转变形与能量理论研究方面取得重要进展