北京航空航天大学在深度学习处理器体系结构研究方面取得新进展
2024/04/12
![]() |
图1 支持量化训练的深度学习处理器架构Combricon-Q

图2 用卷积神经网络预测稀疏张量最优存储格式的方法SpTFS
在国家自然科学基金项目(批准号:61732002)资助下,北京航空航天大学钱德沛教授团队与中国科学院计算技术研究所陈天石研究员团队合作,在深度学习处理器体系结构研究方面取得新进展。
近年来深度学习研究取得了巨大进步,已经开始影响社会的生产和生活,与此同时,算力需求也呈指数上升趋势,现有的智能计算硬件难以同时满足高性能和高能效的需求。尽管包括稀疏化和低比特量化在内的多种非精确计算方法等已被证明可以降低神经网络的理论计算量,但现有的计算硬件无法充分发挥上述算法的优势。因此,如何从处理器体系结构、算法、软件等多个层面系统地支持非精确性优化方法,理解非精确计算过程与结果准确性的关系,解决深度学习处理器性能和能效两者的矛盾,是亟待解决的问题。
钱德沛和陈天石团队以充分利用深度学习对非精确计算的容忍特性为核心思想,围绕深度学习处理器设计,跨越多个系统层次开展了研究。提出了一种用于深度学习处理器的领域专用指令集架构,集成了标量、向量、矩阵、逻辑、数据传输和控制指令以及支持非精确计算的扩展指令,为微体系结构明确了设计目标。基于此,团队取得以下进展:
(1)提出了一系列支持稀疏神经网络的深度学习处理器体系结构Cambricon-X、Cambricon-S和Cambricon-SE,能够有效利用神经网络中的权值稀疏性和神经元稀疏性,提升神经网络算法的计算效率。与早期的深度学习处理器DianNao相比,最新的Cambricon-SE处理器在性能和能效方面分别提高了10倍和20倍。团队提出的支持量化训练的处理器Cambricon-Q,可以以微小的精度损失为代价达到相比GPU的 4.2倍性能提升和相比TPU的1.7倍性能提升,如图1所示。
(2)为了解决算法到硬件的适配问题,提出了一种支持多种深度学习处理器体系结构的编译技术,可以通过张量抽象机抽象出多种深度学习处理器的共同架构特征。为了从工具角度支持非精确计算,提出了一种张量计算冗余零值分析工具ZeroSpy,可以有效识别由于数据结构使用不当和无用计算而造成的冗余零并指导相应的代码优化。提出了一种利用神经网络预测不同硬件平台下稀疏张量最优存储格式的方法SpTFS,如图2所示。为了从基础算法层面支持非精确计算,提出了一种可分解Winograd卷积计算轻量化算法,可突破原始算法对卷积核大小的限制,提高卷积计算效率。
项目研究工作覆盖了指令集、微体系结构、基础算法库、系统软件和应用等多个层次,探索了从支持非精确计算的角度同时提升深度学习处理器性能和能效的新途径,形成了非精确深度学习处理器体系结构的系统性方法,有助于进一步推动智能芯片研究和应用。
项目研究成果发表在多个计算机体系结构领域重要会议和期刊,包括国际计算机体系结构会议(International Symposium on Computer Architecture)、国际微体系结构会议(The International Symposium on Microarchitecture)、国际超算大会(The International Conference for High Performance Computing, Networking, Storage, and Analysis)、《美国计算机学会·计算机系统汇刊》(ACM Transactions on Computer Systems)、《电气电子工程师协会·计算机汇刊》(IEEE Transactions on Computers)等。
文章来源国家自然科学基金委员会,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年1月高含金量国际学术会议合 12-12
-
第四届金融科技与商业分析国际学术会议 686
-
2026年第十一届复合材料与材料工程 1453
-
2025年机器视觉、智能成像与模式识 2126
-
2025年智能光子学与应用技术国际学 3284
-
2026年机械工程,新能源与电气技术 3476
-
2025年计算机科学、图像分析与信号 3917
-
2025年材料化学与燃料电池技术国际 3633
-
2026年交通数字化、人工智能与韧性 12-19
-
2026年社会文化与公共管理国际会议 12-19
-
2026年人文地理与语言研究国际会议 12-19
-
2026年社会发展与经济发展国际会议 12-19
-
2026年光伏材料、光电转换与可再生 12-19
-
2026年可持续发展与数字化社会国际 12-19
-
2026年管理科学、语言与教育国际会 12-19
-
2025年两院院士增选有效候选人2672
-
2025最新JCR分区及影响因子7552
-
好学术:科研网址导航|学术头条分3540
-
2025年国际期刊预警名单发布!3510
-
2025年中科院期刊分区表重磅发13412
-
中国科协《重要学术会议目录(207866
-
吉林大学校长张希:学术会议中的提4517
-
中国科大提出电化学一体化驱动策12-19
-
中国科大实现电泵浦片上集成高亮度12-19
-
西北农林科技大学【陕西新闻联播】12-19
-
中国科大实现片上非相干泵浦高品质12-19
-
中国科大中性原子量子计算研究成果12-19
-
炔烃远端C-O键的不对称活化转化12-19
-
研究揭示叶片内生真菌分子功能多样12-19
-
科研人员提出柑橘黄龙病防控新策略12-19
-
WCNA2017组委会 21289

-
点石设计公司 2190

-
珠海格力电器股份有限公司 18010

-
重庆大学 23178

-
广州雅程整合传播有限公司 18129

-
实姓名实姓名实姓名 23028

-
WILL 7993

-
武汉海讯科技会务有限公司 18505

-
apise 23119

-
中南大学铁道学院 2325

-
武汉赛思会务有限公司 24035

-
江苏明天会务服务有限公司 18291

-
安徽中设国际会展 8117

-
重庆沛普文化交流服务有限公司 18197

-
CEWQC 24347

-
全国高科技农业循环产业发展中心 2209

-
中国稀土学会 21619

-
河南工业大学 23184

-
第四军医大学西京医院放疗科 18305

-
北京工业大学 23276

















667










































