当前位置:首页 >> 学术资讯 >> 科研信息

中国农业大学信电学院智能与系统安全实验室在人工智能安全领域研究取得重要进展

2026/01/08

文章导读
还在为AI模型中的隐藏后门攻击而焦虑?中国农业大学刚刚在顶级人工智能会议AAAI-2026上提出了革命性解决方案!面对现有防御技术难以平衡安全性与性能的困境,这项突破性研究仅需少量干净数据,就能精准识别中毒样本,将攻击成功率降至新低。想知道他们如何通过动态知识蒸馏与定向映射技术,为AI系统筑起坚固防线?这篇被国际顶会收录的论文正在重新定义人工智能安全标准。
— 内容由好学术AI分析文章内容生成,仅供参考。

近日,信息与电气工程学院智能与系统安全实验室研究论文《基于方向映射和对抗蒸馏的后门防御方法》(BeDKD: Backdoor Defense Based on Directional Mapping Module and Adversarial Knowledge Distillation)被人工智能领域顶级会议AAAI-2026(The 40th Annual AAAI Conference on Artificial Intelligence,CCF-A类会议论文)接收为主会Poster论文。

中国农业大学信电学院智能与系统安全实验室在人工智能安全领域研究取得重要进展

BeDKD方法架构图

随着深度神经网络在自然语言处理任务中的广泛应用,后门攻击已成为威胁模型安全的重要隐患。攻击者将隐蔽的触发模式植入少量数据中制作中毒的训练集。当模型正常训练后即自动植入特定模式的后门,使模型在面对特定输入时输出攻击者制定的回答,严重威胁智能系统的可信部署。现有的后门防御依赖大量干净数据来削弱后门,但通常难以处理残留的触发器效应,导致攻击成功率(ASR)持续偏高。因此,在实现后门防御与保持模型性能之间取得令人满意的平衡仍然是一个重大挑战。为解决上述问题,我们提出了一种基于动态知识蒸馏与定向映射调制器的后门防御框架,该方法仅需少量干净数据即可高效检测部分中毒数据,并在保持模型原有性能的同时,显著降低后门攻击成功率。

该论文第一作者为信电学院-智能与系统安全实验室2024级博士研究生吴政娴,文娟副教授和彭万里副教授为论文的通讯作者,实验室薛一鸣教授参与指导。论文成果受到国家自然科学基金项目(No.62272463、No.62402117)的资助,本研究工作得到中国农业大学校级高性能计算平台支持。


版权声明:
文章来源中国农业大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。

相关学术资讯
近期会议

2026年数学、人工智能与金融学国际会议(ICMAIF 2026(2026-01-06)

第七届公共卫生与预防医学国际研讨会(PHPM 2026)(2026-01-09)

第六届能源、电力与先进热力系统国际学术会议(EPATS 2026)(2026-02-06)

第七届大数据与信息化教育国际学术会议(ICBDIE 2026)(2026-02-06)

第六届计算机网络安全与软件工程国际学术会议(CNSSE 2026)(2026-02-06)

第五届社会科学与人文艺术国际学术会议 (SSHA 2026)(2026-02-06)

第二届应用物理与材料科学国际学术研讨会(ICAPMS 2026)(2026-02-06)

2026年航空航天科学与天文学国际会议(ICASA2026)(2026-02-09)

2026年矿产资源、勘探技术与地球科学国际会议(ICRTS 2026)(2026-02-28)

2026年社会心理学、行为科学与教育国际会议(SPBSE 2026)(2026-03-09)

2026电力系统、电网与电气工程国际会议(PSGEE 2026)(2026-1-30)

2026年水利、土木工程与施工技术国际会议(WRCECT 2026)(2026-3-30)

2026年船舶制造、航海技术与动力机械国际会议(ISMTPM 2026)(2026-1-31)

2026年计算机算法与网络应用国际会议(ICCANA 2026)(2026-1-30)

2026年矿产资源,环境与勘探技术国际会议(MREET 2026)(2026-1-30)

2026年国际关系、文化与法律国际会议(ICIRCL 2026)(2026-1-30)

2026年控制工程、仪器科学与自动化工程国际会议(ICCEISAE 2026)(2026-1-30)

2026年新能源技术、储能与材料科学国际会议(NETESMS 2026)(2026-1-30)

2026数学、力学与信息系统国际会议(ICMMIS 2026)(2026-1-30)

2026年数据驱动网络、云计算与大数据国际会议(DDNCCBD 2026)(2026-1-30)

小贴士:学术会议云是学术会议查询检索的第三方门户网站。它是会议组织发布会议信息、众多学术爱好者参加会议、找会议的双向交流平台。它可提供国内外学术会议信息预报、分类检索、在线报名、论文征集、资料发布以及了解学术资讯,查找会服机构等服务,支持PC、微信、APP,三媒联动。