中国农业大学信电学院智能与系统安全实验室在人工智能安全领域研究取得重要进展
2026/01/08
近日,信息与电气工程学院智能与系统安全实验室研究论文《基于方向映射和对抗蒸馏的后门防御方法》(BeDKD: Backdoor Defense Based on Directional Mapping Module and Adversarial Knowledge Distillation)被人工智能领域顶级会议AAAI-2026(The 40th Annual AAAI Conference on Artificial Intelligence,CCF-A类会议论文)接收为主会Poster论文。
BeDKD方法架构图
随着深度神经网络在自然语言处理任务中的广泛应用,后门攻击已成为威胁模型安全的重要隐患。攻击者将隐蔽的触发模式植入少量数据中制作中毒的训练集。当模型正常训练后即自动植入特定模式的后门,使模型在面对特定输入时输出攻击者制定的回答,严重威胁智能系统的可信部署。现有的后门防御依赖大量干净数据来削弱后门,但通常难以处理残留的触发器效应,导致攻击成功率(ASR)持续偏高。因此,在实现后门防御与保持模型性能之间取得令人满意的平衡仍然是一个重大挑战。为解决上述问题,我们提出了一种基于动态知识蒸馏与定向映射调制器的后门防御框架,该方法仅需少量干净数据即可高效检测部分中毒数据,并在保持模型原有性能的同时,显著降低后门攻击成功率。
该论文第一作者为信电学院-智能与系统安全实验室2024级博士研究生吴政娴,文娟副教授和彭万里副教授为论文的通讯作者,实验室薛一鸣教授参与指导。论文成果受到国家自然科学基金项目(No.62272463、No.62402117)的资助,本研究工作得到中国农业大学校级高性能计算平台支持。
文章来源中国农业大学,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
2026年4月高录用检索快国际学术会 32
-
2026年第六届计算机、控制和机器人 102
-
2026资源、化学化工与应用材料国际 1529
-
2026年人工智能教育技术与数据科学 535
-
2026年图像处理与数字创意设计国际 1294
-
2026年机械工程,新能源与电气技术 5759
-
2026年材料科学、低碳技术与动力工 1546
-
2026年第二届无线与光通信国际会议 2307
-
2026年增材制造、3D打印与创新设 03-13
-
2026年车辆工程与新能源汽车国际会 03-13
-
2026年精密机械、仪器仪表与传感技 03-13
-
2026年机器人技术、智能装备与自动 03-13
-
2026年通信系统、网络与信号处理国 03-13
-
2026年智能制造、工业互联网与数字 03-13
-
2026年环境治理、生态修复与碳中和 03-13
-
2026年中科院期刊分区表(新锐10
-
2025年两院院士增选有效候选人4281
-
2025最新JCR分区及影响因子11266
-
好学术:科研网址导航|学术头条分5427
-
2025年国际期刊预警名单发布!5541
-
2025年中科院期刊分区表重磅发18728
-
中国科协《重要学术会议目录(2011157
-
吉林大学校长张希:学术会议中的提6696
-
中国科大研制出机器人灵巧手指尖六03-11
-
研究揭示遗传多样性如何重塑微生物03-11
-
研究发现双酰胺类杀虫剂影响蜜蜂蜂03-11
-
研究揭示聚焦光场中内禀自旋纹理03-11
-
新型磁流体机器人破解临床难题03-11
-
南京大学物理学院温锦生课题组在亚03-11
-
南京大学物理学院高力波、袁国文团03-11
-
河源职业技术学院 18349

-
上海市解剖学会 24256

-
上海新华投资发展有限公司 18401

-
延边大学 2283

-
APISE 26731

-
平顶山市九九房地产开发有限公司 18244

-
北京路川国际展览有限公司 2284

-
沈阳博思教育咨询有限公司 23171

-
恒信通讯公司 21363

-
武汉青博盛学术服务有限公司 23215

-
北京市比美特杂志 18128

-
百奥泰国际会议(大连)有限公司 23339

-
国际工程技术协会 18733

-
FF 8382

-
霍普金斯医药研究院 2339

-
CACRE 8557

-
上海盛杰企业管理咨询有限公司 8224

-
美国汽车工程师学会 24405

-
北京恒星瑞祥商贸有限公司 18163

-
2018 Internation 21393

















56














































