深圳国际研究生院肖喜团队在视频对抗攻击方面取得新进展
2024/04/18
近年来,我国短视频行业快速发展,一旦视频审核系统被恶意攻击,将造成不可估量的后果。因此,为了保护未成年人的身心健康,防止违法暴力视频恶意传播,避免政治敏感纠纷,严格审核用户上传的视频变得尤为重要。深度神经网络容易受到对抗攻击,通过给图像或视频叠加极小扰动就可以造成分类系统的误分类,研究视频分类系统的对抗攻击将有助于发现分类模型的脆弱性,并成为提高模型鲁棒性的重要基础。
学术界当前的对抗攻击方法均考虑范数限制的扰动,而这种方式需要消耗大量的查询次数,造成攻击过程中巨大的计算成本,所生成的对抗样本还会被去噪或对抗训练等方法有效防御,对于提高查询效率和抵抗防御能力的方法研究鲜少涉及。为此,清华大学深圳国际研究生院肖喜副教授团队提出了一种基于风格迁移的黑盒视频对抗攻击方法(StyleFool)来攻击视频分类系统。该方法采用语义不变的无限制扰动,旨在不改变视频语义信息的前提下,对抗扰动不做范数限制。
图1. StyleFool攻击示意图
传统的风格迁移基于艺术风格,导致生成的风格化图像与现实场景相差甚远。为解决这一问题,团队提出了一种风格图像选择方法,既能确保风格化视频保持高自然性,又能使得风格化视频可以移动甚至跨过决策边界。团队将输入视频进行视频风格迁移,并利用梯度估计的方法优化风格化视频,直到视频达到误分类的要求。与同类方法相比,StyleFool能够显著提高攻击的成功率并降低查询次数。同时,在抵御视频对抗防御方法的性能方面,由于StyleFool考虑了前后帧间一致性约束和语义不变的无限制扰动,它所生成的对抗样本可以轻松绕过先进的视频防御方法。StyleFool在不改变语义信息的情况下产生无限制的扰动,跳出了传统的范数限制攻击的束缚,并在攻击性能、抵御防御性能等方面优于现有对抗攻击方法,大大降低了攻击成本,是对抗攻击迈向非语义化的一大突破。
图2. 攻击结果对比
图3. 抵御对抗防御性能结果
上述研究成果以“StyleFool:通过风格迁移欺骗视频分类系统”(StyleFool: Fooling Video Classification Systems via Style Transfer)为题,被CCF-AIEEE安全与隐私研讨会(IEEE S&P 2023:IEEE Symposium on Security and Privacy,简称:IEEE S&P)录用。
论文第一作者为清华大学深圳国际研究生院人工智能项目2021级硕士生曹钰鑫,通讯作者为清华大学深圳国际研究生院肖喜副教授。该研究成果得到了国家自然科学基金、深圳基础研究项目和深研院海外科研合作基金的支持。
文章来源清华大学新闻,分享只为学术交流,如涉及侵权问题请联系我们,我们将及时修改或删除。
-
好学术:科研网址导航|学术头条分240
-
《时代技术》投稿全攻略:一位审稿254
-
2025年国际期刊预警名单发布!381
-
2025年中科院期刊分区表重磅发3185
-
中科院已正式发布2024年预警期612
-
2025年度国家自然科学基金项目531
-
中国科协《重要学术会议目录(201792
-
2024年国家自然科学基金项目评908
-
2024年JCR影响因子正式发布897
-
吉林大学校长张希:学术会议中的提1112
-
上海交大李丹课题组与合作者在AD06-16
-
上海交大申涛、陈向洋通过“光电合06-16
-
期刊投稿增刊问题:如何规避学术陷06-16
-
Applied Sciences06-16
-
Elsevier期刊proof阶06-16
-
河北百信米斯文化传播有限公司 7984
-
武汉理工大学湖北省产品创新管理研 20895
-
2016先进材料研究与应用国际会 1990
-
北京交通大学经济管理学院 23952
-
ghr 24035
-
中国电影基金会 21116
-
apise 22929
-
海南博鳌亚洲论坛大酒店 24041
-
北京联合大学 23940
-
拉萨旭日会议服务有限公司 20937
-
第一届中国上市公司年会组委会 17938
-
北京航空航天大学 22926
-
玩具有限公司 18018
-
科严文化 1901
-
上海鸿与智实业有限公司 23866
-
香港中文大学 23875
-
上海信世展览服务有限公司 7904
-
中国化 学会 21062
-
IETP 20810
-
湖南农业大学 18164