对抗攻击的防御模型显著增长,但缺乏实用的评估方法阻碍了进展。评估可以定义为:在给定迭代次数和测试数据集的情况下寻找防御模型的鲁棒性下限。一种使用的评估方法应该是方便的(即无参数的)、高效的(更少的迭代)、可靠的(接近稳健性的下限),针对这个目标,我们提出了一种无参数自适应自动攻击()。自适应自动攻击由自适应方向初始化(ADI )和在线统计丢弃策略(OSD)组成。ADI策略可以加快评估速度,DSD可以自动识别和丢弃难以攻击的图像。
c-class分类器f,模型预测被计算为:

本文主要考虑无目标攻击,约束优化问题定义为:

PGD在迭代t次时的梯度为:

起点:

PGD 通过迭代生成对抗样本:

为了进一步提高起点多样性,ODI通过最大化输出空间的变化来寻找起点,从均匀分布中抽样随机多样化方向
。
首先计算归一化扰动向量:
通过以下迭代更新使输出变化最大来生成起始点:

次迭代之后,即初始化迭代次数,ODI获得起点:

尽管使用了大量的迭代,但是大多数现有方法通常高估了鲁棒性,这有两个潜在的原因:
自适应方向初始化来生成比随机抽样更好的方法来初始化攻击,ADI有两个步骤:
ADI首先采用随机抽样产生多样化方向
然后ADI使用等式(8)获得的起点来初始化PGD攻击,并且使用PGD攻击获得对抗样本
ADI采用W中求和的符号作为先验知识来生成自适应方向
:

是生成的
的先验知识,即
的第c维。
ADI将的第y个分量生成为:

为了改善的有效性,ADI随机选择一个标签
,以跟随
的符号

设置,自适应方向
的其余尺寸,ADI将其计算为:

鉴于迭代次数接近鲁棒性下限,本文提出了一种新的迭代策略----基于在线统计丢弃策略OSD
OSD采用损失值来区分难攻击图像和易攻击图像,OSD首先按照每次重新启动开始时的相应损失值按降序对测试图像进行排序,然后丢弃难以攻击的图像,即停止具有较小损失值的扰动图像。特别是,给定初始丢弃率和丢弃增量
,第r次重新启动时的丢弃率公式如下:

对于其余的图像,OSD为它们分配相同的迭代次数,也就是说,为了进一步提高攻击成功率,OSD在重新启动r时要比之前的重新启动时为剩余图像分配更多迭代。具体来说,给定攻击的初始迭代次数和迭代增量
,第r次重新启动时攻击的迭代次数计算为:

与自然迭代策略相比,OSD通过自动识别和放弃难以攻击的图像,充分利用了迭代的预算次数。此外,通过在不同重启时为攻击分配不同次数的迭代,OSD有助于进一步接近对抗性鲁棒性的下限。
将自适应方向初始化策略与在线统计丢弃策略结合起来,就形成了自适应自动攻击策略,这个策略有以下优点:
