国家企业信息网官网_百度收录提交网站后多久收录_百度小说排行榜完本_手机网站seo免费软件

Pytorch | 利用NI-FGSM针对CIFAR10上的ResNet分类器进行对抗攻击

CIFAR数据集
NI-FGSM介绍
- - 背景
  - 算法原理
NI-FGSM代码实现
- NI-FGSM算法实现
- 攻击效果
代码汇总
- nifgsm.py
- train.py
- advtest.py

本篇文章我们使用Pytorch实现NI-FGSM对CIFAR10上的ResNet分类器进行攻击.

CIFAR数据集

CIFAR-10数据集是由加拿大高级研究所（CIFAR）收集整理的用于图像识别研究的常用数据集，基本信息如下：

数据规模：该数据集包含60,000张彩色图像，分为10个不同的类别，每个类别有6,000张图像。通常将其中50,000张作为训练集，用于模型的训练；10,000张作为测试集，用于评估模型的性能。
图像尺寸：所有图像的尺寸均为32×32像素，这相对较小的尺寸使得模型在处理该数据集时能够相对快速地进行训练和推理，但也增加了图像分类的难度。
类别内容：涵盖了飞机（plane）、汽车（car）、鸟（bird）、猫（cat）、鹿（deer）、狗（dog）、青蛙（frog）、马（horse）、船（ship）、卡车（truck）这10个不同的类别，这些类别都是现实世界中常见的物体，具有一定的代表性。

下面是一些示例样本：

在这里插入图片描述

NI-FGSM介绍

NI-FGSM（Nesterov Iterative Fast Gradient Sign Method）即涅斯捷罗夫迭代快速梯度符号法，是一种在对抗攻击领域中对FGSM进行改进的迭代攻击算法，以下是其详细介绍：

背景

传统的FGSM及其一些迭代改进版本如I-FGSM等，在生成对抗样本时存在一些局限性，例如可能会在迭代过程中陷入局部最优，导致攻击效果不够理想或生成的对抗样本转移性较差。NI-FGSM借鉴了优化算法中的Nesterov加速梯度法的思想，旨在更有效地利用梯度信息，提高攻击的效率和效果。

算法原理

初始化：与其他对抗攻击方法类似，需要一个待攻击的目标模型 $f$ 、损失函数 $J$ 、原始图像 $x$ 及其对应的真实标签 $y$ ，同时还需要设定攻击步长 $\epsilon$ 、迭代次数 $T$ 等参数。
迭代更新：在每次迭代 $t$ 中，首先计算一个“前瞻”点 $x_{t}^{lookahead}$ ，它是基于当前迭代点 $x_{t}$ 和上一次迭代的梯度信息进行的一个预估更新点，公式为 $x_{t}^{lookahead}=x_{t}+\alpha \cdot \text{sign}\left(\nabla_{x} J\left(x_{t}, y\right)\right)$ ，其中 $\alpha$ 是一个类似于步长的参数。然后，计算在这个“前瞻”点处的损失梯度 $\nabla_{x} J\left(x_{t}^{lookahead}, y\right)$ ，并根据该梯度来更新当前迭代点 $x_{t}$ ，更新公式为 $x_{t + 1}=x_{t}+\epsilon \cdot \text{sign}\left(\nabla_{x} J\left(x_{t}^{lookahead}, y\right)\right)$ 。
投影操作：与其他对抗攻击方法一样，为了确保生成的对抗样本在合理的范围内，如像素值在 $[0, 1]$ 或 $[- 1, 1]$ 之间，需要对每次迭代更新后的样本进行投影操作。

NI-FGSM代码实现

NI-FGSM算法实现

import torch
import torch.nn as nndef NI_FGSM(model, criterion, original_images, labels, epsilon, num_iterations=10):"""NI-FGSM (Nesterov Iterative Fast Gradient Sign Method) 参数:- model: 要攻击的模型- criterion: 损失函数- original_images: 原始输入图像数据- labels: 对应的真实标签- epsilon: 最大扰动幅度- num_iterations: 迭代次数"""# alpha: 每次迭代的步长alpha = epsilon / num_iterations# 复制原始图像作为初始的对抗样本，并设置其需要计算梯度perturbed_images = original_images.clone().detach().requires_grad_(True)for _ in range(num_iterations):# 计算 "前瞻" 点（基于当前对抗样本和当前梯度方向预估的下一步位置）lookahead_images = perturbed_images + alpha * torch.sign(perturbed_images.grad.data) if perturbed_images.grad is not None else perturbed_images# 前向传播得到模型输出outputs = model(lookahead_images)# 计算损失loss = criterion(outputs, labels)# 清空模型之前的梯度信息model.zero_grad()# 反向传播计算梯度loss.backward()# 获取当前梯度数据data_grad = lookahead_images.grad.data if lookahead_images.grad is not None else torch.zeros_like(original_images)# 计算符号梯度sign_data_grad = torch.sign(data_grad)# 更新对抗样本perturbed_images = perturbed_images + epsilon * sign_data_grad# 投影操作，确保扰动后的图像仍在合理范围内（这里假设图像范围是[0, 1]）perturbed_images = torch.clamp(perturbed_images, original_images - epsilon, original_images + epsilon)perturbed_images = perturbed_images.detach().requires_grad_(True)return perturbed_images

攻击效果