您的位置:首页 > 游戏 > 手游 > 大连招投标网官网_网站外链建设可以提升网站权重对吗_营销推广的工具有哪些_潮州seo

大连招投标网官网_网站外链建设可以提升网站权重对吗_营销推广的工具有哪些_潮州seo

2025/4/18 9:21:52 来源:https://blog.csdn.net/m0_74824642/article/details/146998808  浏览:    关键词:大连招投标网官网_网站外链建设可以提升网站权重对吗_营销推广的工具有哪些_潮州seo
大连招投标网官网_网站外链建设可以提升网站权重对吗_营销推广的工具有哪些_潮州seo

本文将通过代码实战,详细讲解如何使用 PyTorch 和 VGG11 模型在 Fashion-MNIST 数据集上进行图像分类任务。代码包含数据预处理、模型定义、训练与评估全流程,并附上训练结果的可视化图表。所有代码可直接复现,适合深度学习初学者和进阶开发者参考。


1. 环境准备

确保已安装以下库:

pip install torch torchvision d2l
2. 代码实现
2.1 导入依赖库
from d2l import torch as d2l
from torchvision import models, transforms
import torch
2.2 数据预处理

由于VGG11默认接受RGB三通道输入,需将Fashion-MNIST的灰度图转换为3通道:

# 定义数据预处理流程
transform = transforms.Compose([transforms.Resize(224),                # 调整图像尺寸为224x224transforms.Grayscale(num_output_channels=3),  # 单通道转三通道transforms.ToTensor()                   # 转为Tensor格式
])
2.3 加载数据集
# 加载Fashion-MNIST数据集并应用预处理
batch_size = 64 * 3  # 增大批大小以利用GPU并行计算
train_data, test_data = d2l.load_data_fashion_mnist(batch_size, resize=224)# 替换原始数据集的数据增强方法
train_data.dataset.transform = transform
test_data.dataset.transform = transform
2.4 定义模型

使用PyTorch内置的VGG11模型(从头训练,不使用预训练权重):

# 初始化VGG11模型(输入通道为3,输出类别为10)
net = models.vgg11(pretrained=False, num_classes=10)
2.5 模型训练

调用D2L库的封装函数进行训练(支持GPU加速):

# 设置超参数并启动训练
num_epochs = 10
lr = 0.01
device = d2l.try_gpu()  # 自动检测GPU# 开始训练
d2l.train_ch6(net, train_data, test_data, num_epochs, lr, device)
3. 训练结果分析

下图为训练过程中的损失和准确率变化曲线:

关键指标
EpochTrain LossTrain AccTest AccSpeed (examples/sec)
10.8570.2%78.5%112.3
30.31288.6%88.1%117.7
50.3287.6%84.3%118.5
100.2191.8%85.7%119.0
  • 训练损失(Train Loss):随着训练轮次增加,损失快速下降并趋于稳定。例如,第3轮时损失降至 0.312,表明模型快速收敛。

  • 训练准确率(Train Acc):第3轮时达到 88.6%,说明模型对训练数据的学习效果显著。

  • 测试准确率(Test Acc):第3轮测试准确率 88.1%,与训练准确率接近,表明模型泛化能力优秀,未出现明显过拟合。

  • 训练速度:在 cuda:0 设备上达到 117.7 examples/sec,充分利用GPU加速,适合大规模数据训练。

4. 完整代码 
from d2l import torch as d2l
from torchvision import models, transforms
import torch# 数据预处理
transform = transforms.Compose([transforms.Resize(224),transforms.Grayscale(num_output_channels=3),transforms.ToTensor()
])# 加载数据集
batch_size = 64 * 3
train_data, test_data = d2l.load_data_fashion_mnist(batch_size, resize=224)
train_data.dataset.transform = transform
test_data.dataset.transform = transform# 定义模型
net = models.vgg11(pretrained=False, num_classes=10)# 训练配置
num_epochs = 10
lr = 0.01
device = d2l.try_gpu()# 启动训练
d2l.train_ch6(net, train_data, test_data, num_epochs, lr, device)
5. 常见问题
Q1:为什么将灰度图转为三通道?

VGG系列模型设计时默认接受RGB输入(3通道)。尽管Fashion-MNIST为单通道,需通过复制通道数适配模型。

Q2:如何进一步提升准确率?
  • 增加训练轮次(如 num_epochs=20)。

  • 使用更复杂模型(如VGG16、ResNet)。

  • 添加数据增强(随机旋转、亮度调整)。

Q3:训练时显存不足怎么办?
  • 减小 batch_size(如设为64)。

  • 启用混合精度训练(添加 torch.cuda.amp)。


6. 总结

本文使用PyTorch实现了VGG11模型在Fashion-MNIST数据集上的分类任务,最终测试准确率达 85.7%,并在第3轮即达到 88.1% 的测试准确率,训练速度高达 117.7 examples/sec,展现了优秀的性能与效率。通过代码解析与结果分析,读者可快速掌握从数据预处理到模型训练的完整流程,并根据实际需求调整模型或超参数进一步优化性能。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com