PyTorch深度学习

jupyter

在创建环境中安装jupyter

打开Anaconda prompt
输入conda activate your_name
输入conda install nb_conda
输入jupyter notebook
点击右侧new，进入对应的环境

输入代码，按shift+enter，运行并新建代码块

PyCharm及Jupyter使用及对比

在这里插入图片描述

python学习中的两大法宝函数

package
包里有各种各样的工具
在这里插入图片描述

dir()函数

dir()函数，能让我们知道工具箱以及工具箱中的分隔区有什么东西。

打开工具箱。用于列出一个对象的所有属性和方法。它返回一个包含对象所有属性和方法名称的列表。如果不传入参数，则返回当前作用域中所有可用的名称

help()函数

help()函数，能让我们知道每个工具是如何使用的，工具的使用方法。

查看说明书。用于获取对象、模块、函数、关键字等的帮助信息。当传入对象时，它会显示该对象的帮助文档。如果没有传入任何参数，则会进入交互式帮助模式。

在这里插入图片描述

数据集

数据集的两种形式

形式一：文件夹名称对应label
在这里插入图片描述

train：训练数据集
val：验证数据集

形式二：文件、label分类
在这里插入图片描述

形式三：文件名称对应label
在这里插入图片描述

Pytorch读取数据的两个类Dataset和DataLoader

Dataset类

Dataset将数据和label进行组织编号0 1 2 3……，使得可以根据编号读取数据；需获取每一个数据及其label以及数据总数，要实现 len() 方法和 getitem() 方法。
len() 方法返回数据集的样本数量；
getitem() 方法根据给定的索引返回对应的数据样本

一些操作：

from PIL import Image

导入图片

img_path = "G:\\000_python\\PyTorch_deep_learning\\pythonProject2\\dataset\\train\\ants\\0013035.jpg"

打开图片地址

img = Image.open(img_path)

显示图片尺寸

img.size

from torch.utils.data import Dataset
# 从torch.utils.data导入Dataset类
from PIL import Image
# 从PIL导入Image类，用于图像处理
import os
# 导入os模块，用于处理文件和目录class MyData(Dataset):# 定义一个继承自Dataset的自定义数据集类def __init__(self, root_dir, label_dir):# 初始化方法，接受根目录和标签目录作为参数self.root_dir = root_dir# 设置实例的根目录self.label_dir = label_dir# 设置实例的标签目录self.path = os.path.join(self.root_dir, self.label_dir)# 构建完整的路径self.img_path = os.listdir(self.path)# 获取路径下的所有文件名def __getitem__(self, idx):# 获取指定索引处的数据img_name = self.img_path[idx]# 根据索引获取图像文件名img_item_path = os.path.join(self.root_dir, self.label_dir,img_name)# 构建图像文件的完整路径img = Image.open(img_item_path)# 打开图像文件label = self.label_dir# 获取图像的标签return img, label# 返回图像和标签def __len__(self):# 返回数据集的大小return len(self.img_path)# 返回图像文件的数量root_dir = "蚂蚁蜜蜂数据集\\dataset\\train"
# 设置数据集的根目录
ants_label_dir = "ants"
# 设置蚂蚁数据的标签目录
ants_dataset = MyData(root_dir, ants_label_dir)
# 创建蚂蚁数据集实例
print(ants_dataset)
# 打印蚂蚁数据集的信息
print(ants_dataset[0])
# 打印蚂蚁数据集第一个数据项
img, label = ants_dataset[0]
# 获取蚂蚁数据集第一个数据项的图像和标签
img.show()
# 显示图像
bees_label_dir = "bees"
# 设置蜜蜂数据的标签目录
bees_dataset = MyData(root_dir, bees_label_dir)
# 创建蜜蜂数据集实例
img, label = bees_dataset[0]
# 获取蜜蜂数据集第一个数据项的图像和标签
img.show()
# 显示图像train_dataset = ants_dataset + bees_dataset
# 拼接蚂蚁和蜜蜂两个数据集，未改变顺序，蚂蚁在前蜜蜂在后
print(len(ants_dataset))
# 打印蚂蚁数据集的大小
print(len(bees_dataset))
# 打印蜜蜂数据集的大小
print(len(train_dataset))
# 打印拼接后数据集的大小

Tensorboard

add_saclar用于在TensorBoard中添加标量数据。该方法可以用来添加训练过程中的损失值、准确率等指标，以便于在TensorBoard中进行可视化和比较
在这里插入图片描述

tag（字符串）：用于标识添加的标量数据的名称或标签。在TensorBoard中，这个标签将用作图表的标题。
scalar_value（数值）：要记录的标量数据的值。这可以是损失值、准确率等。
global_step（整数，可选）：表示记录的步数或迭代次数。这个参数对于在TensorBoard中显示随时间变化的数据非常有用。例如，在训练神经网络时，您可以将当前的迭代次数传递给global_step，以便在TensorBoard中可视化损失值、准确率等随着训练步数的变化而变化的曲线。
walltime（时间戳，可选）：表示记录的时间。如果不指定，则默认使用当前时间

使用tensorboard绘制 y = x 的函数

from torch.utils.tensorboard import SummaryWriterwriter = SummaryWriter("logs") # 日志文件存储位置
for i in range(100):writer.add_scalar("y = x", i, i) #前一个i是y 后一个i是横坐标
writer.close()

在终端输入

tensorboard --logdir=logs  #logs是上面指定在writer = SummaryWriter("logs")中指定的文件夹名，日志文件存储在此文件中

在这里插入图片描述
指定窗口打开

tensorboard --logdir=logs --port=6007

模型训练

在这里插入图片描述

model.py

# 导入torch库和torch.nn模块
import torch
from torch import nn# 定义一个继承自nn.Module的神经网络类Tudui
class Tudui(nn.Module):# 定义初始化方法def __init__(self) -> object:# 调用父类的初始化方法super(Tudui, self).__init__()# 定义一个包含多个层的神经网络self.model = nn.Sequential(nn.Conv2d(3, 32, 5, 1, 2),    # 卷积层：输入通道3，输出通道32，卷积核大小5，步长1，填充2nn.MaxPool2d(2),              # 最大池化层：池化窗口大小2nn.Conv2d(32, 32, 5, 1, 2),   # 卷积层：输入通道32，输出通道32，卷积核大小5，步长1，填充2nn.MaxPool2d(2),              # 最大池化层：池化窗口大小2nn.Conv2d(32, 64, 5, 1, 2),   # 卷积层：输入通道32，输出通道64，卷积核大小5，步长1，填充2nn.MaxPool2d(2),              # 最大池化层：池化窗口大小2nn.Flatten(),                 # 展平层：将多维张量展平为一维nn.Linear(64 * 4 * 4, 64),    # 全连接层：输入维度64*4*4，输出维度64nn.Linear(64, 10)             # 全连接层：输入维度64，输出维度10)# 定义前向传播方法def forward(self, x):x = self.model(x)  # 将输入数据传递给定义好的神经网络return x           # 返回输出结果# 主程序入口
if __name__ == '__main__':tudui = Tudui()  # 创建Tudui类的实例input = torch.ones(64, 3, 32, 32)  # 创建一个形状为(64, 3, 32, 32)的全1张量作为输入output = tudui.forward(input)  # 将输入数据传递给网络进行前向传播print(output.shape)  # 打印输出的形状

train.py

import torchvision
from torch.utils.data import DataLoader
from model import *
import torch
from torch import nn
from torch.utils.tensorboard import SummaryWriter# 准备数据集
train_data = torchvision.datasets.CIFAR10(root='./data', train=True, transform=torchvision.transforms.ToTensor(), download=True)
# 从 torchvision.datasets 下载 CIFAR-10 训练数据集，并将其转换为张量（Tensor）。数据集将保存在 './data' 目录中。test_data = torchvision.datasets.CIFAR10(root='./data', train=False, transform=torchvision.transforms.ToTensor(), download=True)
# 从 torchvision.datasets 下载 CIFAR-10 测试数据集，并将其转换为张量（Tensor）。数据集将保存在 './data' 目录中。# 获得数据集长度
train_data_size = len(train_data)
# 获取训练数据集的样本数量。test_data_size = len(test_data)
# 获取测试数据集的样本数量。print('训练数据集的长度为:{}'.format(train_data_size))
# 打印训练数据集的样本数量。print('测试数据集的长度为:{}'.format(test_data_size))
# 打印测试数据集的样本数量。# 利用dataloader加载数据集
train_dataloader = DataLoader(train_data, batch_size=64)
# 使用 DataLoader 将训练数据集按批次加载，每个批次包含 64 张图像。test_dataloader = DataLoader(test_data, batch_size=64)
# 使用 DataLoader 将测试数据集按批次加载，每个批次包含 64 张图像。# 创建网络模型
tudui = Tudui()
# 实例化自定义的神经网络模型 'Tudui'。# 如果可用，使用GPU
if torch.cuda.is_available():tudui = tudui.cuda()
# 如果检测到 GPU 可用，将模型移至 GPU 以加速训练。# 创建损失函数
loss_fn = nn.CrossEntropyLoss()
# 定义损失函数为交叉熵损失函数（CrossEntropyLoss），通常用于多分类任务。# 创建优化器
learning_rate = 0.01
# 设置学习率为 0.01。optimizer = torch.optim.SGD(tudui.parameters(), lr=learning_rate)
# 使用随机梯度下降（SGD）优化器，并将模型的参数传递给优化器进行更新。# 创建SummaryWriter来记录训练日志
writer = SummaryWriter('logs')
# 创建 SummaryWriter 对象，用于记录训练过程中的日志和指标，方便使用 TensorBoard 可视化。# 设置训练网络的一些参数
total_train_step = 0  # 记录训练次数
# 初始化训练步数计数器。total_test_step = 0  # 记录测试次数
# 初始化测试步数计数器。epochs = 10  # 训练的轮数
# 设置训练轮数为 10 轮。# 开始训练
for epoch in range(epochs):print('----------第{}轮训练开始----------'.format(epoch + 1))# 循环开始，逐轮进行训练，并打印当前的轮次。# 训练步骤开始for data in train_dataloader:imgs, targets = data# 从数据加载器中获取一批训练数据，包括图像和对应的标签。if torch.cuda.is_available():imgs = imgs.cuda()targets = targets.cuda()# 如果 GPU 可用，将图像和标签数据移至 GPU。outputs = tudui(imgs)# 将图像输入模型，得到模型的输出。loss = loss_fn(outputs, targets)# 计算模型输出与真实标签之间的损失。# 优化器优化模型optimizer.zero_grad()# 清空优化器中所有参数的梯度，避免梯度累积。loss.backward()# 反向传播，计算参数的梯度。optimizer.step()# 使用优化器更新模型参数。total_train_step += 1# 训练步数计数器加一。if total_train_step % 100 == 0:print("训练次数：{}, Loss:{}".format(total_train_step, loss.item()))# 每 100 次训练后，打印当前的训练步数和损失值。writer.add_scalar('train_loss', loss.item(), total_train_step)# 使用 SummaryWriter 记录当前步数的训练损失值，供 TensorBoard 使用。# 训练步骤结束# 测试步骤开始total_test_loss = 0# 初始化测试集总损失为 0。total_accuracy = 0# 初始化测试集总准确率为 0。with torch.no_grad():# 禁用梯度计算，提高测试过程的效率。for data in test_dataloader:imgs, targets = data# 从数据加载器中获取一批测试数据。if torch.cuda.is_available():imgs = imgs.cuda()targets = targets.cuda()# 如果 GPU 可用，将图像和标签数据移至 GPU。outputs = tudui(imgs)# 将图像输入模型，得到模型的输出。loss = loss_fn(outputs, targets)# 计算模型输出与真实标签之间的损失。total_test_loss += loss.item()# 将当前批次的损失累加到测试集总损失中。accuracy = (outputs.argmax(1) == targets).sum()# 计算当前批次中预测正确的样本数量。total_accuracy += accuracy# 将当前批次的正确预测数量累加到总准确率中。print('整体测试集上的loss:{}'.format(total_test_loss))# 打印测试集的总损失。print('整体测试集上的accuracy:{}'.format(total_accuracy/test_data_size))# 打印测试集的总准确率。writer.add_scalar('test_loss', total_test_loss, total_test_step)# 使用 SummaryWriter 记录测试集总损失，供 TensorBoard 使用。writer.add_scalar('test_accuracy', total_accuracy/test_data_size, total_test_step)# 使用 SummaryWriter 记录测试集准确率，供 TensorBoard 使用。total_test_step += 1# 测试步数计数器加一。torch.save(tudui.state_dict(), 'tudui_{}.pth'.format(epoch+1))# 保存当前轮次训练后的模型参数，保存文件名中包含当前轮次。print("模型保存成功！")# 打印模型保存成功的消息。writer.close()
# 关闭 SummaryWriter，确保所有日志数据写入文件。

代码运行结束后生成的tudui_1.pth是什么，如何使用

tudui_1.pth 是 PyTorch 保存的模型权重文件。它包含了在第一轮训练结束后，模型 Tudui 的所有参数。这些参数在后续训练中被用来继续优化模型，或者在后期加载后进行推理和预测。

加载模型权重：
可以使用 torch.load() 函数加载这个文件，并用 model.load_state_dict() 方法将权重加载到模型中。

使用已加载的模型进行推理：
一旦加载了权重，就可以使用这个模型来对新数据进行预测。

如何加载并使用 tudui_1.pth 文件：

import torch
from model import Tudui  # 导入你的模型定义
import torchvision.transforms as transforms
from PIL import Image# 创建模型实例
model = Tudui()# 加载模型权重
model.load_state_dict(torch.load('tudui_1.pth'))# 如果有GPU可用，可以将模型移到GPU上
if torch.cuda.is_available():model = model.cuda()# 切换模型到评估模式
model.eval()# 加载并预处理测试图像
image = Image.open('path_to_your_image.jpg')  # 替换为实际图片路径
transform = transforms.Compose([transforms.Resize((32, 32)),  # CIFAR-10 图片尺寸为 32x32transforms.ToTensor(),
])
image = transform(image).unsqueeze(0)  # 添加一个 batch 维度# 如果使用GPU，将图像移到GPU上
if torch.cuda.is_available():image = image.cuda()# 使用模型进行推理
with torch.no_grad():output = model(image)predicted_class = output.argmax(1).item()print(f'Predicted class: {predicted_class}')

参考

PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】

PyTorch深度学习

jupyter

在创建环境中安装jupyter

PyCharm及Jupyter使用及对比

python学习中的两大法宝函数

dir()函数

help()函数

数据集

数据集的两种形式

Pytorch读取数据的两个类Dataset和DataLoader

Dataset类

Tensorboard

使用tensorboard绘制 y = x 的函数

模型训练

model.py

train.py

代码运行结束后生成的tudui_1.pth是什么，如何使用

参考

最新新闻

热搜词