如果FLAG的画,就是已经有模型了,不然就新建一个模型,通过TORCH方法
在训练的时候,如果TRAIN的话就是训练,不然就是预测
forward前向预测出来一个结果,就是1234
在train方法里,进行多轮迭代,每轮迭代都是通过底层的train_epoch方法进行的;里面主要的功能是打印每轮训练的具体信息
在train_epoch方法里,通过前向传播,计算损失,然后反向传播,梯度更新;里面主要进行的是模型训练
原图像是长*宽的通道图像,通过拍扁,可以拉伸为一维的一个图像,1*784,特征数是784
有60000个图,那么就是可以变换为60000*784的矩阵,每一行都代表一个图片
预处理数据:
将训练图像转换为浮点数,并做归一化。
将训练集标签转换为独热编码,是标签化为独热编码,就是一共有多少个标签的话,就有多少位,,然后对应位上的是1
输入层映射到隐藏层,隐藏层数量定位1024的话,那么就是784*1024,即输入特征的数量,到隐藏层的数量,最后输出层就是类标签的总数,即1024*10,从1024映射到10上