您的位置:首页 > 娱乐 > 明星 > 【YOLOv5进阶】——修改网络结构(以C2f模块为例)

【YOLOv5进阶】——修改网络结构(以C2f模块为例)

2024/7/6 20:45:16 来源:https://blog.csdn.net/weixin_51658186/article/details/137739143  浏览:    关键词:【YOLOv5进阶】——修改网络结构(以C2f模块为例)

一、站在巨人的肩膀上

这里我们借鉴YOLOv8源码:

上期说到,对于网络模块定义详情在common.py这个文件,如Conv、CrossConv、C3f等。本期要修改的需要参考YOLOv8里的C2f模块,它定义在YOLOv8的module文件夹的block.py文件里(与common.py一样),源码链接如下:

YOLOv8源码icon-default.png?t=N7T8https://github.com/ultralytics/ultralytics下载Code下的压缩包即可:

需要的文件路径如下(可能该源码更新了,位置和博主讲的还不太一样):

C2f模块大概在第200行左右,如下就是我们后面修改要借鉴的:

class C2f(nn.Module):"""Faster Implementation of CSP Bottleneck with 2 convolutions."""def __init__(self, c1, c2, n=1, shortcut=False, g=1, e=0.5):"""Initialize CSP bottleneck layer with two convolutions with arguments ch_in, ch_out, number, shortcut, groups,expansion."""super().__init__()self.c = int(c2 * e)  # hidden channelsself.cv1 = Conv(c1, 2 * self.c, 1, 1)self.cv2 = Conv((2 + n) * self.c, c2, 1)  # optional act=FReLU(c2)self.m = nn.ModuleList(Bottleneck(self.c, self.c, shortcut, g, k=((3, 3), (3, 3)), e=1.0) for _ in range(n))def forward(self, x):"""Forward pass through C2f layer."""y = list(self.cv1(x).chunk(2, 1))y.extend(m(y[-1]) for m in self.m)return self.cv2(torch.cat(y, 1))def forward_split(self, x):"""Forward pass using split() instead of chunk()."""y = list(self.cv1(x).split((self.c, self.c), 1))y.extend(m(y[-1]) for m in self.m)return self.cv2(torch.cat(y, 1))

二、开始修改网络结构

  • model/common.py加入新增的C2f模块,直接复制粘贴如下:

这段代码里面的第167行处的Bottleneck类是YOLOv8独属定义的,需要也把它的定义复制过来:

但是由于原本common.py里也有该类,为了避免名字冲突Bottleneck加上前缀C2f变为C2fBottleneck:


  • model/yolo.py设定网络结构的传参细节

传参细节可以参照原本存在的C3模块的属性,只要传C3x模块的地方加上C2f即可,找到yolo.py里的parse_model函数,如下在319行和325行的C3x后加入了C2f:


  • model/yolov5s.yaml设定现有模型结构配置文件

需要把代码中的C3模块都替换为C2f(backbone一定要改,head里可改可不改),这里改动较多,我们可以保留yolov5s.yaml原文件,复制一份命名为yolov5s-c2f.yaml

  • train.py训练时指定模型结构配置文件

下面是原始的parse_opt函数(部分):

需要将第二个cfg参数(模型结构配置文件指定参数),修改我们新的yaml文件路径:

博主也解释了这里即使更改了cfg配置文件,上面的预训练的权重weights还是可以用原本的初始权重yolov5.pt文件的!!!!

这里的第三个参数data可见还是前几期博客试验的《名侦探柯南》人物的识别mingke.yaml文件!


  • 开启训练,可见训练时从common.py文件加载的模块不再有C3,而是换成了C2f模块:

也可见从预训练权重文件yolov5s.pt中加载项时没全加载,325项中加载了271项,说明可以迁移一部分(借鉴)原本的权重文件,若不指定完全从头开始训练效果可能不那么好:

也可自行观察训练时更多的有趣点,比如前几次跌代(epoch)的mAP指标都是0,是因为加入刚来的C2f模块后模型与随机初始化的权重很多对不上,经过一段时间的迭代学习后就可发现mAP值逐渐出现数值!!

100次迭代后结果如下,结果保存在runs\train\exp10文件夹:

下面是原始网络结构的训练结果,这里可见替换C2f模块后,训练指标没有增加反而减小,说明不是修改了就一定会有提高,还需要多方考虑,适合才是最好——这就是”炼丹“!!


往期精彩

STM32专栏(9.9)icon-default.png?t=N7T8http://t.csdnimg.cn/A3BJ2

OpenCV-Python专栏(9.9)icon-default.png?t=N7T8http://t.csdnimg.cn/jFJWe

AI底层逻辑专栏(9.9)icon-default.png?t=N7T8http://t.csdnimg.cn/6BVhM

机器学习专栏(免费)icon-default.png?t=N7T8http://t.csdnimg.cn/ALlLlSimulink专栏(免费)icon-default.png?t=N7T8http://t.csdnimg.cn/csDO4电机控制专栏(免费)icon-default.png?t=N7T8http://t.csdnimg.cn/FNWM7 

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com