您的位置:首页 > 汽车 > 新车 > 产品视频宣传片_丹东网站建设平台_seo全称英文怎么说_怎么进行网络推广

产品视频宣传片_丹东网站建设平台_seo全称英文怎么说_怎么进行网络推广

2024/12/26 17:47:41 来源:https://blog.csdn.net/m0_74896766/article/details/143315302  浏览:    关键词:产品视频宣传片_丹东网站建设平台_seo全称英文怎么说_怎么进行网络推广
产品视频宣传片_丹东网站建设平台_seo全称英文怎么说_怎么进行网络推广

文章目录

  • YOLO V3
    • 一、改进
    • 二、三种scale
    • 三、残差连接
    • 四、核心网络结构
      • 1. 结构
      • 2. 输出与先验框关系
    • 五、softmax层替代
  • 总结

YOLO V3

YOLO V3是由Joseph Redmon等人在2018年推出的一款目标检测算法。作为YOLO系列的第三代版本,它在实时性和准确性上取得了显著的提升。YOLO V3的核心思想是将目标检测问题转化为一个回归问题,通过一个统一的神经网络同时预测物体的类别和位置。

相较于其他的网络模型,YOLO V3有着显著的优越性以及高效性:

在这里插入图片描述

一、改进

  1. YOLO V3最大的改进就是网络架构,使其更适合小物体检测。
  2. 特征做的更细致,融入多持续特征图信息来预测不同规格物体。
  3. 先验框更丰富,共9个,分为小、中、大三种scale,每种有三个规格。
  4. softmax改进,预测多标签任务。

二、三种scale

为了检测不同大小的物体:

在这里插入图片描述

  • scale变换经典方法

不太理想的两种方法

金字塔:每层特征图卷积预测结果。

单一:将多层特征图融合在一起,这样就和普通的卷积神经网络一样了,没什么意义。

在这里插入图片描述

上述两种方法有一个缺点:不利于yolo的检测速度。

理想方法

从大的融合向小的,接着小的返回影响大的特征图输出:

在这里插入图片描述

三、残差连接

残差网络最大特点:可以搭建更大、更深层次的网络。

引入resnet的思想,堆叠更多的层来进行提取:

在这里插入图片描述

四、核心网络结构

YOLO V3采用了Darknet-53作为骨干网络。Darknet-53是一个基于ResNet残差网络思想的深度学习模型,包含53个卷积层,每个卷积层后跟随批量归一化层和Leaky ReLU激活函数。这种结构使得网络在提取特征时更加高效,同时避免了过拟合的问题。

特点:没有池化层和全连接层,只有卷积层。

1. 结构

在这里插入图片描述

2. 输出与先验框关系

从上方可以发现,网络结构共有三个输出:

YOLO3延续了K-means聚类得到先验框的尺寸方法,为每种下采样尺度设定3种先验框,总共聚类出9种尺寸的先验框。

在这里插入图片描述

五、softmax层替代

在之前的判断类别中,我们使用的是logistic函数

指的是未经过softmax函数处理的网络输出,也就是各个类别的得分(score)或概率(probability)值,因此沿用了logit这个术语。在逻辑回归(logistic regression)模型中,logits表示某个事件发生的概率与不发生的概率之比的对数值。

softmax层适用于多分类的任务中:

在这里插入图片描述

总结

本篇介绍了:

  1. YOLO V3的网络架构只有卷积层,且有三个输出。
  2. YOLO V3先验框共有9个,分为小、中、大三种scale,每种有三个规格。
  3. 引入残差网络思想,搭建更深层次的网络。
  4. 使用softmax函数替代logistic函数,适用于多分类的任务。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com