目标检测是一类计算机视觉任务,简单来说,目标检测可被定义为在计算机中输入一张图像,计算机需要找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,如图一所示。目标检测是计算机视觉领域的核心问题之一,相较于最原始的将整张图片分类为某一类别,目标检测不光可以感知图像中物体的类别,还可以提取感兴趣物体在图像中的位置信息,并将图片区分为前景和背景。随着科技的进步,目标检测算法广泛的利用深度学习作为基础,在近几年有了飞速的发展。目前,目标检测算法被广泛的应用于智能驾驶、安防摄像头、工业上的裂纹污损检测等工作。
从算法范式上来区分,目标检测算法基本可以分为两阶段(two stage)和单阶段(single stage)两种范式,而从学术流派而言,目标检测算法又可被区分为RCNN流派、YOLO流派和DETR流派,下面我们将简要介绍几种主要的目标检测算法原理。
一、 RCNN流派
两阶段目标检测算法是最早出现的使用深度学习的目标检测算法,这类算法通过显式的区域建议将检测问题转化为对生成的建议区域内局部图片的分类问题,如图2所示。代表性的两阶段目标检测算法有RCNN、Faster R-CNN、Mask RCNN等。
两阶段目标检测算法最突出的特点在于其鲜明的人工斧凿的人为思考痕迹,即算法存在十分突出的