- 🍨 本文为🔗365天深度学习训练营 中的学习记录博客
- 🍖 原作者:K同学啊
在上一次体验yolov5s的为基础上,这次将训练自己的数据集。
在YOLO目标检测算法中常用的三种标签格式:voc(xml)、coco(json)和yolo(txt)。以下是这三种格式的详细介绍:
- voc(xml)格式:
- XML格式因其良好的可读性和扩展性,在目标检测领域得到了广泛应用。
- 它不仅能够存储目标的边界框信息(即目标的左上角坐标、宽度和高度),还能包含其他元数据信息,如图像来源、拍摄时间等。
- 这种格式的优点是结构清晰,易于理解和处理,但文件体积相对较大。
- coco(json)格式:
- JSON格式以其轻量级和易于解析的特点,成为许多现代目标检测数据集的首选。
- 它支持多层嵌套结构,能够更灵活地表示复杂的目标关系。
- 例如,它可以同时记录多个对象之间的相互位置关系以及它们与背景的关系。
- 这种格式的优点是简洁明了,便于传输和处理,且兼容性强。
- yolo(txt)格式:
- YOLO算法专用的txt格式标签,简洁明了,直接包含目标的类别ID和边界框坐标。
- 这种格式专门为YOLO系列算法设计,用于训练时的高效读取和使用。
- 其特点是简单高效,适用于快速迭代和优化模型参数的场景。
总结来说,这三种标签格式各有特点,适用于不同的场景和应用需求。在实际项目中,可以根据具体情况进行选择或组合使用。
一、准备好数据
本次使用的水果数据有200张图片,每张图片包含四个不同类别的水果;
二、创建split_ train_val.py文件,run生成train.txt,test.txt,val.txt文件
运行得到以下结果
三、创建voc_label.py文件,填充图片路径
四、训练自己的数据集
要注意训练的时候指定数据yaml模型和文件,不然会出错
过程中出现的问题大都可以通过增加环境变量和下载库解决