基于改进YOLO_v5n的移栽机栽植部件辣椒苗识别方法_张斯源.pdf-

资源描述：

2 0 2 6 年 2 月农业机械学报第 57 卷第 3 期 doi 10 6041 j issn 1000 1298 2026 03 019 基于改进 YOLO v5n 的移栽机栽植部件辣椒苗识别方法张斯源 1 苑严伟 2 3 崔巍 2 3 朱凤武 1 吕程序 2 3 张学东 2 3 1 吉林农业大学工程技术学院长春 130118 2 中国农业机械化科学研究院集团有限公司北京 100083 3 农业装备技术全国重点实验室北京 100083 摘要全自动移栽机在实际工作过程中经常遇到堵苗漏苗和幼苗栽植状态异常等问题实时监测移栽机栽植部件中的幼苗情况是提高移栽机工作效率与移栽质量的关键因此本文提出了一种基于 YOLO v5n 的轻量化识别方法用于对栽植部件中的辣椒苗进行精确目标检测首先在顺光逆光光照情况下使用摄像头采集了单株和多株的移栽机栽植部件辣椒苗图像构建辣椒苗数据集其次在 YOLO v5n 神经网络架构的基础上使用 Ghost 卷积替换普通卷积并插入改进后的 FastGhost 模块和 SimAMGhost 模块有效降低模型的运算量和计算延迟提高检测速度引入 EMA 注意力机制提高对重要细节信息的注意程度改善模型对高度重叠的多株辣椒苗图像识别效果解决了辣椒苗的部分多检和漏检问题最终使用 Shape IoU 损失函数替换 CIoU 损失函数消除边界框自身形状对边界框回归的影响提高边界框回归准确度实验结果表明与 YOLO v5n 相比改进后的 YOLO v5n GE 模型的检测平均精度均值为 95 3 比原模型提高 0 3 个百分点模型参数量和计算量分别缩小 52 5 和 51 2 检测速度提升 12 2 与当前 YOLO 系列主流模型相比 YOLO v5n GE 能够在大幅度减少参数量和运算量的情况下保持较高的检测精度证明了改进算法的有效性可为硬件资源有限的移栽机栽植部件中的辣椒苗识别工作提供技术支持关键词全自动移栽机辣椒苗识别 YOLO v5n SimAMGhost 模块 EMA 注意力机制中图分类号 S24 TP389 1 文献标识码 A 文章编号 1000 1298 2026 03 0196 10 OSID 收稿日期 2024 10 29 修回日期 2024 12 12 基金项目国家重点研发计划项目 2023YFD2001203 作者简介张斯源 2001 男硕士生主要从事农业电气化与自动化研究 E mail zsy01227 163 com 通信作者苑严伟 1980 男研究员博士主要从事农业智能化技术研究 E mail yyw215 163 com Pepper Seedling ecognition in Transplanting Machine Components Based on Improved YOLO v5n ZHANG Siyuan 1 YUAN Yanwei 2 3 CUI Wei 2 3 ZHU Fengwu 1 L Chengxu 2 3 ZHANG Xuedong 2 3 1 School of Engineering and Technology Jilin Agricultural University Changchun 130118 China 2 Chinese Academy of Agricultural Mechanization Sciences Group Co Ltd Beijing 100083 China 3 State Key Laboratory of Agricultural Equipment Technology Beijing 100083 China Abstract Aiming to address key operational issues in automatic transplanting machines such as missed planting seedling blockages and abnormal seedling planting state an optimized lightweight detection model YOLO v5n GE was proposed for real time monitoring of seedling conditions within transplanting equipment The research began by collecting images of both single and multiple pepper seedlings under varying lighting conditions front and backlighting using a camera To reduce computational load and latency traditional convolutions were replaced with Ghost convolutions on the basis of YOLO v5n model and the main feature extraction modules were substituted with improved FastGhost and SimAMGhost modules EMA attention mechanism was applied to enhance the network s focus on important detail information effectively improving the model s recognition results for highly overlapping pepper seedlings reducing sensitivity to occlusions and increasing recognition accuracy Additionally Shape IoU loss was used to replace CIoU loss addressing the influence of the bounding box shape on bounding box regression and improving bounding box regression accuracy Experimental results on the self built dataset demonstrated that the improved YOLO v5n GE model achieved an mAP of 95 3 representing a 0 3 percentage points improvement over the original model The model s parameter count and computational load were reduced by 52 5 and 51 2 respectively detection speed was increased by 12 2 These enhancements enabled efficient real time detection of pepper seedlings while maintaining high accuracy demonstrating the improved algorithm s effectiveness The research result can provide technical support for seedling recognition in transplanting machine components with limited hardware resources Key words automatic transplanting machine pepper seedling recognition YOLO v5n SimAMGhost module EMA attention mechanism 0 引言全自动移栽机是未来移栽种植机械的发展方向 1 但在全自动移栽机的工作过程中经常出现漏苗堵苗和栽植状态异常等问题显著影响了移栽机的工作效率和移栽质量传统的光电检测方法在识别移栽机作业中的错误栽植状态方面存在局限性因此采用图像识别技术对移栽机栽植部件的作业状态进行监测和精确识别具有提升全自动移栽机作业效率的潜力逐步成为推动农业装备智能化高效化的重要方向随着计算机技术和深度学习技术的深入研究深度卷积神经网络在农业领域体现出较高的优越性这种方法可以在背景复杂的图像信息中提取目标特征在处理复杂任务时有更好的应用效果 2 4 目前主流的目标检测识别算法有 Faster CNN 系列 5 7 YOLO 系列 8 11 SSD 12 等 Faster CNN 是两阶段检测的目标检测算法它用一个区域提示器生成候选的物体区域再通过神经网络对其进行分类这种算法虽然精确度很高但生成候选区域步骤需占用大量资源检测时间较长 SSD 和 YOLO 算法是单阶段检测的目标检测算法 SSD 的核心思想是将图像分为多个区域并在每个区域内进行物体检测但是在复杂背景条件下 SSD 算法的检测精度和定位不够精准 YOLO 算法通过单一的神经网络来检测多个物体并且仅在 1 次前向传播中完成目标检测分类和定位 3 个任务相比之下 YOLO 系列算法在速度和简单性上具有较高的优越性便于部署在全自动移栽机这类移动设备上由于农业环境下对作物检测的精确度和实时性通常有较高需求国内外学者对 YOLO 系列算法进行了多种方法改进马宏兴等 13 使用带有 Transformer 模块的主干网络 BoTNet 和坐标注意力机制对 YOLO v5s 进行轻量化改进在保持对植物识别精度的同时提高了模型检测速度冀汶莉等 14 结合了 PP LCNet 和 Ghost 卷积降低 YOLO v5s 模型的参数量和计算量实现对复杂农田环境中的杂草识别 YAN 等 15 设计了更为轻量的 BottleNeckCSP 2 模块大幅提升了对被遮挡的苹果目标的实时检测速度但模型参数量和权重大小依然较大 ZHANG 等 16 引入 GhostBottleneck 模块和双注意力机制针对自然背景环境下的黄花菜目标检测将网络模型参数量和运算量分别压缩 63 58 和 68 95 但模型的识别精度仍有优化空间为实现全自动移栽机的高速移栽与作业状态实时检测需要在保持识别精度的情况下对模型进行有效轻量化减少对计算资源的占用针对以上问题本文提出一种改进的 YOLO v5n 算法以辣椒苗为主要识别对象在网络结构中引入轻量化 Ghost 卷积模块在不影响准确率的情况下降低模型运算量加快识别速度引入 EMA 注意力机制帮助网络模型检测边界模糊的重叠遮挡目标将损失函数 CIoU Loss 替换为 Shape IoU Loss 以提高识别精度 1 材料与方法 1 1 数据集制作本文所用的移栽机栽植部件为鸭嘴式栽植机构其主要功能是将辣椒苗从育苗盘转移至田地中为验证所提识别方法的有效性设计并制作了针对该机构的实验装置如图 1 所示装置由可调速直流电机作为主动力源通过齿轮减速箱驱动鸭嘴完成圆周运动减速比为 4 1 鸭嘴的开关动作则通过凸轮结构实现图 1 鸭嘴式栽植机构实验装置 Fig 1 Experimental apparatus of duck billed transplanting mechanism 1 齿轮减速箱 2 凸轮结构 3 直流电机 4 鸭嘴 5 栽植位 6 接苗位辣椒苗数据集的采集地点位于吉林农业大学农业机械化实验室的田间实验地采集环境为温度适宜的露天环境为模拟移栽机的实际工作状态鸭嘴式栽植机构由可调速电机驱动并处于运动状态 791第 3 期张斯源等基于改进 YOLO v5n 的移栽机栽植部件辣椒苗识别方法摄像头根据机构的转速以固定频率进行拍摄捕捉辣椒苗进入鸭嘴区域的瞬时图像拍摄设备为 ealmeX7Pro 型手机搭载索尼 IMX686 型传感器为确保采集图像质量摄像头固定在距离栽植部件鸭嘴顶部垂直向上约 20 cm 的位置该安装高度下的相机视角能够完整覆盖鸭嘴部件的工作区域同时避免遮挡及运动模糊影响采集场景如图 2 所示图 2 数据集采集场景 Fig 2 Dataset collection scenarios 1 实验装置 2 摄像头位置考虑到移栽机在实际工作中可能遇到的复杂环境提升数据样本的多样性在顺光逆光 2 种光照图 4 处理后的图像数据集例图 Fig 4 Processed image dataset 条件下拍摄了鸭嘴式栽植机构中包含单株双株和多株辣椒苗的图像共计拍摄原始图像 1 763 幅经过人工筛选剔除冗余图像后最终构建了包含 1 534 幅有效图像的数据集采集图像原始分辨率为 4 608 像素 3 456 像素在输入深度学习模型前进行了适当缩放以适配模型的输入尺寸不同作业情况下的辣椒苗图像如图 3 所示图 3 采集的图像数据集例图 Fig 3 Acquired image dataset 1 2 数据增强为了丰富数据集多样性保持数据均衡并增强模型的鲁棒性对辣椒苗数据集进行数据增强扩充样本数量使得目标检测模型的识别效果更加显著在 Pytorch 框架下结合 OpenCV 在保留原标注信息的情况下对辣椒苗图像进行随机平移随机旋转亮度调整部分裁剪随机遮挡和添加高斯噪声等不同的图像变换最终得到辣椒苗图像数据集共 6 350 幅数据增强的具体方式如图 4 所示使用 LabelImg 工具软件对数据集中的辣椒苗进行精确矩形框标注并保存为 YOLO 系列模型训练所需要的 YOLO 格式按照比例 7 3对数据集进行划分分为训练集 4 340 幅验证集 2 010 幅 891 农业机械学报 2 0 2 6 年 2 YOLO v5n 改进模型设计 2 1 YOLO v5 网络模型考虑到算法在移动端的部署需求选择了 YOLO v5n 作为基础目标检测模型与 YOLO 系列的最新模型 YOLO v9 YOLO v10 和 YOLO 11 相比 YOLO v5n 的优势在于其更小的模型参数和权重从而实现更快的检测速度这一特性使 YOLO v5n 特别适合于资源受限的移动端环境确保在保证检测精度的同时满足实时处理的需求 YOLO v5 网络模型主要由骨干网络 Backbone 颈部网络 Neck 和目标检测头 Head 3 部分组成骨干网络部分由 4 个 C3 模块和 1 个空间金字塔池化结构 SPPF 构成其中 C3 模块贯穿整个网络模型主要作用是增加网络的深度和感受野提高特征提取的能力颈部网络采用的是 FPN PAN 的特征结构 FPN Feature pyramid network 通过上采样和特征图融合操作将高层特征图的语义信息传递下来 17 PAN Path aggregation network 通过卷积和特征图融合操作将低层特征图的定位信息传图 6 C3 模块 FastGhost 模块和改进的 SimAMGhost 模块 Fig 6 C3 module FastGhost module and improved SimAMGhost module 递上去这样形成的特征金字塔便结合了不同层次的丰富信息 18 目标检测头主要包括边界框生成分类和回归 3 部分 YOLO v5n 的损失函数包括分类损失函数定位损失函数和置信度损失函数主要使用 CIoU 作为损失函数实现边界框的位置回归 2 2 Ghost 轻量化网络结构移栽机在工作过程中的速度较快且对辣椒苗检测实时性需求较高因此需要目标检测模型具有更快的检测速度和更低的延迟针对以上问题本文选择用 Ghost 卷积模块代替普通卷积作为模型网络结构的主干帮助目标检测模型获得更低的运算量和更高的帧速率从而降低模型的计算延迟提高检测速度 19 Ghost 卷积是 GhostNet 网络中提出的轻量化卷积模块它的工作原理如图 5a 所示图中 H 和 W 分别表示特征矩阵的高和宽 C 表示特征矩阵的通道数首先从输入特征图中使用标准卷积生成一组基础特征图然后通过简单的线性变换即不同大小的卷积核操作从基础特征图中生成多个 Ghost 特征图这些操作具有较低的计算复杂度最后将生成的 Ghost 特征图和基础特征图组合在一起组合后的特征图不仅有效地保留了输入信息还保存了一定数量的 Ghost 特征 Ghost 卷积模块的网络结构如图 5b 所示图 5 Ghost 卷积模块工作原理和结构图 Fig 5 GhostConv module mechanism and structure 在 YOLO v5 模型结构中 C3 模块是主要的特征提取层如图 6a 所示从 C3 模块的结构中可以看 991第 3 期张斯源等基于改进 YOLO v5n 的移栽机栽植部件辣椒苗识别方法出该模块与 Ghost 卷积模块的工作原理相同都是通过部分保留和部分卷积的方式得到多个尺度的特征输出基于这个思想对 C3 模块做了更深层次的轻量化改进将模块中全部普通卷积都替换为 Ghost 卷积构成新的 FastGhost 模块如图 6b 所示假设输入特征图与输出特征图的高宽和通道数全部一致且只考虑卷积的乘法输入特征矩阵 X H W c in c in 为特征矩阵的输入通道数普通卷积计算量 FLOPs 计算式为 FLOPs k 2 c in c out HW 1 式中 k 卷积核大小 c out 特征矩阵的输出通道数如果忽略输入特征矩阵的高和宽 Ghost 卷积模块的计算量 FLOPs ghost 计算式为 FLOPs ghost k 2 c in c out r s 2 c out r r 1 2 式中 r 输入特征图中使用标准卷积生成基础特征图的比例 s 生成 Ghost 特征的线性操作卷积核大小两者的计算量比值 r s 为 r s k 2 c in c out k 2 c in c out r s 2 c out r r 1 k 2 c in r k 2 c in s 2 r 1 c in r c in r 1 r 3 在本文提出的模型中 s 与 k 相同 r c in 且 Ghost 卷积中进行线性操作的通道数是总通道数的 1 2 根据计算量比值最终 Ghost 卷积的计算量约为普通卷积的 1 2 2 3 注意力机制的引入 2 3 1 SimAMGhost 模块由于 Ghost 轻量化网络结构会导致一定程度的精度下降为了在不影响轻量化的情况下进一步提升模型的识别精度将 SimAM Simplified attention module 注意力机制 20 集成到了 FastGhost 模块中构成新的 SimAMGhost 模块如图 6c 所示 SimAM 是一种轻量且高效的模块它提取了特征图的三维权重让每个像素都拥有一个唯一的权重能够捕捉特征图中重要的空间信息增强模型对目标的辨识能力如图 7 所示在赋予像素特征权重后利用能量函数计算最小化能量提升有用特征的激活值同时抑制无关特征这种思想是根据 WEBB 等 21 在视觉神经科学领域提出的空间抑制现象潜在能量函数 e t 的计算公式为图 7 SimAM 注意力模块工作原理 Fig 7 SimAM attention module mechanism e t y t t 2 1 M 1 M 1 i 1 y o x i 2 4 式中 M 该通道中神经元的总数量 y t t 2 计算目标神经元 t 的输出 t 与其标签 y t 之间的误差 1 M 1 M 1 i 1 y o x i 2 计算其他神经元的输出 x i 与标签 y o 之间的平均误差通过对该能量函数引入正则化并化简 SimAM 模块可以根据神经元的最小能量计算出每个神经元的重要性最终使用缩放系数对原始特征图进行权重重构实现特征细化提升其重要信息的表达 2 3 2 EMA 注意力机制 OUYANG 等 22 提出的 EMA Efficient multi scale attention 注意力机制是基于 CA 注意力机制的改进方法它是一种跨空间的多尺度并行子网络通过将部分通道维度重新整形为批次维度避免了降维操作融合了空间和位置上的有效信息且所需的参数量并不高因此本文在 YOLO v5n 网络模型的骨干网络上引入了 EMA 注意力机制使得模型能够更加关注有用的特征信息提高模型的性能和精度 EMA 的注意力机制结构如图 8 所示图中 g 表示通道分组数并行处理结构 Parallel structure 首先将输入特征矩阵 X 划分为跨通道维度方向的 g 个子特征用于学习不同的语义然后将张量输入到 3 个并行的分支中其中 2 个分支分别通过水平方向和竖直方向的一维全局平均池化将 X 分解为 2 个并行的一维特征编码向量得到关于宽度和高度的特征表示保留位置信息最后将 2 个一维特征编码向量拼接起来经过 1 1 卷积核捕捉跨通道交互信息提高特征表示的质量跨空间学习 Cross spatial learning 在 1 1 和 3 3 分支中将之前得到的跨空间交互信息的输出向量通过二维全局平均池化编码得到全局空间信息对全局平均池化的结果应用二维高斯分布的 002 农业机械学报 2 0 2 6 年图 8 EMA 注意力机制 Fig 8 Efficient multi scale attention module Softmax 激活函数突出在特征表示中的通道权重之后将输出矩阵与另一分支的并行处理输出矩阵进行点积运算得到空间注意力特征矩阵最后将 2 个分支的空间注意力特征矩阵聚合到一起经过 Sigmoid 函数生成空间注意力权重值对特征图进行重新加权得到具有像素级全局上下文关系的输出特征图 2 3 3 Shape IoU 损失函数作为目标检测中的标准性能指标交并比 Intersection over union IoU 可以有效衡量预测边界框和真实边界框之间的对齐程度从而判断模型预测的准确性 YOLO v5n 网络模型使用了 CIoU 作为损失函数与其他 IoU 损失函数相比 CIoU 考虑了重叠面积中心点距离纵横比并基于 DIoU 提升回归精确度 23 但是 CIoU 等损失函数计算相对复杂且只考虑了利用预测框的相对位置和形状来计算损失忽略了边界框的形状和尺度等固有属性对预测图 9 Shape IoU 损失函数 Fig 9 Shape IoU loss 框回归的影响 ZHANG 等 24 针对这一问题提出了 Shape IoU 损失函数 Shape IoU 的原理如图 9 所示其计算公式为 L Shape IoU 1 IoU d shape 0 5 shape 5 其中 d shape h h x c x gt c 2 c 2 w w y c y gt c 2 c 2 6 shape t w h 1 e t 7 w w 2 w gt u w gt u h gt u 8 h h 2 h gt u w gt u h gt u 9 w h h w w gt max w w gt h w w h h gt max h h gt 10 式中 L Shape IoU Shape IoU 损失函数 d shape 距离损失 shape 形状损失形状损失的关注程度系数取 4 u 数据集中的目标比例因子 w w h h 水平垂直方向权重系数 w gt h gt 真实框的宽度和长度 x gt c y gt c 真实框中心点的位置 x c y c 预测框中心点的位置 w h 宽度高度损失权重 Shape IoU 损失函数的使用可以帮助模型对辣椒苗的预测框回归更加精确同样有助于对栽植部件中高重叠度情况下的辣椒苗进行识别 2 4 改进后的 YOLO v5n GE 网络模型为实现复杂环境下移栽机栽植部件的辣椒苗识别对 YOLO v5n 网络模型进行以下改进在主干网络中使用 Ghost 卷积替换 3 3 普通卷积用改进后的 FastGhost 模块和 SimAMGhost 模块替换普通 C3 102第 3 期张斯源等基于改进 YOLO v5n 的移栽机栽植部件辣椒苗识别方法模块降低计算延迟提高检测速度实现网络轻量化同时为了弥补精度不足引入 EMA 注意力机制使得模型更加关注有用的细节信息提高识别精度使用 Shape IoU 损失函数替换 CIoU 损失函数提高预测框回归的准确率改进后的模型称为 YOLO v5n GE 模型如图 10 所示图 10 YOLO v5n GE 网络模型 Fig 10 YOLO v5n GE network model 3 实验结果与分析 3 1 实验环境与参数设置本实验使用的操作系统是 Windows 11 版本搭载 Intel Core i7 13700KF CPU 主频 3 40 GHz GPU 采用 NVIDIA TX4070 CUDA 版本为 12 2 深度学习框架为 Pytorch 2 0 0 编译环境为 Python 3 10 9 模型训练时的批量尺寸 Batch size 为 16 训练 200 个迭代周期输入图像尺寸为 640 像素 640 像素使用自适应学习率 Adaptive moment estimation Adam 优化器来优化模型 3 2 实验评价指标为验证改进方法有效性主要从识别准确度和轻量化效果进行评估对于识别精确度主要采用精确率 Precision 召回率 ecall 平均精度均值 mAP 来评估模型性能轻量化效果方面选取指标为模型参数量 Parameters 浮点运算量 GFLOPS 和台式机上的运行帧速率 FPS 3 3 实验结果分析 3 3 1 Ghost 轻量化网络结构改进效果验证方法为了验证 Ghost 卷积模块替换普通卷积的改进有效性在辣椒苗数据集上进行了对比实验实验结果如表 1 所示表 1 中模型 2 是在原 YOLO v5 模型的基础上替换了主干网络的普通卷积模型 3 4 是在模型 2 的基础上替换 C3 模块表 1 不同 Ghost 模块的实验结果 Tab 1 Comparision experiment results of different Ghost modules 序号模型平均精度均值参数量浮点运算量帧速率 f s 1 1 YOLO v5n 95 0 1 672 470 4 1 10 9 279 87 2 YOLO v5n Ghost 94 5 1 374 790 3 2 10 9 294 96 3 FastGhost 94 3 759 994 1 9 10 9 312 60 4 SimAM Ghost 94 6 742 234 1 9 10 9 322 63 由表 1 可知与原 YOLO v5n 模型相比模型 2 202 农业机械学报 2 0 2 6 年的参数量下降 17 7 运算量下降 21 9 计算速度提高 5 但是平均精度均值下降 0 5 个百分点这主要是因为 3 3 普通卷积具有一定的感受野能够捕捉局部的空间关系和上下文信息而 Ghost 卷积由于减少了独立的卷积核数量其感受野受到一定的限制模型 3 为用 FastGhost 模块替换 C3 模块相比模型 2 参数量会进一步下降 44 7 运算量下降 40 6 计算速度提高 5 9 平均精度均值只降低了 0 2 个百分点当整个 C3 模块中的所有普通卷积都被替换为 Ghost 卷积时尽管单个卷积的表达能力较弱但整个模块通过多个 Ghost 卷积层的叠加逐渐恢复部分丢失的特征信息尤其是深层的 Ghost 卷积可以从前面的层中补充丢失的信息从而减小了精度的下降幅度从模型 4 的结果得出设计的 SimAMGhost 模块在不影响模型的参数量和计算量的情况下将模型的平均精度均值在模型 3 的基础上进一步提高了 0 3 个百分点综上所述以 Ghost 卷积模块为核心的轻量化网络结构十分有效它可以大量降低模型的复杂程度并削减冗余的复杂计算提高计算速度适用于对识别速度有较高需求的移栽机辣椒苗检测任务当中 3 3 2 EMA 注意力机制改进效果验证方法为了验证 EMA 注意力机制的有效性在模型的相同位置用其他不同的注意力机制替换 EMA 包含 SE CA 和 CBAM 等进行了对比实验实验结果表明在辣椒苗检测数据集中 EMA 注意力机制的作用相比其他的注意力机制取得了更好的识别结果并且参数量增加极少为了更直观地观察注意力机制的效果在算法中加入了热力图工具将模型的注意力可视化以展示模型在处理输入图像时各个像素区域的注意力权重分布注意力可视化的效果如图 11 所示图 11 注意力可视化 Fig 11 Attention visualization 通过热力图发现原 YOLO v5n 模型的关注点较为分散而 EMA 注意力机制的加入能够有效地将更多的关注点集中在比较细节的特征区域能够帮助模型在对重叠度较高的辣椒苗识别任务中取得更好的成效提升了模型的识别能力和准确性 3 3 3 损失函数改进效果验证方法为证明损失函数改进的有效性根据评价指标绘制了曲线图记录模型训练和验证过程中的平均精度均值和损失值变化情况由于 Shape IoU 损失函数的设计更侧重于优化边界框形状的准确性而非单纯的数值降低在计算的过程中增加了距离损失和形状损失因此损失值无法成为评价 Shape IoU 损失函数效果的唯一标准还需要平均精度均值曲线作为对比如图 12 所示图 12 平均精度均值曲线和损失函数曲线 Fig 12 Average accuracy mean curve and loss function curve 综上所述 Shape IoU 损失函数虽然在损失值的表现上与原先 CIoU 损失函数相差不大而在平均精度均值取得了更优的结果说明 Shape IoU 损失函数提升了模型的稳定性和预测准确性在优化边界框形状和位置上具有更好的表现 3 3 4 消融实验结果分析为验证改进方法的鲁棒性和可靠性设计了消融实验初始学习率设置为 0 01 动量为 0 937 权重衰减为 0 000 5 默认情况下所有比较方法的网络都经过了 200 个迭代周期 epoch 的训练实验结果如表 2 所示从表 2 可得出 Ghost 相关模块的引入使得模型的参数量下降 55 6 浮点运算量下降 53 6 帧 302第 3 期张斯源等基于改进 YOLO v5n 的移栽机栽植部件辣椒苗识别方法表 2 消融实验结果 Tab 2 Ablation experiments results 序号 Ghost EMA Shape IoU 精确率召回率平均精度均值参数量浮点运算量帧速率 f s 1 1 91 1 92 9 95 0 1 672 470 4 1 10 9 279 87 2 90 9 92 5 94 6 742 234 1 9 10 9 322 63 3 91 8 93 1 95 4 1 723 798 4 2 10 9 271 15 4 91 6 92 4 95 3 1 672 470 4 1 10 9 278 46 5 91 5 93 4 95 7 1 723 798 4 0 10 9 270 34 6 92 6 91 1 94 9 742 234 2 0 10 9 320 45 7 92 1 91 9 95 0 793 562 2 1 10 9 315 54 8 92 2 92 2 95 3 793 562 2 1 10 9 314 12 注表示包含此模块表示不包含此模块速率提高 15 2 而平均精度均值只下降 0 4 个百分点这说明轻量化效果十分显著 EMA 的引入使精确率召回率和平均精度均值分别提高 0 7 0 2 0 4 个百分点而参数量只增加 3 浮点运算量只提高 2 4 说明该注意力机制的加入在对模型轻量化结果影响不大的同时有效提升了精度 Shape IoU 的效果主要体现在平均精度均值提升 0 3 个百分点综合来看模型经过改进后不仅参数量大小和浮点运算量分别减小 52 5 和 51 2 帧速率提升 12 2 同时平均精度均值上提升 0 3 个百分点说明改进让模型具有更好的识别精度和实时性 3 3 5 不同模型实验结果分析为了验证 YOLO v5n GE 模型的优越性使用 YOLO v5n YOLO v6n YOLO v7 tiny YOLO v8n YOLO v9 T YOLO v10n YOLO 11n 共 7 种主流模型在同一实验环境下在辣椒苗数据集上进行训练和验证得到实验结果如表 3 所示表 3 不同模型对比实验结果 Tab 3 Comparison experiment results of different models 模型平均精度均值参数量浮点运算量帧速率 f s 1 YOLO v5n 95 0 1 672 470 4 1 10 9 279 87 YOLO v6n 93 5 4 531 982 1 14 10 10 247 31 YOLO v7 tiny 94 6 6 014 988 1 32 10 10 231 25 YOLO v8n 94 7 3 005 843 8 1 10 9 258 13 YOLO v9 T 95 5 2 616 950 1 07 10 10 265 42 YOLO v10n 94 6 2 707 414 8 4 10 9 260 51 YOLO 11n 95 2 2 590 035 6 4 10 9 271 67 YOLO v5n GE 95 3 793 562 2 0 10 9 314 12 从表 3 的实验结果中得出 YOLO v6n 在平均精度均值表现最差 YOLO v7 tiny 虽然平均精度均值处于中等偏上水平但参数量和运算量过大需要能承受较高计算资源的设备不便于部署在移动终端上 YOLO v8n YOLO v10n 各项指标处于中等水平 YOLO 11n 各项指标虽然处于优等水平但不及 YOLO v5n GE YOLO v9 T 和 YOLO v5n GE 的平均精度均值表现最优分别达到 95 5 和 95 3 但 YOLO v9 T 的浮点运算量较大综上所述 YOLO v5n GE 模型参数量

展开阅读全文