LDH-YOLOv11n:一种高效的温室辣椒轻量化目标检测模型.pdf

返回 相似 举报
LDH-YOLOv11n:一种高效的温室辣椒轻量化目标检测模型.pdf_第1页
第1页 / 共9页
LDH-YOLOv11n:一种高效的温室辣椒轻量化目标检测模型.pdf_第2页
第2页 / 共9页
LDH-YOLOv11n:一种高效的温室辣椒轻量化目标检测模型.pdf_第3页
第3页 / 共9页
LDH-YOLOv11n:一种高效的温室辣椒轻量化目标检测模型.pdf_第4页
第4页 / 共9页
LDH-YOLOv11n:一种高效的温室辣椒轻量化目标检测模型.pdf_第5页
第5页 / 共9页
点击查看更多>>
资源描述:
LDH YOLOv11n 一种高效的温室辣椒轻量化目标检测模型 陈娉婷1 2 马海荣1 2 罗治情1 2 官 波1 2 尹延旭3 曾 诚4 1 湖北省农业科学院农业经济技术研究所 武汉 430064 2 湖北省农业科技创新中心农业经济技术研究分中心 武汉 430064 3 湖北省农业科学院经济作物研究所 武汉 430064 4 湖北大学人工智能学院 武汉 430062 摘 要 为解决温室环境下辣椒检测任务的实时性要求高 边缘设备算力受限等问题 本研究提出了一种基于改进 YOLOv11n的轻量化检测模型LDH YOLOv11n 首先 为使模型更加关注复杂环境下辣椒的关键特征 将SimAM注意 力机制融入C3k2模块 其次 为了在减少计算负荷的同时保持检测精度 引入ADown下采样模块替代原有部分卷积 模块 最后 为满足嵌入式设备部署的需求 设计了轻量化LDH Detect lightweight detection head 替代原检测头模块 进一步实现模型轻量化 试验结果表明 改进后模型LDH YOLOv11n在测试集上的准确率 召回率和mAP50 95分别达 到94 3 90 1 和77 0 相较于基线模型YOLOv11n分别提升1 0 2 2 2 1个百分点 模型参数量为1 6 M 浮点 运算量为3 9 G 相较于基线模型分别降低38 5 和38 1 可视化结果表明 改进后模型对复杂环境下的辣椒有良好 的检测效果 边缘设备部署试验结果表明 使用TensorRT加速 改进后模型的推理速度达到264 6 帧 s 能满足实时检 测的要求 综合以上结果表明 改进后模型LDH YOLOv11n更加轻量化 检测效果更好 满足在移动端进行辣椒检测 的高精度和轻量化需求 关键词 YOLOv11n 辣椒果实 深度学习 目标检测 轻量化模型 doi 10 11975 j issn 1002 6819 202505120 中图分类号 S24 TP183 文献标志码 A 文章编号 1002 6819 2025 24 0201 09 陈娉婷 马海荣 罗治情 等 LDH YOLOv11n 一种高效的温室辣椒轻量化目标检测模型 J 农业工程学报 2025 41 24 201 209 doi 10 11975 j issn 1002 6819 202505120 http www tcsae org CHEN Pingting MA Hairong LUO Zhiqing et al LDH YOLOv11n An efficient lightweight object detection model for greenhouse chili peppers J Transactions of the Chinese Society of Agricultural Engineering Transactions of the CSAE 2025 41 24 201 209 in Chinese with English abstract doi 10 11975 j issn 1002 6819 202505120 http www tcsae org 0 引 言 辣椒作为全球广泛种植与消费的重要经济作物及食 品原料 在农业生产与食品工业中占据重要地位 1 2 中 国是全球辣椒产业的核心产地 其种植范围最广 产业 规模最大 3 因此 提升辣椒种植效率 降低生产成本 对增加农民收入 增强产业竞争力具有重要意义 尽管 辣椒生产管理的大部分环节已实现机械化 但采收环节 仍高度依赖人工 当前农村劳动力逐年减少与人口老龄 化问题日益严峻 导致采收环节面临劳动力成本高且供 给不足的双重制约 成为推高种植成本的关键因素 为 此 发展以计算机视觉为核心的智能采摘机器人来替代 人工采摘已成为必然趋势 4 目标检测作为实现机器人 环境感知与自主作业的核心技术 其性能直接决定了采 摘的成功率 温室环境下辣椒目标存在光照弱 叶片遮 挡以及与枝叶背景的纹理 颜色极为相近等复杂环境因 素 对目标检测的准确性和鲁棒性提出了更高要求 传 统目标检测模型在此类场景下难以满足实际应用需求 成为制约采摘机器人发展的瓶颈 近年来 基于深度学习的目标检测模型已广泛应用 于水果蔬菜检测领域 5 8 主流的算法主要包括以Fast R CNN Faster R CNN和Mask RCNN等为代表的二阶段 检测模型 以及SSD系列和YOLO系列为代表的一阶 段检测模型 9 12 其中 YOLO系列凭借其在速度与精 度间的优异平衡 13 14 以及高效的处理速度和较低的计 算负荷 15 尤其契合农业应用中的实时性需求 已被成 功应用于果树授粉 修剪 间伐 16 及农药喷施 17 等多 种作业场景 随着YOLO系列模型的持续迭代与创新 辣椒目标 检测研究在模型性能优化方面取得显著进展 STEVEN等 18 对比了Mask RCNN和YOLOv3两种目标检测模型 发 现在自然环境下 YOLOv3不仅保持了较高的辣椒检测 精度 还在检测速度上具有明显优势 LI等 19 提出了一 种改进的YOLOv4 tiny模型 通过自适应空间特征金字 塔和注意力机制 显著提升了对复杂背景下小型和被遮 挡青色辣椒的检测性能 准确率达到了96 9 NING等 20 通过在YOLOv4中引入CBAM模块 有效优化了模型 对密集种植环境下甜椒的检测性能 改进后模型F1分数 提升9 1个百分点 平均定位精度与无碰撞收获成功率 分别达到89 5 和90 0 单图检测时间仅为0 3 s NAN等 21 针对青椒检测任务 提出了一种融合YOLOv5l 和NSGA II non dominated sorting genetic algorithm II based 剪枝算法的改进模型 实现了检测精度基本不变 收稿日期 2025 05 15 修订日期 2025 11 07 基金项目 国家重点研发计划项目 2023YFD1600304 湖北省农业科技 创新中心 农业经济与信息研究 团队项目 2025 620 000 001 025 作者简介 陈娉婷 博士 副研究员 研究方向为智慧农业 计算机视觉 Email chenpingting 通信作者 罗治情 博士 副研究员 研究方向为农业信息化与人工智 能应用技术 Email luozhq 第 41 卷 第 24 期农 业 工 程 学 报 Vol 41 No 24 2025 年 12 月Transactions of the Chinese Society of Agricultural Engineering Dec 2025 201 的前提下检测速度提升59 0 ZHANG和XIE 22 通过 引入Ghost模块并结合剪枝和蒸馏算法构建了轻量化模 型GNPD YOLOv5s 虽然改进后模型的平均精度均值较 原模型降低了1 3个百分点 却带来了效率的大幅提升 浮点运算量降低了40 9 模型尺寸减少了46 6 推 理速度提升了51 7 魏天宇等 23 引入双向特征金字塔 网络改进YOLOv5s的特征融合网络以增强信息的表达 改进后模型的检测精度达到了95 6 李旭等 24 提出了 一种改进的YOLOX模型 通过引入CA注意力机制和 可变形卷积DCNv2 deformable convnets v2 替换主干 网络中卷积模块 提升模型对不同遮挡情况下辣椒多样 几何特征的感知能力 改进后模型的平均精度均值达到 了93 3 上述研究主要针对在自然环境中辣椒检测模 型的改进 针对温室复杂环境下辣椒检测模型的研究尚 不多见 随着设施农业的迅速发展 辣椒的设施种植面积不 断扩大 设施种植在辣椒种植中已占有重要地位 在温 室环境下 基于边缘计算设备的辣椒实时检测仍面临诸 多挑战 首先 温室内弱光条件容易导致图像质量下降 其次 辣椒果实在颜色和纹理上与枝叶背景高度相似 容易造成目标特征显著性降低 边缘模糊 严重影响模 型检测的准确性 25 最后 低成本的边缘计算设备算力 有限 而目标或镜头的快速移动又会进一步增加检测的 难度 因此需构建兼具轻量化与高精度的检测模型 以 满足实时作业需求 针对以上问题 本研究基于 YOLOv11n提出一种适用于边缘部署的轻量化温室辣椒 检测模型 将SimAM注意力机制融入至C3k2模块 引 入ADown轻量化下采样模块替代部分常规卷积模块 设计轻量化LDH Detect lightweight detection head 模 块替代原检测头模块 以期为温室环境下辣椒轻量化检 测模型提供参考 1 材料与方法 1 1 图像采集 本研究辣椒图像数据采集于湖北省武汉市洪山区湖 北省农业科学院经济作物研究所蔬菜基地高架栽培棚内 该基地地理坐标为东经114 33 北纬30 49 海拔30 m 采集辣椒种类为牛角椒类 其果实形似牛角 果面光滑 青熟果为绿色 多用作鲜食蔬菜 老熟果转为鲜红色 通常用于晒制干椒 辣椒图像的采集设备为智能手机 使用智能手机作 为目标检测样本数据的采集工具 主要优势在于普及率 高 成像能力强且成本较低 可高效获取大规模 多样 化 真实的图像数据 采集时间为2024年6月至8月的 不同光照时段 上午10 00 12 00 下午15 00 17 00 为确保检测模型对辣椒全生长周期形态的检测鲁棒性 本数据集涵盖了从幼果 青果至红熟果的完整样本 同 时 通过变换拍摄距离与角度 共获取1 531幅高分辨 率图像 3 072 4 096像素 经筛选剔除模糊与遮挡严 重图像后 最终构建了包含1 490幅图像的原始数据集 1 2 数据集制作 在辣椒的实时检测任务中 摄像机视图会遇强光弱 光和遮挡情况 还会随着采摘机器人末端执行器的运动 而不断旋转 首先将原始数据集按照7 1 2的比例划分为 训练集 验证集和测试集 为提高模型的泛化能力 将 数据集按照随机高斯噪声 随机亮度调整 随机翻转 随机旋转以及随机色彩饱和度调整5种方式进行数据增 强 增加数据的多样性 增强后 数据集共有8 940张 图像 示例见图1 利用Labelme标注软件对数据集进 行人工标注 将标注好的标签转换为YOLO格式的 TXT文件进行保存 a 原图b 高斯噪声c 亮度 c Brightness d 翻转 d Flip e 旋转f 色彩饱和度 f Saturation a Original image b Gaussian noise e Rotate 图1 辣椒数据增强示例 Fig 1 Examples of data augmentation for chili peppers 2 检测模型改进 2 1 YOLOv11n模型改进 YOLOv11是Ultralytics公司于2024年推出的开源 目标检测模型 其整体架构继承自YOLOv8 包括输入 端 Input 主干 Backbone 颈部 Neck 以及头 部 Head 4个核心部分 26 27 为适应不同检测任务需 求 YOLOv11设计了5种不同参数量的模型 28 29 基于 本研究中轻量化设计的目标 30 选择了参数量最小的 YOLOv11n作为基线模型 31 32 但在边缘计算设备上的 实时检测应用中 YOLOv11n的Backbone Neck和 Head部分仍有模块存在较高的参数量与计算负荷 需在 进一步降低模型参数量和计算负荷的同时 提升模型的 检测精度 以实现在计算资源受限环境下的高效 高精 度检测 为此 本研究从以下三个方面对模型进行改进 首先 将SimAM注意力机制融入C3k2模块 使模型更 加关注复杂环境下辣椒的关键特征 其次 引入 ADown下采样模块替代部分常规卷积模块 以减少计算 量与参数量的同时保持检测性能 最后 设计轻量化 LDH Detect lightweight detection head detect 替代原检 测头模块 以实现进一步轻量化的同时提升检测精度 改进后模型结构如图2所示 202农业工程学报 http www tcsae org 2025 年 LDH Detect LDH Detect LDH Detect 80 80 40 40 20 20 主干 Backbone 颈部 Neck 头部 Head C3k2 SimAM C3k2 SimAM Upsample Upsample Concat Concat Conv Conv C3k2 SimAM ADown C3k2 SimAM ADown C3k2 SimAM ADown C3k2 SimAM SPPF C2PSA C3k2 SimAM C3k2 SimAM Concat Concat ADown ADown MaxPool2dConv MaxPool2d MaxPool2d Concat Conv 空间金字塔池化模块 SPPF输入 Input 注 Conv表示卷积模块 C3k2 SimAM表示融入SimAM注意力机制的C3k2模块 C3k2表示复合卷积模块 SimAM表示三维注意力机制 ADown表示 下采样模块 SPPF表示空间金字塔池化模块 C2PSA表示跨阶段注意力模块 Concat表示特征拼接模块 Upsample表示上采样模块 MaxPool2d表示最 大池化操作 Detect表示检测头模块 LDH Detect表示轻量化设计的Detect模块 Note Conv represents convolutional module C3k2 SimAM represents the C3k2 module with SimAM module C3k2 represents the composite convolutional module SimAM represents the three dimensional attention module SPPF represents a spatial pyramid pooling module C2PSA represents the cross tage attention module Concat represents the feature join module Upsample represents the upsampling module MaxPool2d represents the max pooling operation Detect represents the detection head module LDH Detect represents the redesigned lightweight detective head module 图2 改进后模型LDH YOLOv11n网络结构图 Fig 2 The network structure of improved LDH YOLOv11n model 2 1 1 C3k2模块改进 在温室环境下 光线不足 枝叶遮挡以及辣椒果实 在不同生长时期的形态多样性 对目标检测模型的特征 提取提出了更高的要求 SimAM是一种基于神经科学中 的空间抑制理论的轻量级注意力机制 33 在无需增加模 型参数的前提下 通过三维注意力机制定位最具信息量 的神经元特征 有效捕捉辣椒果实与叶片间细微而关键 的差异 34 35 因此 本研究通过将SimAM注意力机制 融入C3k true分支的Bottleneck单元中 构建了C3k2 SimAM模块 如图3所示 C3k2 SimAM模块的工作流程如图3中C3k true所 示 在接到输入特征图后 首先通过一个1 1卷积核直 接处理进行通道数调整与特征整合 这一初始步骤对于 统一来自不同尺度或阶段的辣椒图像特征至关重要 随 后 利用Chunk操作将处理后的特征图沿通道维度分割 为两个并行分支 其中一条分支通过1 1卷积核进行简 单的线性变换 以保留辣椒的基本视觉特征 如纹理 颜色等 另一个分支则进行复杂的特征提取 该分支首 先通过一个1 1卷积核进行通道调整 接着将其送入 SimAM模块 该模块会计算特征图中每个神经元的重要 性 并生成一个注意力权重图 用于增强辣椒的关键特 征 同时有效抑制背景中的枝叶或其他干扰因素所产生 的无关特征 SimAM模块处理后 再与Bottleneck单元 的输入进行逐元素相加 确保在特征层级较深的情况下 辣椒的细微特征也能有效传递 最终 两条分支的输出 特征图在通道维度上进行拼接 Concat 并由1 1卷 积核完成特征融合 这种设计使得模型能够自适应地增 强对温室环境下各种形态 光照条件下辣椒的关注度 同时通过残差连接保证了梯度的有效回传和训练的稳定 性 从而在不显著增加计算成本的前提下提升了模块的 整体性能 2 1 2 ADown平均池化下采样模块 为满足边缘设备低成本部署的需求 模型需在维持 高精度的同时具备更小的参数量与计算复杂度 然而 YOLOv11n中主要采用步长为2的常规卷积模块进行下 采样 该方式虽能有效压缩特征图尺寸 但连续堆叠的 卷积模块会增加模型的参数量与计算负荷 因此 本研 究引入ADown模块替代部分常规卷积模块 ADown 模块作为一种平均池化下采样模块 通过融合池化与卷 积操作 在降低模型复杂度的同时维持了检测性能的稳 定 36 38 在辣椒果实检测任务中 温室环境常伴随光照 弱与枝叶遮挡等问题 易导致特征退化与噪声干扰 ADown模块通过平均池化操作有效平滑局部噪声 增强 特征表达的鲁棒性 从而提高模型对辣椒形状 颜色以 及纹理等关键特征的辨识能力 在压缩空间分辨率的同 时 ADown模块维持了对小尺寸目标的特征建模能力 这对于密集场景下的检测至关重要 综合而言 ADown 模块的引入实现了检测精度与计算效率的协同优化 为 第 24 期陈娉婷等 LDH YOLOv11n 一种高效的温室辣椒轻量化目标检测模型203 在边缘部署鲁棒性强的轻量化检测系统提供了有效技术 支持 Conv 1 1 Chunk Bottleneck Concat C3k False Conv 1 1 输入 Input 输出 Ouput Conv 1 1 Chunk Bottleneck Concat C3k True Conv 1 1 Conv 1 1 Concat Conv 1 1 Conv 1 1 Conv 1 1 SimAM 注 Chunk表示数据分块操作 C3k是C3k2模块的决策变量 Bottleneck 是C3k2中的主要组成单元 负责特征的提取和变换 表示逐元素相加 Note Chunk represents the data partitioning operation C3k is the decision variable of C3k2 module Bottleneck is the main component within C3k2 responsible for feature extraction and transformation represents the addition of elements on by one 图3 C3k2 SimAM模块结构图 Fig 3 Structure of C3k2 SimAM attention module ADown下采样模块的结构如图4所示 该模块首先 通过二维平均池化操作 AvgPool2d 对输入特征图进行 空间维度的降采样 以在降低计算量的同时保留整体特 征信息 随后 降采样后的特征图沿通道维度被均匀分 割为两个并行的处理分支 第一个分支旨在捕获局部区 域内的最显著特征 它将特征图依次送入最大池化操作 MaxPool2d 和1 1卷积核进行处理 第二个分支则 通过3 3卷积核来提取更丰富的局部空间上下文信息 最终 两个分支所提取的互补性特征在通道维度上进行 拼接 融合成一个信息更丰富的输出特征图 通过这种 并行多路径的设计 ADown模块能够在执行下采样操作 的同时 有效融合不同感受野下的特征信息 从而在保 持轻量化的前提下 增强了对多尺度特征的表征能力 AvgPool2d Chunk MaxPool2d Conv 3 3 Concat Conv 1 1输入 Input 输出 Ouput 注 AvgPool2d表示二维平均池化操作 Note AvgPool2d represents a 2D average pooling operation 图4 ADown模块结构图 Fig 4 Structure of ADown module 2 1 3 Detect模块改进 Detect模块作为决定模型最终预测输出的关键部分 其计算效率直接影响着整体推理速度 原Detect模块融 合了常规卷积与深度可分离卷积 虽有效增强了特征表 达能力 但并行的多分支结构及复杂的卷积堆叠带来了 较高的参数量与计算负荷 成为限制模型在资源受限设 备上应用的瓶颈 如图5所示 因此 本研究设计了一 种轻量化LDH Detect模块以替代原Detect模块 如图6所示 轻量化LDH Detect模块采用了一种前 置特征提取设计 首先利用两个计算成本更低的3 3分 组卷积 GroupConv 构成的共享分支对输入特征进行 前置高效提取 随后 将处理的特征送入两个仅由1 1 卷积核构成的极简并行分支 负责通道信息整合与维度 变换 相较于原Detect模块复杂的特征提取分支 采用 先共享后分离的架构将计算重心前移并大幅简化了并行 结构 在降低参数量与计算复杂度的同时 迫使模型学 习更高效的特征表示 这种高效的设计不仅提升了模型 的整体推理速度 也增强了模型在复杂背景下的泛化能 力 避免了对冗余特征的过度拟合 综合而言 轻量化 LDH Detect模块的引入实现了模型在检测精度与推理效 率间的更优平衡 为在低功率边缘计算设备上实现高帧 率 高精度的实时辣椒检测提供了重要的结构支持 Conv3 3 DWConv3 3 Concat Conv3 3 Conv2d 1 1 Conv 1 1 DWConv3 3 Conv 1 1 Conv2d 1 1 输入 Input 输出 Ouput 注 DWConv表示深度可分离卷积模块 Con2d表示二维卷积模块 Note DWConv represents the depthwise separabel convolution module Con2d represents the 2D convolutional module 图5 原Detect模块结构图 Fig 5 Original structure of YOLOv11n detection head GroupConv 3 3 GroupConv 3 3 Conv2d 1 1 Conv2d 1 1 Concat输入Input输出Ouput 注 GroupConv表示分组卷积模块 Note GroupConv represents the grouped convolution module 图6 轻量化LDH Detect模块结构图 Fig 6 Improved structure of YOLOv11n detection head 2 2 试验方法 2 2 1 试验平台配置与参数设置 本研究使用的操作系统为Ubuntu 20 04 GPU型号 为NVIDIA Tesla V100 CPU型号为Intel Xeon Gold 5 218 2 30 GHz 显存容量为32 GB 深度学习框架采 用PyTorch 2 5 1 开发环境为Python 3 10 16 模型输入 图像尺寸为640 640像素 批量大小为16 模型参数优 化使用了Ultralytics提供的默认优化器 训练迭代次数 为39 200次 2 2 2 模型评价指标 本研究模型评价指标采用的是 准确率 precision P 召回率 recall R F1分数 F1 score 平均 精度均值 mean average precision mAP 参数量 parameters 106 M 浮点运算量 floating point operations FLOPs 3 结果与分析 3 1 消融试验结果 为验证各改进模块在辣椒目标检测中的有效性 本 研究以YOLOv11n为基准模型开展消融试验 主要从检 测精度 准确率 召回率 mAP50 95 模型参数量 浮 点运算量三方面进行对比分析 结果如表1所示 204农业工程学报 http www tcsae org 2025 年 表 1 消融试验结果 Table 1 Results of the ablation experiment C3k2 SimAM Adown LDH Detect 准确率 P 召回率 R mAP50 95 参数量 Parameters 106M 浮点运算量 FLOPs G o o o 93 3 87 9 74 9 2 6 6 3 o o 92 9 89 2 74 3 2 4 6 1 o o 92 9 90 4 76 5 2 1 5 3 o o 94 1 88 8 75 3 2 3 5 1 o 93 5 89 4 75 1 2 1 4 9 o 93 6 90 4 76 9 1 8 4 1 o 93 4 90 4 75 7 1 9 5 1 94 3 90 1 77 0 1 6 3 9 注 P表示准确率 R表示召回率 o 表明不使用该模块 表明使 用该模块 Note P represents the precision R represents the recall o means not using this module and means using this module 根据表1结果分析可知 与基线模型相比 使用 C3k2 SimAM模块后 召回率提升1 3个百分点 准确 率和mAP50 95有轻微下降 但参数量和浮点运算量也有 小幅下降 分析原因在于 C3k2 SimAM模块通过其无 参数注意力机制自适应地评估特征图中各神经元的重要 性 从而帮助模型自适应地增强对辣椒细微特征的关注 度 同时抑制背景中枝叶等无效信息的干扰 这种对关 键信息的聚焦使得模型能更有效地捕获并识别目标 从 而提升了召回率 引入ADown模块后的模型较基准模 型在召回率和mAP50 95分别提升2 5和1 6个百分点 同 时 模型参数量和浮点运算量分别下降19 2 和15 9 轻量化效果明显 分析原因在于 ADown下采样模块通 过平均池化操作有效抑制噪声 保留关键特征 又利用 双分支并行结构在降低模型的计算量的同时提升了特征 质量 最终实现了双重优化 与基线模型相比 使用 LDH Detect模块的模型在所有精度指标上均获得提升 其中准确率 召回率和mAP50 95分别提升0 8 0 9和 0 4个百分点 同时 模型参数量和浮点运算量分别降 低11 5 和19 0 分析原因在于 轻量化LDH Detect 模块结构从复杂的空间特征提取转变为高效的通道信息 整合与变换 迫使模型学习更为精炼和高效的特征表示 避免了对次要特征的过度建模 从而在大幅降低模型复 杂度的同时 提升了对核心目标的检测能力 最后 通 过同时采用C3k2 SimAM ADown以及LDH Detect三 个模块 使改进后模型LDH YOLOv11n的准确率 召 回率和mAP50 95分别达到94 3 90 1 和77 0 模型 参数量和浮点运算量分别为1 6 M和3 9 G 与基准模型 YOLOv11n相比 准确率 召回率和mAP50 95分别提升 1 0 2 2和2 1个百分点 同时模型参数量和浮点运算量 降低38 5 和38 1 此结果表明 三种模块同时使用 时产生了较好的协同增强效应 分析原因在于各模块在 特征提取与处理流程中形成了功能互补 逐级优化的高 效协作机制 ADown模块为模型提供了高质量 低噪声 的下采样特征 为后续处理提供了信息密度高 冗余度 低的优质特征图 C3k2 SimAM模块在此基础上对细微 特征进行精炼 实现对辣椒果实关键特征的精准聚焦与 语义增强 最后 轻量化设计的LDH Detect模块以其高 效结构对这些优质特征进行快速解码与预测 这一高效 协作流程使得改进后模型在实现深度轻量化的同时 检 测精度不降反升 达到了精度与效率的最佳平衡 3 2 ADown模块不同位置部署的检测结果 为评估ADown模块在网络结构中的最优部署策略 本研究设计了对比试验 分别将该模块独立应用于模型 Backbone Neck以及同时应用于两部分 以未引入 ADown模块的改进后模型为基准进行检测性能对比分析 试验结果如表2所示 表 2 ADown模块不同位置部署的检测结果 Table 2 Detection results of ADown module applied at different positions 替换的模块 Replaced module P R mAP50 95 参数量 Parameters M 浮点运算量 FLOPs G 93 5 89 4 75 1 2 1 4 9 主干 Backbone 94 5 89 6 76 6 1 8 4 1 颈部 Neck 92 0 90 1 75 0 2 0 4 8 主干和颈部 Backbone and Neck 94 3 90 1 77 0 1 6 3 9 根据表2结果分析可知 与未加入ADown模块模 型相比 仅在Backbone中引入ADown模块 模型的准 确率 召回率和mAP50 95分别提升1 0 0 2和0 9个百 分点 模型参数量和浮点运算量降低14 2 和16 3 实现了精度与效率的双重优化 分析原因在于 Backbone负责从输入图像中进行层次化的特征提取 其 前期的下采样操作对后续所有层的特征质量起着决定性 作用 与未加入ADown模块相比 仅在Neck中引入 ADown模块召回率提升了0 7个百分点 参数量和浮点 运算量分别降低4 8 和2 0 但准确率和mAP50 95分 别降低1 5个百分点和0 1个百分点 分析原因在于 Neck的下采样路径旨在将深层语义信息与浅层空间细节 进行精确对齐和融合 ADown模块的池化操作可能会丢 失部分对小目标检测至关重要的精细空间信息 从而破 坏了特征融合的有效性 导致检测精度下降 同时在 Backbone和Neck引入ADown模块 与未加入ADown 模块相比准确率 召回率和mAP50 95分别提升0 8个百 分点 0 7个百分点和1 9个百分点 参数量和浮点运算 量分别降低23 8 和20 4 实现了最优的检测性能 分析原因在于 Backbone中的ADown模块为整个模型 提供了高质量 低噪声的特征基础 这为Neck的特征融 合奠定了良好基础 在此基础上 Neck中引入ADown 模块所带来的效率提升的优势得以充分显现 同时其可 能引发的特征信息损失 也能因Backbone已提供的优质 特征而得到有效补偿 最终 该组合部署策略在最大化 计算效率的同时 实现了最高的检测精度 达到了最佳 的性能权衡 因此 本研究最终采用在Backbone与 Neck同时引入ADown模块的方案 作为LDH YOLOv11n模型的最终架构 3 3 数据集增强前后的结果比较 高质量数据集是提升目标检测模型性能的关键支撑 在温室环境下 复杂的成像条件 例如光照不足 枝叶 干扰及背景干扰等 导致原始数据集存在规模不足 场 景多样性欠缺等问题 进而制约了模型的泛化能力与鲁 棒性 为解决此问题 本研究设计并实施了针对性的数 据增强策略 并基于改进后模型LDH YOLOv11n 对比 第 24 期陈娉婷等 LDH YOLOv11n 一种高效的温室辣椒轻量化目标检测模型205 分析了数据集增强前后的检测性能变化 试验结果如 表3所示 表 3 数据集增强前后结果比较 Table 3 Differences between before and after dataset enhancement 数据集 Dataset P R F1分数 F1 score mAP50 mAP50 95 原始数据集 Raw dataset 81 4 59 7 69 2 65 7 44 4 增强后数据集 Enhanced dataset 94 3 90 1 92 2 96 1 77 0 根据表3结果分析可知 数据增强策略对模型性能 带来了显著提升 与原始数据集的检测结果相比 增强 后数据集的检测结果在准确率 召回率 F1分 数 mAP50和mAP50 95分别提升了12 9 30 4 23 0 30 4和32 6个百分点 充分说明数据增强对于提升模型 综合检测能力具有关键性作用 分析原因在于 数据集 增强策略极大地丰富了训练样本的多样性 使模型学习 到更具不变性的特征信息 进而在检测与枝叶背景颜色 相似 远距离小尺度以及部分被遮挡的辣椒果实时 模 型表现出更高的稳定性和准确性 未来可进一步探索更 前沿的数据生成与增强策略 例如 引入混合类增强策 略以创造更复杂的样本边界 或利用生成对抗网络 GAN Generative Adversarial Network 合成具有高度真 实感与多样性的虚拟样本 构建出特征更丰富的农业目 标检测数据集 为研发在全天候 全生长周期下稳定运 行的自动采摘系统提供更为坚实的数据支持 3 4 不同检测模型的性能比较 为了全面评估改进后模型LDH YOLOv11n的检测 性能 本研究选取当前主流的目标检测模型Faster R CNN SSD 300 YOLOv3 tiny YOLOv5n YOLOv6n YOLOv7 tiny YOLOv8n YOLOv10n YOLOv11n和 YOLOv12n在相同条件下进行对比试验 结果如表4所示 表 4 不同目标检测模型在测试集中的性能对比结果 Table 4 Performance comparison results of different objectdetection models on the test set 模型 Model P R mAP50 95 参数量 Parameters M 浮点运算量 FLOPs G Faster R CNN 87 6 95 4 71 9 41 3 71 6 SSD 300 89 4 90 3 69 8 23 7 30 4 YOLOv3 tiny 94 0 89 7 76 3 12 1 18 9 YOLOv5n 93 0 87 8 73 9 2 5 7 1 YOLOv6n 92 2 87 9 73 1 4 2 11 8 YOLOv7 tiny 94 4 93 7 77 5 6 0 13 0 YOLOv8n 93 5 89 2 76 3 3 0 8 1 YOLOv10n 91 9 88 4 76 4 2 6 8 2 YOLOv11n 93 3 87 9 74 9 2 6 6 3 YOLOv12n 92 8 88 6 74 4 2 5 5 8 LDH YOLOv11n 94 3 90 1 77 0 1 6 3 9 根据表4结果分析可知 Faster R CNN和SSD 300 模型虽取得了较高的召回率和准确率 但巨大的参数量 和计算量导致模型难以在边缘设备上实时运行 YOLO 系列模型普遍在参数量和浮点运算量上展现出巨大优势 成为轻量化目标检测的主流 然而 在YOLOv3 tiny 5n v6n v8n v10n v11n及v12n等轻量级的系列模 型中 性能呈现出一定的波动 mAP50 95指标集中在73 1 76 4 的区间 参数量在2 5 12 1 M之间 浮点运算量 则在5 8 18 9 G之间 这表明在轻量级模型中进一步提 升精度同时降低复杂度依然是核心挑战 与表4中其他YOLO系列模型的对比中 改进后模 型LDH YOLOv11n的综合优势较为突出 YOLOv7 tiny 在本测试集上取得了最高的mAP50 95值77 5
展开阅读全文

copyright@ 2018-2020 华科资源|Richland Sources版权所有
经营许可证编号:京ICP备09050149号-1
    

     京公网安备 11010502048994号