资源描述:
第48卷第3期 2025年5月 河北农业大学学报 JOURNAL OF HEBEI AGRICULTURAL UNIVERSITY Vol 48 No 3 May 2 0 2 5 一种基于高光谱技术的温室环境下叶片遮挡 树莓果实识别模型 陈竹筠 1 席瑞谦 1 张晓乾 1 顾玉红 2 任振辉 1 1 河北农业大学 机电工程学院 河北 保定 071001 2 河北农业大学 生命科学学院 河北 保定 071001 摘 要 在智能化农业管理中 精准识别被叶片遮挡的树莓果实是实现高效采摘作业的关键难题 传统机器视觉 技术因果实易被叶片遮挡而难以准确定位 影响采摘效率与质量 也无法满足温室对果实生长状况精准监测与 管理的需求 本研究针对现有机器视觉技术在处理遮挡问题上的局限性 开发了一种基于高光谱技术的树莓 果实识别方法 首次引入并优化了 voting RF MLP 集成模型 通过采集不同遮挡状态下的树莓果实反射率光 谱数据 为模型训练提供了全面的数据集 并采用定制化的数据预处理和 PCA 特征提取算法提升数据质量 voting RF MLP 模型结合随机森林 RF 和多层感知器 MLP 优势 通过 GridSearchCV 算法优化超参数 确保最优性能 测试结果显示 voting RF MLP 模型在各类遮挡状态下分类性能卓越 准确率达到0 843 5 精确度 召回率和 F 1 分数均显著优于传统单一模型 这一成果提高了树莓果实识别的准确性 该模型可为自动 化采摘设备提供精准的果实定位支持 在叶片遮挡条件下实现树莓果实深度距离信息 遮挡距离 的预测 且 952 条光谱样本推理时间仅需13 43 s 可为高光谱技术在复杂农业场景中的高效计算提供算法基础 助力精准 农业的智能化升级 关 键 词 高光谱技术 机器学习 模型优化 树莓果实识别 集成模型 voting 算法 中图分类号 O433 4 S663 2 开放科学 资源服务 标识码 OSID 文献标志码 A Research of leaf covered raspberry fruit identification based on hyperspectral techniques CHEN Zhujun 1 XI Ruiqian 1 ZHANG Xiaoqian 1 GU Yuhong 2 REN Zhenhui 1 1 College of Mechanical and Electrical Engineering Hebei Agricultural University Baoding 071001 China 2 College of Life Sciences Hebei Agricultural University Baoding 071001 China Abstract In intelligent agricultural management accurate identification of raspberry fruits that are covered by leaves is a key challenge to achieve efficient picking operations Raspberry fruits are easy to be covered by leaves resulting in difficulties to accurately locate the position of the fruits by traditional machine vision techniques which affects the efficiency and quality of fruit picking and accurate monitoring for greenhouse management In 收稿日期 2025 05 04 基金项目 河北省重点研发计划项目 20326338D 第一作者 陈竹筠 1993 女 黑龙江大庆人 博士研究生 从事光谱分析 农业机械化工程研究 E mail Alexchen1219 通信作者 任振辉 1968 男 河北保定人 博士 教授 从事智能检测与控制技术 人工智能与数字农业技术研究 E mail renzh68 本刊网址 文章编号 1000 1573 2025 03 0107 11 DOI 10 13320 ki jauh 2025 0045108 第 48 卷 河北农业大学学报 树莓果实精准识别对智能化农业管理极为关 键 1 3 但其体积小且易受叶片遮挡的特性 导致 现有机器视觉技术 4 在处理被叶片完全遮挡的树莓 果实识别准确率不高 5 6 严重制约采摘效率与果 实生长监测能力 7 高光谱技术通过分析物体反射 率光谱的细微差异 8 9 为解决遮挡问题提供了新 思路 相比传统机器视觉技术 能通过分析光谱特 征来识别被叶片遮挡的树莓果实 而不仅仅依赖于 果实的外观形态信息 近年来 集成学习模型在农业智能化领域取得 了显著进展 尤其在作物表型分析与复杂环境感 知任务中展现出重要价值 在作物病害识别方向 SAMIA 等 10 提出一种基于多阶段卷积神经网络 CNN 的集成学习框架 通过 Bagging 策略融合 多分支网络 在小麦叶病分类中实现最高99 16 的 准确率 但其模型训练耗时长达100 min 且依赖高 性能计算设备 难以满足低资源环境下的实时性需 求 在土壤参数反演领域 Tao 等 11 利用 Stacking 集成算法整合多特征 光谱 地形 蒸散量 构 建了葡萄园土壤湿度预测模型 平均 R 2 0 750 4 然而该方法受限于特定作物类型与传感器数据 对 跨场景任务的泛化能力不足 在果实产量预测领域 Chen 等 12 结合无人机 LiDAR 与多光谱数据 设计 了 SVR KNN 集成模型 成功实现单株苹果树产量 预测 验证集 R 2 0 813 但未针对可控农业环境 中普遍存在的叶片遮挡问题提出有效解决方案 在 果实成熟度检测方向 Olisah 等 13 开发了基于可见 近红外光谱的多输入 CNN 集成分类器 在黑莓成熟 度识别中达到95 1 的准确率 但其依赖专用滤光 片设备 且未验证遮挡条件下模型的鲁棒性 尽管上述研究通过集成策略提升了模型性能 但 仍然存在一些共性问题 首先 现有模型大多在计 算效率与精度之间存在矛盾 例如 高精度的集成 方法 如多分支卷积神经网络 往往需要消耗大量 计算资源 难以满足自动化采摘机械对实时性的要 求 其次 多数研究仅聚焦于单一场景下的特征提取 如病害识别或果实成熟度检测 缺乏针对复杂遮挡 条件的特征融合机制 最后 这些模型对数据的依 赖性较强 部分模型需要依赖特定传感器或大规模 标注数据 这在一定程度上限制了它们在中小型可 控农业环境的实际应用 如何构建计算资源需求低 且高鲁棒性的集成模型 以实现遮挡场景下的精准 果实识别 仍是当前农业智能化研究的关键挑战 本文针对上述问题 提出一种基于动态权重分 配的软投票集成模型 voting RF MLP 结合高 光谱数据局部 全局特征解析能力 在叶片遮挡条 件下实现低计算成本与高精度的树莓果实识别 本 文研究包括 1 通过 PCA 关键波段筛选降低数 据维度 提升计算效率 2 设计基于验证集精度 的动态权重分配策略 融合随机森林 RF 与多层 感知器 MLP 优势 解决遮挡条件下分类鲁棒性 问题 试验表明 模型准确率达0 843 5 推理时间 仅 13 43 s 为复杂农业场景中的实时果实定位提供 了高效解决方案 this study a novel raspberry fruit recognition method based on hyperspectral technology was developed to address the limitations of existing machine vision techniques in dealing with the cover problem We first introduced the voting RF MLP integration model which was optimized in this study A comprehensive dataset for model training was provided by collecting spectral data of raspberry fruit reflectance under different cover states Customised data preprocessing and PCA feature extraction algorithms were used to significantly improve the data quality To ensure the optimal performance of the model the hyperparameters were optimized by the GridSearchCV algorithm using voting RF MLP model combing the advantages of Random Forest RF and Multi Layer Perceptron MLP The test results showed that the voting RF MLP model exhibited excellent classification performance under all types of cover states reaching an accuracy of 0 843 5 with significantly better precision recall and F1 score than that of the traditional single model These results suggested improvement of the recognition accuracy of raspberry fruit The model provided accurate fruit positioning supporting automated picking machinery in orchards and predicted the depth distance information of raspberry fruits under leaf shading conditions shading distance The inference time for the 952 spectrum sample was only 13 43 seconds providing an algorithmic basis for lightweight applications of hyperspectral technology in complex agricultural scenarios and helping to intelligently upgrade precision agriculture Keywords hyperspectral technology machine learning modelling optimisation raspberry fruit identification integrated model voting algorithm109 陈竹筠 等 一种基于高光谱技术的温室环境下叶片遮挡树莓果实识别模型 第3期 1 试验方案与技术路线 1 1 试验方案 1 1 1 试 验 环 境 与 对 象 试验在河北省保定市 新云家庭农场的温室进行 温室内温度维持在 22 28 相对湿度55 70 光照强度分2 组 上午组 9 00 11 00 15 000 25 000 lux 和下午 组 13 00 15 00 30 000 50 000 lux 研究对 象为 海尔特兹 Group A 和 波尔卡 Group B 2 个树莓品种 图1 图 1 光谱数据采集与遮挡状态示意图 Fig 1 Spectrum data acquisition and cover status diagram 1 1 2 试 验 方 法 与 内 容 采用 Optosky ATP2400 光 谱仪 波段191 1 106 nm 分辨率0 36 nm 采 集叶片遮挡下的树莓果实反射光谱 光谱仪通过数 据线连接计算机 数据通过自带软件进行储存 采 集过程中探头紧贴叶片表面 人工调整叶片与果实 间距 确保完全覆盖 设置4 种遮挡状态 无遮挡 遮挡距离0 2 4 cm 共采集4 758 组光谱数据 每遮挡状态约1 190 组 品种分布均衡 表 1 表 1 光谱数据采集数量分布 Table 1 Spectral data acquisition quantity distribution 遮挡状态 Covered state 品种 A Group A 品种 B Group B 采集组数 Number data 无遮挡 595 598 1 193 遮挡距离0 cm 595 596 1 191 遮挡距离2 cm 590 598 1 188 遮挡距离4 cm 590 596 1 186 1 2 技术路线 技术路线见图2 2 集成模型的建立 2 1 数理基础 2 1 1 光 谱 数 据 预 处 理 高光谱数据预处理包括噪 声去除 基线校正与特征提取 14 光谱数据预处 理过程如图3 所示 首先截取400 900 nm 有效波 段 消除极端噪声 图3a 3b 随后采用小波 变换 Daubechies db4 消除背景信号 15 结 合 SG 滤波 5 点窗口 和 SNV 散射校正优化数据 质量 16 图 3c 2 1 2 光谱特征分析与波段提取 基于预处理数据 分析不同遮挡状态下的光谱特征 并提取关键波段 图 4 展示了不同遮挡状态下的光谱反射率曲线与 PCA 选取的特征波段 其中 Class0 表示无遮挡状态 Class1 Class2 和 Class3 分别代表叶片与被遮挡果 实距离为 0 2 和 4 cm 的情况 600 700 nm 波段 Class0 曲线上升 有遮挡 曲线则趋于平缓或下降 说明无遮挡时果实光谱特 征直接反映在反射率上 而有遮挡时叶片特征占主 导地位 改变反射率趋势 其中 700 nm 处无遮挡果 实反射率峰值显著高于遮挡状态 且随遮挡距离增 加呈现红移现象 700 900 nm 波段中 叶片特征 主导反射率变化 导致遮挡状态下曲线趋于平缓 反射率数据采集 高光谱数据采集 数据预处理与特征提取 集成模型构建 集成模型评估 超参数调优 性能评估 鲁棒性测试 无遮挡 0 cm 2 cm 4 cm 数据清洗 去噪 空值 散射校正 S N V 归一化 基模型的训练 集成模型的构建 模型优化与验证 树莓品种 光照强度 P C A 降维 关键波段筛选 基线校正 小波变换 平滑 S G 滤波 图 2 技术路线 Fig 2 Technical route110 第 48 卷 河北农业大学学报 本研究采用主成分分析 PCA 17 提取特征 累计方差贡献率达87 35 图8 基于载荷阈值 筛选出624 722 mm 727 790 nm 等关键波段 200 400 400 400 500 500 600 600 600 800 700 700 1 000 800 800 1 200 900 900 400 300 200 100 0 3 2 1 0 1 2 3 3 2 1 0 1 2 反射率 Re ectance 反射率 相对单位 Re ectance relative unit 反射率 相对单位 Re ectance relative unit a 全波段原始数据 b 提取的反射率数据 c 预处理后数据 波段 nm Wavelength 波段 nm Wavelength 波段 nm Wavelength 图 3 光谱数据预处理过程 Fig 3 The process of pre processing spectral data class0 class1 class2 class3 反射率 Re ectance 波段 nm Wavelength 624 722 838 900 727 790 400 500 600 700 800 900 图 4 各遮挡状态下的平均反射率数据 Fig 4 Average reflectance data for each cover state 2 2 基模型的选取与优化 集成学习通过结合多个基学习器的预测提升模 型泛化能力与鲁棒性 18 本研究选取了逻辑回归 LR 19 RF 20 和 MLP 21 作为候选模型 基于第三部分中的各类别分类精确度 见表3 与 综合评价指标结果 见表4 确定最适合作为集 成模型基础模型为 RF 与 MLP 其超参数通过搜索 GridSearchCV 优化后确定 表 7 2 3 建立 voting RF MLP 集成模型 本文采用投票集成策略 构建 voting RF MLP 模型 图5 该模型结合了 RF 和 MLP 的优势 RF 因其在处理高维数据和捕捉复杂特征关系方面的 能力而被选用 而 MLP 则因其深度学习能力 能够 模拟复杂的非线性关系 2 3 1 集 成 数 理 模 型 voting RF MLP 模型采用软 投票策略 通过熵权法结合验证集分类精度动态分 配基学习器权重 以优化遮挡场景下的分类性能 具体步骤如下 1 数据标准化 对 RF 和 MLP 在 4 种遮挡 状态下的分类精度 表3 进行 Min Max 归一化处 理 x ij 计算如公式 1 所示 x ij x ij min x j max x j min x j 1 2 信息熵计算 基于标准化数据计算各模型 的信息熵 22 以确定初始权重 E j 计算如公式 2 所示 式中 p ij i 1 N x ij x ij E j 1 ln n i 1 n p ij lnp ij 2 3 权重确定 结合信息熵与验证集精度差异 动态调整最终权重 23 24 j 计算如公式 3 所示 j j 1 m 1 E j 1 E j 3 动态调整 参考集成学习中的性能敏感策略 25 设定差异阈值 若两模型精度差异 5 则显著调 整 权重增减0 1 若差异1 5 则小幅调 整 权重增减0 05 从而得到最终权重 final 最 终权重分配如表 2 所示 在无遮挡状态下 MLP 权重 更 高 0 72 而 在 4 cm 遮挡时 RF 权重占优 0 58 体现了模型性能的互补性 如图5 所示 vot RF MLP 模型采用了软投票 策略 即通过计算所有基学习器预测概率的加权平 均来形成最终的预测概率集合 P final 计算如公式 4 所示 P final y k W RF P RF y k W MLP P MLP y k 4 111 陈竹筠 等 一种基于高光谱技术的温室环境下叶片遮挡树莓果实识别模型 第3期 图 5 voting RF MLP 结构 Fig 5 voting RF MLP structure 这种策略允许模型在做出最终决策时 更加细 致地权衡每个基学习器的预测 每个基学习器生成 一个预测概率集合 这些集合被整合以形成最终的 表 2 权重分配方案 Table 2 Weighting scheme 遮挡状态 Covered state 初始权重 RF j RF 初始权重 MLP j MLP 最终权重 RF final RF 最终权重 MLP final MLP 分配依据 Allocation basis 无遮挡 0 38 0 62 0 28 0 72 MLP 精度显著更高 差异 6 74 调整 0 1 遮挡距离0 cm 0 42 0 58 0 37 0 63 MLP 略优 差异 2 24 调整 0 05 遮挡距离2 cm 0 47 0 53 0 37 0 63 MLP 优势较高 差异 5 73 调整 0 1 遮挡距离4 cm 0 53 0 47 0 58 0 42 RF 显著占优 差异 3 16 调整 0 05 数据输入 Preprocessed Data 基学习器独立预测 Based Learners 权重融合 Dynamic Fusion 分类决策 Classi cation 输出结果 Output 波段范围 550 750 nm 特征维度 PC1 PC2 RF 40 棵决策树 MLP Softmax概率输出 基于权重表 P final 遮挡距离类别 果实位置深度信息 argmax P final 图 6 模型应用流程图 Fig 6 Flowchart of the model application 3 试验结果与分析 3 1 试验环境与参数 本文所使用试验平台的硬件环境为 Intel R Core TM i9 13900HX 2 20 GHz CPU NVIDIA GeForce RTX 软件环境为64 位 Anaconda v23 7 4 中自带的 Python 3 11 5 以及自定义的 Python 脚本 3 2 模型性能评价指标 本文采用混淆矩阵 准确率 分类报告 精确 率 F 1 分数和计算时间 等关键指标评估分类模型 性能 26 3 3 混淆矩阵分析 通过混淆矩阵 图7 量化各模型在不同遮挡 状态下的分类性能 3 3 1 基础模型选取依据 本研究结合图7 混淆矩 阵计算各模型在各遮挡状态下的分类精确度 数据 结果见表3 LR 模型虽在0 cm 遮挡状态下精确 度较高 0 831 3 但其性能波动显著 4 cm 遮挡 时降至0 730 2 可能影响集成模型稳定性 故未 纳入最终基模型组合 RF 模型在高维数据处理与复 杂特征关系捕捉中表现优异 其通过多棵决策树的 集成策略有效捕捉复杂特征关系 尤其在4 cm 遮挡 场景下分类精度达0 813 表3 表明其对噪声干 扰和大距离遮挡的强鲁棒性 MLP 模型凭借深度神 经网络架构 在无遮挡 精度0 923 8 及2 cm 遮 挡 精度0 798 8 状态下表现最优 擅长建模光谱 数据中的非线性特征 预测 最终预测是通过取预测概率最高的类别来确 定的 这一步骤通过 argmax 函数实现 其数学表达 式为 P final argmax P1 P2 5 2 3 2 模型在树莓果实识别中的应用流程 模型应 用流程如图6 所示 主要包括数据输入 基学习器 预测 动态权重融合及分类决策以及结果输出4 个 阶段 输出的结果可以划分遮挡距离 而遮挡距离 则能被视为果实三维定位技术中深度信息 即为第 三维度的坐标值 在采摘机械应用领域中 并结合 果实二维定位数据输出果实的空间坐标 x y z 为采摘机械臂提供定位依据 112 第 48 卷 河北农业大学学报 表 3 各类别分类精度结果 Table 3 Precision results by category 分类状态 Cassification of state of cover LR 精确度 LR Precision RF 精确度 MLP 精确度 voting RF MLP 精确度 差异 MLP RF RF Precision MLP Precision V oting RF MLP Precision Difference MLP RF 无遮挡 0 785 9 0 856 4 0 923 8 0 927 8 0 067 4 0 cm 0 831 3 0 759 0 0 781 4 0 821 2 0 022 4 2 cm 0 786 9 0 741 5 0 798 8 0 803 6 0 057 3 4 cm 0 730 2 0 813 0 0 781 4 0 824 7 0 031 6 3 3 2 模型分类结果分析 LR 模型无遮挡状态准确 率较高 0 785 9 但遮挡场景下性能显著下降 如 4 cm 遮挡时精度仅0 730 2 表明其线性特征捕捉 能力受限 RF 模型在4 cm 遮挡场景下表现最优 精 度 0 813 归因于其对高维数据与复杂特征关系的 处理能力 MLP 模型通过深度学习架构模拟复杂的 非线性关系 在无遮挡和2 cm 遮挡状态下表现优异 在 4 cm 遮挡状态下性能下降 在捕捉非线性特征时 的优势在该条件下受到限制 可能是由于模型复杂 度增加导致过拟合的风险 voting RF MLP 模型融合 RF 与 MLP 优势 所 有遮挡状态下正确分类数均最优 图7 验证了 集成策略的鲁棒性 13 21 a b 16 17 19 12 41 25 42 29 26 48 266 274 312 310 37 23 25 17 23 12 21 43 20 23 266 261 29 26 276 287 LR 混淆矩阵 LR Confusion Matrix RF 混淆矩阵 RF Confusion Matrix 实际标签 Actual label 实际标签 Actual label 预测标签 Predicted label 预测标签 Predicted label 0 cm 2 cm 4 cm 0 cm 2 cm 4 cm Without Fruits Without Fruits c 330 0 264 0 198 0 132 0 66 00 0 00 d Without Fruits 实际标签 Actual label 实际标签 Actual label 0 cm 2 cm 4 cm 0 cm 2 cm 4 cm Without Fruits 预测标签 Predicted label 预测标签 Predicted label MLP 混淆矩阵 MLP Confusion Matrix voting RF MLP 混淆矩阵 voting RF MLP Confusion Matrix 19 13 10 17 16 9 31 28 40 31 37 33 286 294 315 321 16 15 8 10 2 0 44 39 17 12 258 270 18 16 311 320 图 7 LR RF MLP 和 voting RF MLP 模型混淆矩阵 Fig 7 LR RF MLP and voting RF MLP confusion matrix 综合分析 不同模型性能差异源于捕捉数据特 征能力不同 LR 适合线性特征明显的数据 RF 和 MLP 在处理复杂特征关系时表现更好 voting RF MLP 模型结合两者优势 提供更稳定和准确的分类 结果 3 3 3 精 确 度 对 比 分 析 在无遮挡状态下 MLP 模 型模型精确度最高 0 923 8 较 RF 提升6 74 voting RF MLP 模型次之 0 927 8 略高于RF 模型 这表明集成策略在提升分类性能方面的有 效性 而在0 cm 遮挡状态下 LR 模型精度最高 0 831 3 表明 LR 在处理紧邻遮挡时具有一定的 优势 voting RF MLP 模型达到了0 821 2 的精确度 显示出在处理紧邻遮挡时的竞争力 然而 在2 cm 遮挡状态下 voting RF MLP 模型精确度 0 803 6 超所有单一模型 这强调了集成学习在中等遮挡条 件下的优势 而在4 cm 遮挡状态下 RF 精 度 0 813 显著优于 MLP 0 781 4 差异达3 16 这可能 与果实光谱特征在较大遮挡距离下更为明显有关 而 voting RF MLP 模型的精确度也达到了0 824 7 再次证明了集成策略在提高分类稳定性方面的潜力 综合考虑 voting RF MLP 模型在所有遮挡状 态下均展现出了稳定的分类性能 尤其是在2 cm 遮 挡状态下 其精确度的显著提升凸显了集成学习策 略的优势 这些结果强调了 voting RF MLP 模型在 处理不同遮挡条件下的鲁棒性和泛化能力 3 4 综合评价指标分析 表 4 汇总了LR RF MLP 以及voting RF MLP 模型的关键评价指标 包括准确率 精确度 召回率 F 1 分数以及计算时间 为模型在树莓果实 遮挡状态分类任务中的整体性能提供了量化评估 单模型中 MLP 凭借深度学习架构 在无遮挡和 2 cm 遮挡状态下表现最优 全波段准确率达 0 832 5 表4 验证其捕捉非线性光谱特征的能力 RF 在 4 cm 遮挡场景下鲁棒性突出 精度0 813 归113 陈竹筠 等 一种基于高光谱技术的温室环境下叶片遮挡树莓果实识别模型 第3期 因于其抗噪声特性与高维数据处理能力 集成学习模型 voting RF MLP 通过动态权重 分配 表2 综合 RF 与 MLP 优势 在测试集 上准确率提升至0 843 5 较最优单模型 MLP 提升 1 1 F 1 分数达0 843 1 表 4 此外 voting RF MLP 模型推理时间仅13 43 s 虽略高于 MLP 11 21 s 但远低于全波段 MLP 52 67 s 满 足农业实时性需求 这些结果凸显了 voting RF MLP 模型在综合性 能上的优势 为树莓果实识别任务提供了一个更为 精确和鲁棒的解决方案 表 4 评价指标结果 Table 4 Results of evaluation indicators 模型 Model 数据集 Data set 准确率 Accuracy Score 精确度 Precision 召回率 Recall F 1 分数 F 1 Score 计算时间 s Calculation time LR 全波段 0 782 0 0 784 5 0 781 9 0 780 9 983 22 特征波段 0 781 5 0 783 5 0 781 8 0 780 7 125 34 RF 全波段 0 805 6 0 796 6 0 812 0 0 804 2 12 34 特征波段 0 792 7 0 792 4 0 793 0 0 792 7 3 63 MLP 全波段 0 832 5 0 843 3 0 830 5 0 836 9 52 67 特征波段 0 819 3 0 821 3 0 819 6 0 819 0 11 21 voting RF MLP 特征波段 0 843 5 0 844 3 0 844 3 0 843 1 13 43 3 5 特征选取与计算效率验证 3 5 1 关键波段筛选及科学依据 本文选用主成分 分析 PCA 来提取特征 图8 展示了 PCA 光谱分 析的结果 首先 通过方差贡献率排序确定主成分 PC1 和 PC2 累计贡献率达到87 35 随后 基于载 荷阈值 PC1 取值 0 3 且 PC2 取值 0 38 选 择具有显著载荷值的关键波段 PC1 PC2 PC3 PC4 58 96 28 39 6 58 4 42 58 96 87 35 93 93 98 35 图 8 PCA 分析结果 Fig 8 Results of PCA analyses 在科学依据方面 624 722 nm 波段覆盖了 红光至近红外过渡区 是植物水分含量敏感区 727 790 nm 和 838 900 nm 波段分别位于植物 的光谱平台区和近红外高反射区 前者关联叶片细 胞结构变化 后者与果实内部生化成分 如糖度 相关 最终 基于科学依据和统计学规则 精选出 反应树莓果实光谱特性的关键波段 如表 5 所示 本研究通过 PCA 方法成功筛选出具有显著载荷114 第 48 卷 河北农业大学学报 表 5 关键波段判定准则与科学依据 Table 5 Criteria and scientific basis for critical band selection 波段范围 nm Waveband range 相关成分 Relevant component 载荷阈值 Load threshold 方差贡献率 Contribution of variance 科学依据 Scientific basis 644 700 PC1 0 3 58 96 涵盖红光至近红外过渡区 680 700 nm 对植物水分含量敏感 增强遮挡果实的 光谱辨识度 624 722 PC2 0 38 28 39 727 790 PC1 0 3 58 96 位于近红外平台区 受叶片细胞结构影响显著 可捕捉叶片遮挡引起的散射效应差异 838 900 PC1 0 3 58 96 近红外高反射区 与果实内部生化成分 如糖度 相关 提供遮挡条件下的补充判别 信息 3 5 2 特征选择对性能的影响 通过对比全波段与 关键波段模型的性能 表4 验证了 PCA 特征选 择的效率优势 针对计算效率 关键波段模型显著降低计算耗 时 如 RF 模型从全波段的12 34 s 降至3 63 s 降 幅 70 6 MLP 从 52 67 s 缩至11 21 s 降幅 78 7 针对性能平衡性 关键波段模型在分类 指标 准确率 F 1 分数 上接近全波段性能 差异 1 5 如 MLP 全波段 F 1 分数为0 836 9 关 键波段为0 819 0 LR 模型在特征波段下计算时间 减少87 3 983 22 s 125 34 s 但精度损失可 控 F 1 分数降幅0 2 表明 PCA 在高效计算的 实用性 总体而言 特征波段训练的模型在保持或 接近全波段模型性能的同时 计算效率大幅提升 这充分表明 通过 PCA 分析选择的特征波段可显著 提升模型性能 特征选择方法有效且具有应用价值 3 6 模型鲁棒性验证 为验证模型对不同树莓品种及光照波动的适应 性 本节从跨品种识别性能与光照条件鲁棒性2 个 维度展开分析 测试集按品种和时段划分为4 组 子集 A 海尔特兹 2 370 组 上午1 185 组 下午1 185 组 子集 B 波尔卡 2 388 组 上 午 1 194 组 下午 1 194 组 表6 展示了模型在不 同品种及时段下的性能对比 3 6 1 跨品种识别性能分析 从表6 中可见 模型 对 海尔特兹 与 波尔卡 2 个品种的识别性能差 异较小 海尔特兹 的平均准确率为0 843 5 F 1 分数为0 837 1 波尔卡 的平均准确率为0 846 8 F 1 分数为0 844 3 两者差异均小于0 5 表明模型 对品种差异具有强鲁棒性 进一步分析发现 波 尔卡 在强光照下午时段 30 000 50 000 lux 表 值的关键波段 在降低数据维度的同时 显著提升 了模型计算效率与分类性能 为实际应用中的高效 部署提供了技术基础 现最优 准确率0 852 1 较 海尔特兹 提升0 58 这一差异可能源于 波尔卡 果实表皮反射率特性 更稳定 而 海尔特兹 因表面纹理粗糙 光谱信 号受叶片遮挡干扰略强 3 6 2 光照条件鲁棒性分析 光照强度对模型性能 的影响可从同一品种不同时段的表现中体现 以 波 尔卡 为例 下午时段准确率为0 852 1 较上午提 升 1 06 这表明高光照强度通过增强光谱信号质 量 显著提升模型对果实特征的捕捉能力 海尔 特兹 的下午时段性能 0 846 3 较上午 0 840 7 仅提升0 56 增幅较小 因其反射率对强光适应 性较弱 通过 SG 滤波与 SNV 散射校正 模型在下 午高光照下的噪声波动被有效抑制 精确度标准差 控制在0 5 以内 验证了预处理流程的鲁棒性 3 7 超参数优化 本文通过 GridSearchCV 方法对模型的超参数 进行了优化 遍历预定义参数网格和交叉验证 识别出最优参数组合 见表7 基于单模型的最 优参数 进一步为 voting RF MLP 集成模型定制 了参数配置 集
展开阅读全文