资源描述:
2024 年 5 月 第 6 卷 第 3 期 May 2024 Vol 6 No 3 智 慧 农 业 中 英 文 Smart Agriculture 基 于 改 进 SlowFast 模 型 的 设 施 黄 瓜 农 事 行 为 识 别 方 法 何 峰 1 2 吴 华 瑞 1 2 3 4 史 扬 明 1 2 朱 华 吉 1 2 3 4 1 江 苏 大 学 计 算 机 科 学 与 通 信 工 程 学 院 江 苏 镇 江 212013 中 国 2 国 家 农 业 信 息 化 工 程 技 术 研 究 中 心 北 京 100097 中 国 3 北 京 市 农 林 科 学 院 信 息 技 术 研 究 中 心 北 京 100097 中 国 4 农 业 农 村 部 数 字 乡 村 技 术 重 点 实 验 室 北 京 100097 中 国 摘 要 目 的 目 的 意 义 意 义 农 事 行 为 活 动 识 别 对 设 施 蔬 菜 生 产 精 准 化 调 控 有 着 重 要 意 义 在 一 定 程 度 上 可 以 通 过 查 看 农 事 操 作 的 时 间 操 作 过 程 是 否 合 理 来 减 少 因 农 事 行 为 不 当 导 致 产 量 下 降 为 了 解 决 农 事 行 为 识 别 方 法 中 由 于 黄 瓜 叶 片 和 设 施 遮 挡 导 致 识 别 准 确 率 不 高 的 问 题 提 出 一 种 名 为 SlowFast SMC ECA SlowFast Spatio Temporal Ex citation Channel Excitation Motion Excitation Efficient Channel Attention 的 农 事 活 动 行 为 识 别 算 法 方 法 方 法 该 算 法 主 要 基 于 SlowFast 模 型 通 过 改 进 Fast Pathway 和 Slow Pathway 中 的 网 络 结 构 来 提 高 对 于 农 事 活 动 中 手 部 动 作 特 征 和 关 键 特 征 的 提 取 能 力 在 Fast Pathway 中 引 入 多 路 径 激 励 残 差 网 络 的 概 念 通 过 在 信 道 之 间 插 入 卷 积 操 作 来 增 强 它 们 在 时 域 上 的 相 互 关 联 性 从 而 更 好 地 捕 捉 快 速 运 动 信 息 的 细 微 时 间 变 化 在 Slow Pathway 中 将 传 统 的 Residual Block 替 换 为 ECA Res 结 构 以 提 高 对 通 道 信 息 的 捕 获 能 力 这 两 项 改 进 有 效 地 加 强 了 通 道 之 间 的 联 系 提 升 了 特 征 之 间 的 语 义 信 息 传 递 进 而 显 著 提 升 了 农 事 行 为 识 别 的 准 确 率 此 外 为 了 解 决 数 据 集 中 类 别 不 均 衡 的 问 题 设 计 了 平 衡 损 失 函 数 Smoothing Loss 通 过 引 入 正 则 化 系 数 平 衡 损 失 函 数 可 以 有 效 地 处 理 数 据 集 中 的 类 别 不 均 衡 情 况 提 高 模 型 在 各 个 类 别 上 的 表 现 结 果 和 讨 论 结 果 和 讨 论 改 进 的 SlowFast SMC ECA 模 型 在 农 事 行 为 识 别 中 表 现 出 良 好 的 性 能 各 类 行 为 的 平 均 识 别 精 度 达 到 80 47 相 较 于 原 始 的 SlowFast 模 型 有 约 3 5 的 提 升 结 论 结 论 本 研 究 在 农 事 行 为 识 别 中 展 现 出 良 好 的 性 能 这 对 农 业 生 产 的 智 能 化 管 理 和 决 策 具 有 重 要 意 义 关 键 词 农 事 活 动 行 为 SlowFast 模 型 多 路 径 激 励 残 差 网 络 ECA Res 平 衡 损 失 函 数 中 图 分 类 号 TP391 4 文 献 标 志 码 A 文 章 编 号 SA202402001 引 用 格 式 何 峰 吴 华 瑞 史 扬 明 朱 华 吉 基 于 改 进 SlowFast 模 型 的 设 施 黄 瓜 农 事 行 为 识 别 方 法 J 智 慧 农 业 中 英 文 2024 6 3 118 127 DOI 10 12133 j smartag SA202402001 HE Feng WU Huarui SHI Yangming ZHU Huaji Recognition Method of Facility Cucumber Farming Behaviours Based on Improved SlowFast Model J Smart Agriculture 2024 6 3 118 127 DOI 10 12133 j smartag SA202402001 in Chinese with English abstract 0 引 言 黄 瓜 在 中 国 各 地 普 遍 栽 培 因 含 有 丰 富 的 人 体 所 需 的 各 种 营 养 物 质 对 人 体 健 康 非 常 有 益 而 深 受 消 费 者 的 喜 欢 1 2 在 黄 瓜 栽 培 过 程 中 会 存 在 大 量 的 农 事 活 动 行 为 如 浇 水 吊 蔓 剪 枝 等 这 些 农 事 操 作 得 合 理 与 否 直 接 影 响 黄 瓜 的 产 量 和 品 质 进 而 影 响 整 个 生 产 的 产 出 效 益 同 时 农 事 操 作 的 时 间 操 作 过 程 投 入 农 资 量 投 入 精 准 度 等 基 础 数 据 也 是 实 现 黄 瓜 生 产 精 准 化 调 控 管 理 的 依 据 因 此 如 何 快 速 准 确 地 记 录 农 事 操 作 行 为 就 显 得 尤 为 重 要 传 统 的 农 事 活 动 行 为 记 录 主 要 依 靠 人 工 进 行 记 录 过 程 存 在 时 间 延 迟 准 确 度 不 高 信 息 遗 漏 等 问 题 这 些 会 给 黄 瓜 的 生 产 管 理 造 成 一 定 的 影 响 随 着 图 像 识 别 与 计 算 机 视 觉 技 术 的 飞 速 发 展 基 于 机 器 视 觉 技 术 通 过 对 农 事 活 动 行 为 视 频 的 自 动 提 取 和 识 别 实 现 农 事 活 动 记 录 成 为 一 种 可 行 的 技 术 方 案 行 为 识 别 方 法 可 以 大 致 分 为 两 类 一 类 是 基 于 传 统 方 法 需 要 手 工 提 取 和 设 计 特 征 以 进 行 识 别 另 一 类 则 借 助 深 度 学 习 技 术 通 过 神 经 网 络 自 动 学 习 数 据 中 的 特 征 从 而 对 一 些 简 单 的 行 为 如 挥 收 稿 日 期 2024 02 01 基 金 项 目 中 央 引 导 地 方 科 技 发 展 资 金 项 目 2023ZY1 CGZY 01 财 政 部 和 农 业 农 村 部 国 家 现 代 农 业 产 业 技 术 体 系 资 助 CARS 23 D07 作 者 简 介 何 峰 研 究 方 向 为 计 算 机 视 觉 E mail 1363263324 通 信 作 者 朱 华 吉 博 士 研 究 员 研 究 方 向 为 农 业 信 息 化 E mail zhuhj copyright 2024 by the authors何 峰 等 基 于 改 进 SlowFast 模 型 的 设 施 黄 瓜 农 事 行 为 识 别 方 法 Vol 6 No 3 手 聊 天 进 行 识 别 3 手 工 特 征 提 取 方 法 主 要 是 通 过 人 工 方 法 提 取 视 频 中 的 运 动 信 息 然 后 使 用 分 类 器 如 支 持 向 量 积 Support Vector Machine SVM 4 K 临 近 算 法 5 贝 叶 斯 分 类 器 6 7 等 对 动 作 进 行 检 测 分 类 8 它 们 充 分 利 用 了 运 动 物 体 的 外 观 特 征 这 些 特 征 不 仅 简 单 易 懂 而 且 具 有 出 色 的 鲁 棒 性 这 种 方 法 已 经 成 为 基 于 视 频 识 别 行 为 的 优 选 并 且 在 多 个 领 域 得 到 了 广 泛 的 应 用 手 工 特 征 的 可 行 性 和 广 泛 性 使 其 成 为 一 个 强 大 的 工 具 用 于 捕 捉 和 分 析 视 频 中 的 运 动 形 状 颜 色 纹 理 等 关 键 信 息 从 而 实 现 对 行 为 的 准 确 识 别 和 分 析 此 外 一 些 学 者 认 为 视 频 图 像 携 带 着 前 后 帧 的 运 动 信 息 通 过 提 取 这 些 信 息 可 以 计 算 出 光 流 进 而 获 取 图 像 中 物 体 运 动 的 光 流 数 据 从 而 用 于 描 述 运 动 状 态 如 Wang 等 9 采 用 了 一 种 密 集 轨 迹 法 Dense Trajectories DT 的 方 法 通 过 在 视 频 帧 中 密 集 提 取 轨 迹 点 并 捕 捉 这 些 轨 迹 点 随 时 间 的 变 化 用 于 行 为 识 别 和 动 作 分 析 之 后 Wang 和 Schmid 10 在 DT 的 算 法 上 进 行 了 改 进 提 出 了 改 进 的 密 集 轨 迹 法 Improved Dense Trajectories IDT 通 过 更 精 细 的 轨 迹 采 样 和 增 强 的 特 征 提 取 技 巧 提 高 了 在 视 频 中 捕 获 动 作 信 息 的 效 率 和 准 确 性 使 其 在 行 为 识 别 和 动 作 分 析 中 更 具 竞 争 力 近 年 来 深 度 学 习 领 域 取 得 了 迅 猛 发 展 为 行 为 识 别 研 究 提 供 了 崭 新 的 视 角 和 方 法 传 统 的 手 工 特 征 提 取 方 法 通 常 伴 随 着 内 存 需 求 较 高 的 问 题 并 受 到 特 征 单 一 性 的 限 制 从 而 在 扩 展 性 方 面 存 在 一 定 的 挑 战 这 些 深 度 学 习 方 法 不 仅 能 够 高 效 处 理 大 规 模 数 据 还 能 够 自 动 从 数 据 中 学 习 丰 富 的 特 征 表 示 因 此 在 视 频 行 为 识 别 等 领 域 表 现 出 巨 大 的 潜 力 主 流 的 基 于 深 度 学 习 的 视 频 理 解 算 法 包 括 双 流 卷 积 神 经 网 络 Two Stream Convolutional Neural Networks Two Stream CNN 人 体 骨 架 识 别 三 维 卷 积 神 经 网 络 3D CNN 以 及 视 觉 Transformer 这 些 网 络 结 构 在 捕 捉 视 频 中 的 行 为 特 征 和 动 作 信 息 方 面 发 挥 着 重 要 的 作 用 2014 年 Simonyan 和 Zisserman 11 提 出 了 一 种 创 新 的 方 法 即 双 流 卷 积 神 经 网 络 这 个 网 络 采 用 了 两 个 分 支 一 个 分 支 专 门 用 于 提 取 时 间 流 特 征 另 一 个 分 支 则 专 注 于 提 取 空 间 流 特 征 在 网 络 的 后 端 它 将 这 两 个 流 的 特 征 融 合 在 一 起 以 实 现 更 加 全 面 和 高 效 的 信 息 提 取 和 表 示 这 一 方 法 为 视 频 行 为 识 别 等 任 务 带 来 了 重 要 的 突 破 使 得 模 型 能 够 更 好 地 理 解 时 间 和 空 间 信 息 从 而 提 高 了 识 别 性 能 在 此 基 础 上 进 行 改 进 的 网 络 有 TSN Temporal Segment Networks 12 网 络 和 I3D Inflated 3D ConvNet 13 网 络 3D 卷 积 神 经 网 络 通 过 加 入 时 间 维 度 来 代 替 光 流 可 以 实 现 端 到 端 的 识 别 Tran 等 14 使 用 3D 卷 积 构 建 了 C3D Convolutional Three Dimensional 模 型 它 将 VG GNet Visual Geometry Group network 网 络 15 的 卷 积 核 由 3 3 的 2D 卷 积 扩 展 为 3 3 3 的 3D 卷 积 之 后 出 现 的 R3D Residual 3D Convolutional Network 16 网 络 和 SlowFast 17 网 络 等 都 基 于 3D 卷 积 神 经 网 络 此 外 在 长 短 时 记 忆 网 络 Long Short Term Memory LSTM 的 进 展 中 Donahue 等 18 引 入 了 长 期 循 环 卷 积 神 经 网 络 Long term re current Convolutional Networks LRCN 的 概 念 LRCN 结 合 了 2D 卷 积 神 经 网 络 2D CNN 来 提 取 帧 级 特 征 并 随 后 利 用 LSTM 来 建 模 多 个 视 频 帧 之 间 的 时 间 关 系 这 一 方 法 在 视 频 行 为 识 别 领 域 具 有 重 要 的 应 用 潜 力 上 述 研 究 方 法 在 区 分 设 施 黄 瓜 的 生 长 过 程 中 的 复 杂 农 事 行 为 时 面 临 着 一 系 列 挑 战 包 括 株 距 较 近 叶 片 相 互 遮 挡 农 事 操 作 多 样 动 作 环 节 复 杂 以 及 人 员 操 作 不 规 范 等 问 题 这 些 问 题 增 加 了 设 施 黄 瓜 的 农 事 行 为 识 别 的 难 度 为 了 解 决 这 些 挑 战 本 研 究 基 于 SlowFast 行 为 识 别 算 法 进 行 了 改 进 具 体 地 在 Fast Pathway 中 将 ACTION Spatio tem poral Channel and Motion Excitation 19 注 意 力 机 制 与 残 差 块 相 结 合 形 成 SMC Res Block 以 增 强 相 邻 两 帧 之 间 农 事 操 作 的 连 续 性 特 征 提 取 能 力 考 虑 黄 瓜 生 产 中 叶 片 遮 挡 和 大 棚 环 境 的 复 杂 性 在 Slow Pathway 中 引 入 了 注 意 力 机 制 ECANet Effi cient Channel Attention Network 以 增 强 通 道 之 间 的 相 互 依 赖 关 系 从 而 提 高 Slow Pathway 网 络 的 特 征 表 示 能 力 此 外 为 解 决 农 事 行 为 数 据 集 中 的 不 均 衡 问 题 本 研 究 设 计 了 平 衡 损 失 函 数 Smooth ing Loss SLoss 使 用 这 一 损 失 函 数 有 助 于 平 衡 各 个 农 事 行 为 类 别 在 数 据 集 中 的 样 本 分 布 从 而 提 高 模 型 对 于 每 个 类 别 的 识 别 性 能 1 农 事 行 为 数 据 集 构 建 鉴 于 当 前 缺 乏 适 用 于 种 植 黄 瓜 的 农 事 行 为 监 控 的 公 开 可 用 的 数 据 集 本 研 究 选 用 北 京 国 家 精 准 农 业 实 验 示 范 基 地 内 的 黄 瓜 温 室 为 研 究 案 例 并 自 行 构 建 数 据 集 用 于 识 别 和 评 价 种 植 黄 瓜 的 农 事 行 为 为 了 确 保 能 够 捕 捉 到 农 业 操 作 人 员 的 动 作 研 究 采 用 以 下 布 置 方 式 温 室 的 长 宽 比 为 A B 119Vol 6 No 3 智 慧 农 业 中 英 文 Smart Agriculture A B 其 中 A 为 长 15 m B 为 宽 3 m 行 距 为 100 cm 株 距 为 40 cm 共 有 18 垄 垄 间 距 为 80 cm 根 据 这 一 布 局 摄 像 头 的 安 装 点 位 如 图 1 所 示 摄 像 头 被 设 置 在 长 边 上 每 两 垄 黄 瓜 苗 之 间 以 确 保 清 晰 拍 摄 农 业 操 作 人 员 的 操 作 考 虑 监 控 视 频 的 主 要 目 的 是 识 别 农 业 人 员 与 黄 瓜 的 互 动 行 为 摄 像 头 的 安 装 高 度 为 2 2 m 略 高 于 人 的 头 顶 高 度 此 外 摄 像 头 角 度 倾 斜 15 30 以 确 保 能 够 清 晰 捕 捉 操 作 人 员 的 行 为 为 增 加 角 度 的 多 样 性 还 使 用 手 机 对 农 事 行 为 进 行 辅 助 拍 摄 实 验 数 据 的 采 集 时 间 为 2023 年 2 月 28 日 4 月 25 日 此 过 程 为 黄 瓜 从 移 栽 到 采 摘 的 全 部 过 程 拍 摄 的 设 备 为 海 康 威 视 的 萤 石 云 家 用 摄 像 头 型 号 为 DS IPC B12V2 I H8 焦 距 为6 mm 清 晰 度 为5 MP 拍 摄 的 时 间 为 10 00 11 30 和 14 00 15 00 每 段 视 频 拍 摄 的 时 长 大 约 为 1 min 本 研 究 共 采 集 了 移 栽 喷 水 吊 蔓 整 枝 采 摘 共 5 个 行 为 197 段 视 频 图 2 所 示 为 采 集 到 的 部 分 农 事 行 为 的 视 频 截 帧 拍 摄 视 频 的 标 识 方 法 为 AVA 数 据 集 格 式 16 视 频 数 据 经 过 切 分 与 筛 选 农 事 行 为 数 据 集 一 共 有 707 段 视 频 其 中 500 段 视 频 用 作 训 练 集 40 段 视 频 用 作 验 证 集 67 段 视 频 用 作 测 试 集 在 建 立 原 始 数 据 集 后 对 数 据 进 行 抽 帧 和 标 注 为 了 确 保 数 据 的 均 衡 性 每 个 行 为 的 数 据 量 需 相 当 并 且 不 能 截 断 任 何 动 作 为 实 现 这 一 目 标 采 取 了 以 下 措 施 1 删 除 视 频 中 没 有 目 标 人 员 出 现 的 片 段 2 将 视 频 中 包 含 目 标 前 后 多 个 动 作 的 片 段 进 行 拆 分 最 终 的 数 据 集 组 成 如 表 1 所 示 2 模 型 构 建 本 研 究 提 出 的 SlowFast SMC ECA 模 型 基 于 SlowFast 模 型 其 结 构 如 图 3 所 示 主 要 包 括 数 据 层 卷 积 层 残 差 层 及 特 征 融 合 层 模 型 的 整 体 处 理 流 程 数 据 层 通 过 2 个 不 同 的 步 长 值 得 到 不 同 帧 的 数 据 将 其 馈 送 到 不 同 的 通 道 中 在 进 入 到 卷 积 层 后 Slow Pathway 每 次 以 1 帧 进 行 运 算 Fast Path way 提 取 5 帧 图 片 一 起 进 行 运 算 接 着 进 入 3D 残 差 网 络 Slow Pathway 和 Fast Pathway 分 别 用 ECA Res 和 多 路 径 激 励 残 差 网 络 进 行 农 事 活 动 行 为 中 运 动 信 息 和 空 间 信 息 的 提 取 最 后 进 行 特 征 融 合 得 到 最 终 的 农 事 活 动 行 为 的 结 果 2 1 多 路 径 激 励 残 差 网 络 在 Fast Pathway 中 以 高 时 间 分 辨 率 捕 获 运 动 信 息 但 是 基 于 设 施 黄 瓜 的 农 事 活 动 行 复 杂 多 变 手 部 动 作 幅 度 小 一 些 农 事 行 为 相 关 性 强 原 始 残 差 块 在 捕 获 农 事 活 动 行 为 运 动 特 征 时 会 丢 失 大 量 信 息 造 成 误 检 现 象 本 研 究 利 用 ACTION 19 中 的 3 个 互 补 注 意 力 机 制 即 STE Spatial Temporal Ex citation CE Channel Excitation ME Motion Excitation 结 合 原 始 的 残 差 块 形 成 多 路 径 激 励 残 差 网 络 Spatial Temporal Excitation Channel 图 1 农 事 行 为 识 别 研 究 摄 像 头 布 置 点 位 Fig 1 The arrangement of camera positions for agricultural activity recognition research 表 1 设 施 黄 瓜 农 事 行 为 数 据 集 的 构 成 Table 1 The composition of the greenhouse cucumber farming behavior dataset 行 为 类 别 移 栽 浇 水 吊 蔓 整 枝 采 摘 视 频 数 个 97 146 162 124 178 标 签 数 量 个 7 432 10 207 11 106 9 978 12 173 a 采 摘 行 为 b 吊 蔓 行 为 图 2 设 施 黄 瓜 的 农 事 行 为 视 频 截 帧 Fig 2 Video cut off frames of agronomic behaviour of facility cucumbers 120何 峰 等 基 于 改 进 SlowFast 模 型 的 设 施 黄 瓜 农 事 行 为 识 别 方 法 Vol 6 No 3 Excitation Motion Excitation Residual SMC Res 结 构 如 图 4 所 示 来 提 高 对 农 事 行 为 视 频 中 关 键 特 征 的 激 发 从 而 提 升 农 事 行 为 识 别 的 准 确 性 本 研 究 使 用 Conv 为 卷 积 数 量 F 为 内 核 大 小 卷 积 滤 波 器 的 特 征 映 射 数 为 n x x 和 F BN Batch Normalization 为 批 量 归 一 化 ReLu 为 激 活 函 数 SMC Res 块 包 含 3 次 卷 积 和 一 个 残 差 边 在 每 一 组 卷 积 以 及 残 差 连 接 之 前 加 入 SMC 模 块 这 样 做 可 以 在 不 同 维 度 获 取 多 类 型 的 时 空 模 式 通 道 信 息 及 运 动 信 息 后 进 行 卷 积 获 取 更 加 细 粒 度 的 特 征 提 高 农 事 行 为 识 别 的 精 度 STE 时 空 注 意 力 模 块 旨 在 捕 获 适 当 的 时 空 模 式 以 强 化 视 频 中 的 空 间 和 时 间 关 系 有 助 于 更 好 地 理 解 农 事 活 动 行 为 中 的 一 些 动 作 的 变 化 主 要 通 过 生 成 时 空 掩 码 来 产 生 时 空 注 意 力 图 以 提 取 视 频 中 的 时 空 特 征 STE 网 络 结 构 如 图 5a 所 示 首 先 对 输 入X R N T C H W N 表 示 批 量 大 小 T 表 示 段 数 C 表 示 通 道 数 H 表 示 高 度 W 表 示 宽 度 做 一 个 通 道 平 均 得 到 关 于 通 道 轴 的 全 局 时 空 张 量F 1 R N T 1 H W 后 把 得 到 的F 1 重 构 为 新 的 时 空 张 量F 1 R N 1 T H W 然 后 馈 送 到 3D 卷 积 核 K 中 数 学 表 达 如 公 式 1 所 示 F o1 K F 1 1 然 后 再 将 F o1 重 构 为 F o1 最 后 经 过 Sigmoid 函 数 进 行 激 活 得 到 掩 码 如 公 式 2 所 示 M 1 F o1 2 式 中 M 1 为 激 活 掩 码 为 Sigmoid 函 数 最 后 得 到 农 事 活 动 行 为 中 更 为 精 细 的 时 空 信 息 如 公 式 3 所 示 Y 1 X X M 1 3 式 中 Y 1 为 STE 模 块 的 最 终 输 出 CE 注 意 力 模 块 用 于 提 取 适 当 的 通 道 范 围 特 征 以 强 调 网 络 中 不 同 通 道 的 信 息 这 有 助 于 捕 捉 关 键 的 通 道 信 息 从 而 提 高 农 事 行 为 的 识 别 能 力 它 类 似 于 SE Squeeze and Excitation Networks 注 意 力 模 块 20 为 了 增 强 农 事 活 动 行 为 各 个 不 同 特 征 在 时 间 上 的 相 互 依 赖 程 度 CE 模 块 在 两 个 全 连 接 层 之 间 引 入 了 一 个 一 维 卷 积 层 以 捕 捉 信 道 特 征 上 的 时 间 信 息 CE 模 块 的 结 构 如 图 5b 所 示 对 于 给 定 的 输 入X R N T C H W 通 过 平 均 池 化 的 方 法 来 获 取 全 局 空 间 信 息F 2 R N T C 1 1 它 的 求 解 如 公 式 4 所 示 F 2 1 H W i 1 H j 1 W X i j 4 对F 2 用 一 个 二 维 卷 积 核 K 1 进 行 压 缩 得 到F r 如 公 式 5 所 示 F r K 1 F 2 5 对F r R N T c r 1 1 重 构 得 到F r R N C r T 1 1 图 3 SlowFast SMC ECA 网 络 结 构 图 Fig 3 SlowFast SMC ECA network structure diagram 图 4 SMC Res 结 构 Fig 4 SMC Res structure 121Vol 6 No 3 智 慧 农 业 中 英 文 Smart Agriculture 然 后 用 核 大 小 为 3 的 一 维 卷 积 核 K 2 与F r 相 乘 得 到 F temp R N C r T 1 1 然 后 重 构F temp 得 到F temp 后 与 2D 卷 积 核 K 3 相 乘 进 行 解 压 缩 最 后 经 过 Sigmoid 函 数 得 到 农 事 动 作 的 掩 码 如 公 式 6 和 公 式 7 所 示 M 2 F o2 6 Y 2 X X M 2 7 式 中 M 2 为 CE 模 块 的 掩 码 Y 2 为 最 终 输 出 ME 注 意 力 模 块 专 注 于 提 取 运 动 信 息 以 更 好 地 聚 焦 于 农 事 活 动 行 为 中 操 作 人 员 的 手 部 动 作 的 变 化 如 图 5c 表 示 通 过 相 邻 帧 之 间 的 变 化 情 况 来 建 模 农 事 活 动 行 为 的 运 动 特 征 如 公 式 8 所 示 F m K F r t 1 F r t 8 式 中 K 为 3 3 的 二 维 卷 积 F m 通 过 K 对 前 后 两 帧 的 操 作 得 到 即 将 输 入X 每 相 邻 两 帧 之 间 得 到 的 差 值 在 时 间 维 度 上 进 行 连 接 再 对 得 到 的 特 征 做 平 均 池 化 处 理 然 后 通 过 Sigmoid 函 数 得 到 最 终 的 输 出 如 公 式 9 所 示 Y 3 X X M 3 9 式 中 M 3 为 ME 模 块 的 掩 码 Y 3 为 最 终 输 出 农 事 行 为 的 特 征 信 息 通 过 STE CE ME 注 意 力 机 制 将 生 成 的 3 个 激 发 特 征 逐 元 素 相 加 再 经 过 多 路 径 激 励 通 道 最 终 结 果 如 公 式 10 所 示 Y Y 1 Y 2 Y 3 10 式 中 Y 为 多 路 径 激 励 残 差 网 络 的 最 终 输 出 然 后 对 生 成 的 特 征 信 息 进 行 卷 积 操 作 得 到 最 终 的 运 动 特 征 信 息 2 2 ECA Res 残 差 块 在 设 施 黄 瓜 的 生 产 环 境 下 黄 瓜 在 开 花 期 叶 片 生 长 迅 速 存 在 黄 瓜 叶 片 遮 挡 操 作 人 员 的 手 部 动 作 变 化 的 问 题 在 Slow Pathway 中 如 操 作 人 员 的 手 部 轮 廓 等 通 道 信 息 不 容 易 被 捕 捉 到 为 提 高 通 道 信 息 的 捕 捉 能 力 在 ResNet 主 干 网 络 的 基 础 上 在 残 差 块 中 结 合 ECA 注 意 力 21 ECANet 注 意 力 机 制 在 SENet 注 意 力 机 制 的 基 础 上 实 现 了 不 降 维 的 跨 通 道 交 互 策 略 只 涉 及 了 少 量 的 参 数 不 仅 避 免 了 维 度 特 征 的 缩 减 还 能 增 加 通 道 之 间 的 信 息 交 互 在 保 证 交 互 的 前 提 下 精 简 模 型 SlowFast 网 络 中 的 Slow Pathway 有 比 Fast Pathway 更 多 的 通 道 数 量 来 学 习 通 道 信 息 ECA 注 意 力 机 制 可 以 完 美 地 适 用 于 Slow Fast 网 络 中 的 Slow Pathway 不 仅 减 少 了 计 算 量 还 突 出 了 通 道 中 的 关 键 信 息 和 抑 制 视 频 中 背 景 因 素 的 干 扰 其 结 构 如 图 6 所 示 ECA 注 意 力 机 制 的 工 作 原 理 如 图 7 所 示 通 过 卷 积 对 特 征 图 进 行 压 缩 得 到 一 个 新 的 特 征 图 的 大 小 为 H C W 将 经 过 全 局 平 均 池 化 Gol bal Average Pooling GAP 转 变 为 1 1 C 的 向 量 这 样 空 间 信 息 就 得 到 了 压 缩 然 后 采 用 一 维 卷 积 来 提 取 通 道 上 的 特 征 模 型 在 训 练 的 过 程 中 能 够 自 适 应 卷 积 核 的 大 小 具 体 的 做 法 为 a STE b CE c ME 图 5 SMC 模 块 组 成 Fig 5 Composition of SMC modules 图 6 ECA Res 结 构 Fig 6 ECA Res structure 122何 峰 等 基 于 改 进 SlowFast 模 型 的 设 施 黄 瓜 农 事 行 为 识 别 方 法 Vol 6 No 3 1 在 全 局 平 局 池 化 之 后 得 到 一 个 1 1 C 的 向 量 2 计 算 自 适 应 一 维 卷 积 核 的 大 小 如 公 式 11 所 示 k c log 2 c b 11 式 中 2 b 1 k 为 核 大 小 c 为 通 道 大 小 该 自 适 应 卷 积 核 表 明 了 局 部 跨 通 道 交 互 的 覆 盖 率 3 将 自 适 应 卷 积 核 使 用 到 一 维 卷 积 中 得 到 各 通 道 的 权 重 使 得 通 道 数 较 大 的 层 可 以 更 多 地 进 行 相 邻 通 道 间 的 交 互 2 3 损 失 函 数 在 数 据 采 集 过 程 中 由 于 黄 瓜 生 长 周 期 中 不 同 农 事 行 为 的 频 率 差 异 某 些 行 为 如 移 栽 在 整 个 生 长 周 期 中 仅 发 生 几 次 而 其 他 行 为 如 浇 水 采 摘 则 有 较 高 的 发 生 频 率 这 导 致 数 据 集 存 在 明 显 的 类 别 不 均 衡 问 题 同 时 一 些 行 为 如 吊 蔓 和 采 摘 在 表 现 上 相 似 所 以 原 始 的 损 失 函 数 22 在 对 于 一 些 小 样 本 的 农 事 行 为 活 动 时 它 的 准 确 率 得 不 到 保 证 为 解 决 这 一 问 题 本 研 究 设 计 了 一 种 平 衡 损 失 函 数 Smoothing Loss SLoss 该 损 失 函 数 通 过 引 入 正 则 化 系 数 i 并 与 原 始 损 失 函 数 相 乘 旨 在 缓 解 模 型 在 训 练 过 程 中 对 于 高 频 行 为 的 过 拟 合 同 时 确 保 对 于 低 频 行 为 的 充 分 训 练 正 则 化 系 数 的 定 义 如 公 式 12 所 示 i S 1 i 12 式 中 S 一 般 设 置 为 0 1 0 5 0 75 本 研 究 设 置 为 0 75 用 来 平 衡 类 别 的 超 参 数 i 的 计 算 如 公 式 13 所 示 i f i i 1 C f i 13 式 中 f i 为 第 i 类 农 事 行 为 的 样 本 个 数 C 为 农 事 行 为 类 别 数 因 此 最 后 的 SLoss 如 公 式 14 所 示 SLoss i Loss p t S 1 i Loss p t 14 式 中 p t 为 预 测 为 正 类 别 的 概 率 在 多 分 类 任 务 中 经 过 Sigmoid 函 数 进 行 归 一 化 处 理 后 得 到 最 终 的 结 果 如 公 式 15 所 示 SLoss p t i 1 C i log sigmoid p t i 1 C S 1 i log 1 1 exp p t i 1 C S 1 i log p t 15 3 实 验 设 计 与 结 果 分 析 3 1 实 验 环 境 本 研 究 的 实 验 环 境 为 Linux 5 的 操 作 系 统 CPU 为 Intel R Xeon R Platinum 8255C CPU 2 50 GHz GPU 为 NVIDIA GeForce GTX 2080 Ti 显 卡 深 度 学 习 的 框 架 为 PyTorch 框 架 在 模 型 的 训 练 过 程 中 模 型 训 练 的 Epoch 设 置 为 200 批 量 大 小 设 置 为 8 初 始 的 学 习 率 为 0 001 权 重 衰 减 参 数 设 置 为 0 005 网 络 中 的 模 型 优 化 采 用 的 是 随 机 梯 度 下 降 算 法 Stochastic Gradient De scent SGD 3 2 实 验 结 果 与 分 析 3 2 1 农 事 活 动 行 为 识 别 结 果 为 验 证 本 研 究 提 出 的 改 进 SlowFast 模 型 的 农 事 行 为 识 别 方 法 对 移 栽 浇 水 吊 蔓 整 枝 采 摘 5 种 行 为 识 别 效 果 的 优 越 性 将 SlowFast SMC ECA 模 型 与 原 模 型 SlowFast 进 行 比 较 对 比 结 果 如 表 2 所 示 由 表 2 可 以 看 出 改 进 后 方 法 相 比 原 始 的 SlowFast 模 型 在 5 种 农 事 行 为 的 识 别 准 确 率 均 有 不 同 幅 度 的 提 升 其 中 提 升 较 为 明 显 的 是 移 栽 行 为 较 原 模 型 提 高 3 53 提 升 不 太 明 显 的 是 采 摘 行 为 仅 为 86 61 全 部 行 为 识 别 精 度 的 平 均 值 为 图 7 ECANet 网 络 结 构 图 Fig 7 ECANet network structure diagram 表 2 SlowFast SMC ECA 模 型 不 同 行 为 识 别 精 度 对
展开阅读全文