1、基于改进 YOLOv 5 在电力巡检中的目标检测算法研究游 越1,伊力哈木 亚尔买买提1,吕怡凡2,赵子凡3(1.新疆大学电气工程学院,乌鲁木齐 830046;2.中央民族大学信息工程学院,北京 100081;3.西安理工大学电气工程学院,西安 710054)摘 要:针 对 输 电 线 路 巡 检 的 复 杂 场 景 下 被 遮 挡 以 及 目 标 较 小 导 致 的 误 检 问 题,文 中 提 出 了 一 种 基 于YOLOv 5 的 改 进 算 法 模 型。首 先 通 过 数 据 增 强 和 数 据 扩 充 数 据 集 进 行 预 处 理;其 次 给 引 入 SE 模 块,加 强 对不 同
2、 尺 度 下 目 标 的 特 征 融 合;然 后 引 入 CBAM 模 块,进 行 进 一 步 特 征 提 取,使 提 取 的 特 征 信 息 更 加 突 出。最后,对 损 失 函 数 进 行 优 化,改 进 小 数 据 导 致 的 样 本 不 均 衡 现 象。经 实 验 证 明,改 进 后 的 算 法 有 效 地 提 高 了 被遮 挡 的 目 标 和 小 目 标 的 识 别 率,mAP 较 原 算 法 精 度 提 高 了 5%,Recall 提 高 了 14.6%。与 其 他 改 进 模 型 相 比,精度、召回率都有提高,验证了该模型在各种场合下具有较强的鲁棒性和泛化能力。关键词:输电线路巡
3、检;遮挡;YOLOv 5;CBAM;SEResearch on Target Detection Algorithm Based on Improved YOLOv 5 in PowerPatrol InspectionYOU Yue1,YILIHAMU Yae rmaimaiti1,LYU Yifan2,ZHAO Zifan3(1.School of Electrical Engineering,Xinjiang University,Urumqi 830046,China;2.School of Information Engineering,Minzu Universityof Chin
4、a,Beijing 100081,China;3.School of Electrical Engineering,Xi an University of Technology,Xi an 710054,China)Abstract:In view of false detection due to sheltering and small target in complex scenes of patrol inspection of trans mission,a kind of improved algorithm model based on YOLOv 5 is proposed i
5、n this paper.First,preprocessing is car ried out through data enhancement and data expansion data set.Then,the SE module is introduced to strengthen thefeature fusion of targets at different scales.After that,the CBAM module is introduced for feature extraction furtherso to make the feature informat
6、ion more prominent.Finally,the loss function is optimized to improve the sample im balance due to small data.It is proved through experiments that the improved algorithm effectively improves the rec ognition rate of sheltering targets and small targets.The accuracy of mAP,compared with the original
7、algorithm,isimproved by 5%and Recall is improved by 14.6%.Compared with other improved models,both precision and recallrate are improved,verifying that the model has strong robustness and generalization ability in various occasions.Key words:patrol inspection of transmission line;sheltering;YOLOv 5;
8、CBAM;SE0 引言近 年 来,深 度 学 习 和 无 人 机 领 域 发 展 迅 猛,给计 算 机 视 觉 与 电 力 行 业 的 融 合 奠 定 了 基 础。无 人机 巡 检 也 就 是 在 这 种 情 况 下 应 运 而 生。目 前,无 人机 的 检 测 方 法 主 要 有 4 种 1。通 道 检 查,即 探 测出 电 力 管 道 附 近 的 工 程 事 故 和 特 定 事 故;高 压 输电 线 路 的 精 细 扫 描;巡 检 故 障 区 域,并 对 其 破 坏程 度 及 原 因 进 行 分 析;自 然 灾 害 时 的 特 殊 工 作,调 查 高 压 电 源 线 的 损 坏,损 伤 区
9、 域 及 损 坏 程 度。当使 用 无 人 机 巡 视 时,可 以 用 无 人 机 对 杆 塔、金 具 等进 行 细 致 的 观 测,从 而 避 免 人 工 检 查 时 由 于 视 觉 上的 误 差 和 光 学 元 件 本 身 的 缺 陷。但 是,在 无 人 机 巡检 过 程 中 在 对 目 标 进 行 自 动 识 别 时,存 在 目 标 互 相遮挡和目标太小的问题,很容易造成误检和漏检。事 实 上,从 计 算 机 视 觉 研 究 诞 生 之 初 就 一 直 饱受 遮 挡 目 标 识 别 问 题 的 困 扰 2。在 目 标 识 别 中,普遍 将 轮 廓 2-3、纹 理、角 点 等 信 息 为
10、重 点,如 果 特 征 信第 59 卷 第 2 期:0089 00962023 年 2 月 16 日 High Voltage ApparatusVol.59,No.2:0089 0096Feb.16,2023DOI:10.13296/j.1001 1609.hva.2023.02.012_收稿日期:2022 08 12;修回日期:2022 10 182023 年 2 月 第 59 卷 第 2 期息 不 完 整 或 者 完 全 丢 失,就 会 对 目 标 识 别 造 成 极 大的 困 扰 4-5。例 如 在 家 用 机 器 人 扫 描 寻 找 目 标 时,就会 因 为 复 杂 的 环 境,如
11、物 品 堆 叠、相 互 遮 挡,丢 失 部分 甚 至 全 部 特 征 信 息,导 致 机 器 人 的 识 别 错 误。针对 静 态 目 标 遮 挡 问 题,学 者 们 更 多 的 注 重 于 对 目 标的 表 面 特 征 进 行 分 析,或 利 用 不 同 特 征 的 关 联 性 进行 分 析,如:文 3 中 对 轮 廓 与 接 合 点 的 关 系 进 行 了分 析,对 高 比 例 遮 挡 物 体 进 行 识 别。识 别 率 并 不 是很 高,且 无 法 识 别 较 小 目 标;文 6 中 为 了 克 服 遮 蔽和 光 照 的 双 重 效 应,将 SIFT 特 性 与 粒 子 滤 波 相 结合
12、,有 效 地 减 少 了 光 照 和 遮 挡 的 干 扰,但 识 别 速 度较 慢,实 时 性 较 低。还 有 一 些 学 者 对 全 局 与 局 部 特征 之 间 的 关 联 进 行 分 析,利 用 它 们 之 间 的 关 联 性 来补 充 丢 失 的 特 征,这 样 就 可 以 降 低 遮 挡 干 扰 的 影响。例 如:文 7 中 采 用 HSV 颜 色 空 间 内 散 落 的 大 部分 特 征 点,与 SIFT 局 部 特 征 进 行 匹 配,以 来 实 现 对遮 挡 目 标 的 定 位,但 是 依 然 存 在 漏 检 问 题;文 8 中则 是 遍 历 匹 配 了 全 局 特 征 和 局
13、 部 特 征,采 用 直 方图、区 域、灰 度 等 特 征,实 现 循 环 遍 历 的 分 块 匹 配,然而识别率还有待提高,且内存较大。随 着 深 度 学 习 的 发 展,目 标 检 测 算 法 也 进 行 了优 化,目 前 主 流 的 目 标 检 测 算 法 大 体 可 以 分 为 两类,分 别 是 one stage(单 阶 段)和 two stage(双 阶 段)。two stage 中 具 有 代 表 性 的 是 faster RCNN 9-10、mask Rcnn 系 列,而 one stage 下 最 具 代 表 性 的 检 测 算法 9-10 是 YOLO 系列。由 于 电 力
14、 巡 检 采 集 到 的 照 片 通 常 存 在 互 相 遮挡 的 情 况,且 小 物 体 较 多,而 YOLO 系 列 算 法 恰 好在 这 种 情 形 下 具 有 其 独 特 的 优 势,能 够 实 现 对 小 物体 和 分 布 集 中 目 标 的 准 确 识 别。因 此 YOLO 系 列算法更符合文中对遮挡物体识别的需求。1 算法简介1.1 YOLOv 1YOLOv 4最 初 的 YOLOv 1 版 本 的 实 现 是 通 过 在 网 络 中进 行 相 关 图 片 的 输 入,并 在 卷 积 神 经 网 络 的 帮 助 下实 现 对 检 测 结 果 和 边 界 框 偏 移 量 的 测 量
15、。这 样 以来,其 虽 然 能 够 保 障 较 快 的 检 测 速 度,但 精 度 低,在小 目 标 检 测 方 面 性 能 较 差。而 在 YOLOv 1 的 基 础上 进 行 相 应 的 升 级,得 到 了 具 有 BN 层 和 锚 机 制 的YOLOv 2 版 本。此 外,该 版 本 还 对 原 有 的 池 化 层 结构 和 全 连 接 层 结 构 进 行 了 丢 弃 和 移 除。YOLOv 3 是YOLOv 2 的 进 一 步 增 强 版 本。这 一 版 本 为 了 实 现 特征 提 取,选 择 了 darknet 53,对 原 有 的 darknet 19 网络 结 构 进 行 替
16、换。这 样 一 来,在 特 征 金 字 塔 网 络 的帮 助 下 不 仅 能 实 现 对 拥 有 不 同 尺 度 物 体 的 检 测,还能 够 对 类 别 和 边 界 框 的 偏 移 进 行 一 定 的 预 测。在YOLOv 3 之 后,有 一 个 升 级 的 YOLOv 4 11。这 一 版 本在 网 络 结 构 方 面 并 没 有 做 出 较 大 的 改 动,但 在 检 测速度和检测量上都有一定的提升 12。1.2 YOLOv 5YOLOv 5 相 较 于 之 前 几 个 版 本,网 络 结 构 中Focus 模 块 的 加 入 是 其 显 著 的 特 点 12。Focus 模 块 的主
17、要 功 能 是 切 片,即 Focus 模 块 对 尚 未 进 入 到 主 干网 络 的 图 像 进 行 相 应 的 处 理。这 样 一 来,不 仅 能 够保 障 图 像 的 信 息 完 整 性,也 同 时 完 成 了 图 像 的 采 样工 作。在 之 后,在 Backbone 的 CSP 的 帮 助 下,网 络完 成 了 局 部 跨 层 融 合 的 工 作。不 仅 如 此,neck 部 分的 SPP 和 head 部 分 也 能 够 分 别 完 成 感 受 野 增 加 和多 尺 度 输 出 的 工 作。因 而,综 合 以 上 功 能,这 一 版本 不 仅 能 够 实 现 快 速 检 测 速
18、度 基 础 上 的 小 目 标 高检测准确率。相应的 YOLOv 5 结构图 12见图 1。图 1 YOLOv 5 结构图Fig.1 YOLOv 5 structure diagram 90YOLOv 5 的 原 始 模 型 中 有 3 种 损 失 函 数,分 别为 分 类 损 失(cls_loss)、定 位 损 失(box_loss)、置 信 度 损失(obj_loss),这 3 个 指 标 极 大 程 度 上 决 定 了 模 型 的性 能。其 中,定 位 损 失 表 示 的 时 预 测 框 与 标 定 框 之间 的 误 差 GIoU。置 信 度 损 失 是 通 过 IoU 函 数 计 算出
19、 来 的,解 决 的 是 两 个 物 体 重 叠 的 情 况,为 了 解 决IoU 损 失 函 数 不 与 检 测 框 重 叠 时 的 梯 度 问 题,引 用GIoU 函数 13。其公式为:G I o U=I o U-|A c-U|/|A c|(1)LG I o U=1-I o U(2)式(1)、(2)中:I o U 为 预 测 框 与 目 标 框 的 交 集 和 并集比;A c 为最小闭包;U 为预测框与目标框的并集。此外,默认 框以 k means 算法 作为 主要 支撑,能够 实 现 超 参 k 的 自 动 获 取 工 作。由 此 可 以 看 出,自适应 anchor 是该算法的一大特征
20、。YOLOv 5 按 大 小 分 为 4 个 模 型,YOLOv 5s、YOLO v 5m、YOLO v 5 l、YOLOv 5x,各 模 型 对 比 见 图 2 13。图 2 YOLOv 5 各模型对比Fig.2 Comparison of YOLOv 5 models图 2 中,无 论 是 YOLOv 5 s,YOLOv 5 m,YO LOv 5l,还 是 YOLOv 5 x,他 们 的 主 要 组 件 Backbone,Neck 和Output 都 是 相 同 的。其 不 同 点 在 于 模 型 深 度 和 宽度 的 相 关 设 置 存 在 一 定 的 差 异 性。其 中 YOLOv 5
21、 s速 度 最 快,然 而 在 模 型 小 的 基 础 上 并 没 有 兼 顾 到 足够 的 精 度。YOLOv 5 x 虽 然 弥 补 了 精 度 上 的 不 足,但速 度 最 慢。经 过 对 比,文 中 最 终 选 择 了 YOLOv 5 s 作为基础模型。2 改进的 YOLOv 5 模型设计2.1 SE 模块为 了 增 强 网 络 对 特 征 的 提 取,文 中 给 系 统 的 主干 网 络 卷 积 层 间 引 入 注 意 力 机 制 SE 模 块。SE 模块 在 对 各 通 道 权 值 的 计 算 后,得 到 不 同 通 道 的 重 要程 度。这 样 就 可 以 注 意 到 更 为 重
22、 要 的 特 征,从 而 为注意力机制的后续发展奠定了良好的基础 14。SE 模 块 的 优 点 在 于,其 对 于 网 络 性 能 的 提 高 并不 是 以 打 乱 原 有 主 体 作 为 牺 牲 的 代 价,相 反,其 能够 实 现 在 原 有 网 络 上 的 增 添 工 作。具 体 操 作 步 骤 14见图 3(P 图)。图 3 SE 操作步骤Fig.3 SE Module输 入 特 征 图 大 小 为 W H C。图 3 中:W,H 表 示特 征 图 宽,高;C 表 示 通 道 数。其 具 体 操 作 步 骤 为:1)压 缩(Squeeze)。其 过 程 为 全 局 平 均 池 化(g
23、lobal average pooling)。特 征 图 在 对 每 一 个 通 道 的FeatureMap 经 过 相 应 的 压 缩 工 作 后 可 以 得 到 1 1 C 的向量。2)激励(excitation),见图 4。图 4 SE 激励操作Fig.4 SE incentive operation两 个 连 接 层 共 同 构 成 了 激 励 操 作,其 神 经 元 数分 别 为 C*SERatio 和 C。对 于 前 者 来 说,若 输 入 1 1 C,则 会 得 到 1 1 C SERadio 的 输 出。在 后 者 输入 1 1 C SERadio 会 得 到 1 1 C 的
24、输 出。其 中,为了 减 少 所 使 用 到 的 通 道 数 量 特 地 引 入 了 缩 放 参 数SERatio。3)Scale。在 实 现 1 1 C 向 量 之 后 需 要 完 成 原始 特 征 图 的 缩 放 工 作。在 以 W H C 为 原 始 特 征 向量 的 基 础 上,以 在 SE 模 块 帮 助 下 得 到 的 通 道 权 重值 和 来 源 于 原 始 特 征 图 的 二 维 矩 阵 进 行 乘 法 运 算,进而得到相应的输出结果。2.2 空间与通道注意力机制 CBAM虽 然 通 道 注 意 力 SE 模 块 对 于 性 能 提 升 有 显 著的 作 用,但 是 缺 点 在
25、 于 往 往 会 忽 略 位 置 特 征,位 置特 征 也 是 目 标 检 测 中 的 一 个 重 要 特 征 信 息。因 此,研究与分析 游 越,伊 力 哈 木 亚 尔 买 买 提,吕 怡 凡,等.基 于 改 进 YOLOv 5 在 电 力 巡 检 中 的 目 标 检 测 算 法 研 究 912023 年 2 月 第 59 卷 第 2 期在 系 统 中 引 入 了 另 一 种 轻 量 级 注 意 力 模 块 CBAM 15。可 以 分 别 从 两 个 部 分 对 该 网 络 结 构 进 行 划 分,即CAM(channel attention module)和 SAM(spartial at
26、ten tion module)。前 者 为 通 道 上 的 注 意 力 模 块,后 者 为空 间 上 的 注 意 力 模 块。在 两 者 的 共 同 作 用 下 能 够实 现 通 道 和 空 间 两 方 面 的 Attention。在 突 出 重 要的 特 征 的 同 时 忽 略 不 那 么 重 要 的 特 征。该 模 块 是在 SE 通 道 注 意 力 的 基 础 上 继 续 添 加 的,这 样 一 来,不 仅 能 对 参 数 和 计 算 力 需 求 进 行 一 定 的 降 低,同 时也完成了模块集成的即插即用。通 道 注 意 力 模 块 和 空 间 注 意 力 模 块 15 见 图 5、
27、6。图 5 中 输 入 特 征 F RC H W,在 通 道 注 意 力 模 块 中,一维 卷 积 M C RC 1 1,将 卷 积 结 果 乘 原 图,再 作 为 空 间注 意 力 模 块 的 输 入,进 行 二 维 卷 积 M S R1 H W,再 将输出结果与原图相乘。其计算公式为:F=MC(F)F(3)F=MS(F)F(4)式(3)、(4)中:F 为 第 一 模 块 的 输 出;F 为 最 终 输出;表 示 element wise 乘 法,在 表 达 式 中 注 意 力 值被复制,通道注意力通过空间维度播出。图 5 通道注意力模块Fig.5 Channel attention mod
28、ule图 6 空间注意力模块Fig.6 Spatial attention module在 图 5 通 道 注 意 力 模 块 中,通 道 维 度 不 变,压缩 空 间 维 度,关 注 的 是 分 类 任 务 中 分 成 不 同 种 类 的标 准。在 空 间 注 意 力 模 块 中,空 间 维 度 不 变,压 缩通道维度,关注的是目标的位置信息。通 道 注 意 力 和 空 间 注 意 力 模 块 的 组 合 方 式 并不 唯 一,可 以 通 过 并 行 的 顺 序 组 合 或 者 串 行 的 顺 序组 合。关 于 通 道 和 空 间 上 的 串 行 顺 序 和 并 行 有 学者 基 于 Res
29、Net 网 络 进 行 了 实 验 对 比 16,发 现 先 通 道再空间的结果最好。具 体实验结果 15 见表 1。表 1 实验对比表Table 1 Experimental comparison diagram描述ResNet 50+channel(SE 28)ResNet 50+channel+spatialResNet 50+spatial+channelResNet 50+channel&spatial 并联Top 1 错误率/%23.1422.6622.7822.95Top 5 错误率/%6.706.316.426.59表 1 中,Top 1 和 Top 5 是 图 像 分 类 中
30、 的 一 个 评价 标 准,代 表 对 其 中 一 张 图 像 预 测 5 个 类,只 要 有一 个 和 前 期 人 工 标 注 的 类 别 相 同 就 算 对,否 则 算 错的 概 率。可 以 看 出,在 这 几 种 排 列 顺 序 中,先 通 过通 道 后 空 间 的 子 模 块 的 Top 1 和 Top 5 均 低 于 其 他排列方式。故文中选择先通道后空间的排列顺序。2.3 改进损失函数 I o U除 此 之 外,针 对 于 本 实 验 的 数 据 集 偏 小 的 特 点,引入 一 个 新 的 Power IoU 17系 列 Loss,替 代 YOLOv 5 本身 的 bbox_ I
31、oU Loss。该 系 列 具 有 一 个 Power IoU 项和 一 个 附 加 的 Power 正 则 项,具 有 单 个 Power 参 数。将 这 种 新 的 损 失 系 列 定 义 为 IoU Loss 17。改 进 首 先 应 用 Box Cox 变 换,将 其 定 义 为 IoU LossL-I o U=1-I o U 0(5)通过调节 的大小,可以得出l i m 0(L-I o U)=l i m 01-I o U(6)文 17 实验表明,相对于原 始损失函 数,(1)增 加 了 high IoU 目 标 的 损 失 和 梯 度,进 而 提 高 了bbox 回 归 精 度。且
32、实 验 表 明,对 于 不 同 的 数 据 集并 不 敏 感,大 多 数 情 况 下,无 论 是 在 干 净 嘈 杂 的 情况 下 都 具 有 稳 定 性,不 会 引 入 额 外 的 参 数,且 不 会增加训练时间,改进损失函数前后对比表见表 2。表 2 中:A P 50 中 的 A P 表 示 P R 曲 线 下 的 面 积(P 是 准 确 率,R 为 召 回 率),A P 50 中 的 50 表 示 I o U 阈 值为 0.5,A P 75,A P 85,A P 95 同 理。m A P 为 不 同 类 别 的 A P均 值。改 进 后 的 损 失 函 数 在 两 种 数 据 集 上 都
33、 展 现 出 了不 错 的 效 果,m A P 和 m A P 75:95 均 有 较 为 明 显 的 提 升。改 进 后 的 I o U 损 失:可 以 显 著 地 超 过 现 有 的基 于 IoU 的 损 失;通 过 调 节,使 检 测 器 在 实 现 不 同水 平 的 bbox 回 归 精 度 方 面 具 有 更 大 的 灵 活 性;对 小数据集和噪声的鲁棒性更强。综 上 所 述,文 中 对 YOLOv 5 做 了 针 对 性 的 改进,使 其 对 被 遮 挡 的 目 标,以 及 小 目 标 具 有 更 高 的识 别 率。首 先 将 主 干 网 络 中 的 第 一 层 卷 积 层 替 换
34、成 SE 模 块,计 算 出 不 同 通 道 的 权 重,加 强 特 征 提取。其 次 将 下 面 的 卷 积 层 都 替 换 成 CBAM 模 块,并 92保 持 最 后 一 层 卷 积 层 不 变,进 一 步 通 过 混 合 空 间 和通 道 的 CBAM 加 强 特 征 提 取。最 后,为 了 解 决 样 本不均的问题,对损失函数进行改进。3 实验3.1 实验环境实 验 所 采 用 的 硬 件 处 理 器 为 Intel(R)Core。CPU 为 i 7-10700 F,RAM 为 16 G,GPU 为 RTX 3060,操作系统为 64 位 Windows。3.2 数据集3.2.1 数
35、据收集与预处理由 于 电 力 巡 检 的 数 据 集 大 多 都 保 密 并 未 公 开,收 集 到 的 数 据 集 有 限。文 中 原 始 数 据 集 来 源 为Github 源 数 据 集,通 过 数 据 增 强 和 数 据 扩 充,将 3 种目 标(绝 缘 子 串、防 震 锤、间 隔 棒)的 4 000 多 张,扩 充到 了 10 000 多 张。以 训 练 集 和 测 试 集 作 为 区 分 数据集的两种类型,并将其比例设置为 8 2。通 常 情 况 下,训 练 样 本 的 规 模 越 大,包 含 的 场景 越 复 杂,训 练 出 来 的 网 络 的 鲁 棒 性 和 泛 化 能 力 就
36、越 强。考 虑 到 数 据 集 的 样 本 不 均 等,且 样 本 少 等 问题,决 定 对 数 据 集 进 行 数 据 增 加 和 数 据 扩 充 18。文 中 采 用 了 旋 转、遮 挡、光 照 增 强 等 方 法 进 行 数 据增强和数据扩充,相应变化见 图 7。图 7 数据集扩充Fig.7 Data set expansion3.2.2 数据集锚框的处理在 初 步 整 理 好 数 据 集 后,数 据 集 中 会 存 在 低 分辨 率 与 高 分 辨 率 不 同 的 图 像。基 于 这 些 存 在 差 异的 图 像 产 生 的 锚 框 的 大 小 与 被 检 测 物 体 的 大 小 尺度
37、 不 同,会 导 致 目 标 检 测 不 准 确,出 现 错 检 与 漏 检的情况。本数据集锚框分布见图 8。图 8 锚框分布图Fig.8 Anchor frame distribution map3.3 实验数据结果3.3.1 改进后模型实验结果改 进 后 的 YOLOv 5s 网 络 训 练 过 程 中 整 体 损 失函 数 的 各 收 敛 情 况 曲 线 见 图 9。由 图 9 可 以 看 出,当 迭 代 次 数 达 到 50 次 时,损 失 值 稳 定 在 0.03 左 右,而 mAP 精 度 稳 定 在 0.895 左 右。得 出 结 论,该 网 络效果良好。表 2 改进损失函数前后
38、数据对比表Table 2 Data comparison table before and after improving loss function方法YOLOv 5s损失类型L IoUL-IoU相关改进/%PASCAL VOC 数据集AP 5078.8178.62-0.24AP 7558.0458.781.27AP 8535.0738.168.81AP 952.343.6455.56mAP52.7453.611.65mAP 75:9532.4534.466.21图 9 各类参数指标Fig.9 Various parameter indicators研究与分析 游 越,伊 力 哈 木 亚 尔
39、 买 买 提,吕 怡 凡,等.基 于 改 进 YOLOv 5 在 电 力 巡 检 中 的 目 标 检 测 算 法 研 究 932023 年 2 月 第 59 卷 第 2 期如 图 9 所 示,由 于 YOLOv 5 使 用 GIoU Loss 作为 bounding box 的 损 失,故 Box 为 GIoU 损 失 函 数 均值,这 也 就 意 味 着,方 框 越 小 越 检 测 的 越 准,当 迭 代次 数 趋 近 于 50 次 时,Box 值 降 到 最 低,也 就 是 检 测的 越 精 准;Objectness 指 标 为 目 标 检 测 loss 的 均 值,与 Box 一 样,越
40、 小 目 标 检 测 越 准,同 样 的,当 迭 代 次数 趋 近 于 50 次 时,其 值 降 到 最 低;Classification 为分 类 loss 均 值,代 表 的 含 义 时 当 检 测 目 标 在 进 行 分类 操 作 时 的 精 确 度,越 小 代 表 分 类 越 精 准;由 于mAP 是 用 Precision 和 Recall 作 为 两 轴 作 图 后 围 成的 面 积,而 Precision 和 Recall 通 常 是 一 对 矛 盾 的 性能 度 量 指 标。一 般 来 说,Precision 越 高 时,Recall 往往 越 低。故 通 常 以 mAP 作
41、为 模 型 精 度 考 量 的 重 要参 数,越 高 越 好。而 mAP 0.5 表 示 I o U 阈 值 大 于0.5 的 平 均 AP,见 图 10,本 模 型 的 mAP 0.5=0.895,大于初始模型的 mAP 0.5=0.838。图 10 算法改进前后各类 mAP 精度曲线对比Fig.10 Comparison of mAP accuracy curves before andafter algorithm improvement如 图 10 所 示,P R 曲 线 中 的 P 代 表 的 是precision(精 准 率),R 代 表 的 是 recall(召 回 率),PR
42、代表 的 是 精 准 率 与 召 回 率 的 关 系,一 般 情 况 下,横 坐标 为 recall,纵 坐 标 为 precision。PR 围 成 的 面 积,也就 是 AP,即 Map 的 数 据 来 源。可 以 看 出,改 进 后 的模 型 全 类 别 的 PR 曲 线 明 显 可 包 含 住 改 进 前 的 全 类别 PR 曲 线,也 就 是 说,改 进 后 的 模 型 优 于 改 进 前 的模 型。仅 仅 看 图 10(b),从 图 10(b)可 以 看 出,检 测 绝缘 子 串 的 精 度 明 显 优 于 防 震 锤 和 间 隔 棒,而 防 震 锤的 检 测 精 度 又 优 于
43、间 隔 棒 的,原 因 在 于 绝 缘 子 串 无论 是 数 据 集 的 数 量 还 是 图 片 质 量 都 比 其 他 两 种 要高 的 多,因 此,若 想 进 一 步 提 高 模 型 精 度,可 以 从 优化数据集入手。算法改进前后检测效果对比图见图 11。图 11 算法改进前后检测效果对比图Fig.11 Comparison of detection effect before and afteralgorithm improvement如 图 11 所 示,第 1 组 对 比 图 中,改 进 后 的 模 型识 别 出 了 图 片 右 边 未 拍 摄 完 整 的 绝 缘 子 串,第 2
44、组识 别 出 了 之 前 未 识 别 到 较 小 的 间 隔 棒,第 3 组 识 别出 了 被 无 人 机 遮 挡 的 绝 缘 子 串。识 别 结 果 表 明,改进 模 型 对 于 部 分 特 征 信 息 缺 失 的 目 标、以 及 过 小 的目 标,识 别 效 果 明 显 有 所 提 升,也 进 一 步 证 明 了 该改进模型的有效性。3.3.2 消融实验比对结果实验数据对比见表 3。文 中 以 原 始 模 型 参 数 作 为 对 照 组,又 增 加 了 两组 消 融 实 验,以 保 证 每 一 个 增 加 的 改 动 对 模 型 都 是有 效 的,通 过 表 1 可 以 看 出 引 入 不
45、 同 的 模 块 对 检 测 94指 标 的 影 响,原 始 模 型 的 mAP _ 0.5 为 0.838,当confidence=0.4 时,召 回 率 为 0.675。将 主 干 网 络 第一 层 卷 积 层 替 换 成 SE 模 块 以 后,由 于 它 的 作 用 在于 对 不 同 通 道 的 重 要 程 度 进 行 权 重 赋 值,进 而 加 强对 特 征 的 提 取,mAP _ 0.5 提 高 到 了 0.871,召 回 率 提高 到 了 0.752。实 验 2 相 比 实 验 3 进 一 步 引 入 了 混合 了 通 道 注 意 力 和 空 间 注 意 力 机 制,除 了 最 后
46、 一层 卷 积 层 因 为 兼 容 问 题 无 法 替 换 以 外,剩 余 的 卷 积层 全 部 替 换 为 CBAM 模 块,进 一 步 加 强 特 征 提 取,使 模 型 在 关 注 通 道 信 息 的 同 时 也 关 注 到 了 空 间 信息,实 验 结 果 表 明,mAP _ 0.5 提 高 到 了 0.882,召 回 率提 高 到 了 0.795。实 验 4,也 就 是 文 中 改 进 后 的 最 终模 型,在 实 验 3 的 基 础 上,进 一 步 改 进 损 失 函 数,使其 可 以 通 过 调 节,使 检 测 器 在 实 现 不 同 水 平 的bbox 回 归 精 度 方 面
47、具 有 更 大 的 灵 活 性,且 消 除 小 数据 集 和 样 本 不 均 衡 带 来 的 影 响。结 果 表 明,mAP _ 0.5提 高 到 了 0.895,召 回 率 提 高 到 了 0.803。另 外,在不 改 变 实 验 4 的 模 型 结 构 基 础 上,将 迭 代 次 数 增 加至 80 轮,以 试 图 进 一 步 提 高 检 测 精 度,然 而 实 验 数据 表 明,当 模 型 超 过 50 轮 后,mAP 直 线 下 降,且loss 趋 势 线 趋 于 水 平,模 型 开 始 过 拟 合,故 不 将 本 次数据纳入参考范围。综 上,在 其 经 实 验 数 据 对 比,改 进
48、 后 的 算 法 模型 mAP 精 度 明 显 提 高。小 目 标 和 被 遮 挡 的 目 标 识别率也有明显提高(when confidence=0.4)。4 结语文 中 针 对 遮 挡 场 景 下 的 输 电 线 路 巡 检 金 具 检测,对 YOLOv 5 模 型 进 行 改 进,提 出 了 一 种 新 的 网络 模 型。在 YOLOv 5 s 的 主 干 网 络 基 础 上 引 入 SE和 CBAM 模 块,SE 模 块 对 输 入 图 像 的 分 辨 率 以 及通 过 卷 积 提 取 的 网 络 特 征 进 行 层 数 和 深 度 的 优 化,得 到 的 特 征 图 再 通 过 CB
49、AM 进 行 进 一 步 优 化。实验 表 明,该 模 型 有 效 改 善 了 原 YOLOv 5s 模 型 中 存在 的 被 遮 挡 的 目 标 检 测 的 精 度,并 一 定 程 度 上 降 低了 漏 检 率,同 时 具 有 实 时 性,有 一 定 的 应 用 价 值。未 来 的 研 究 着 眼 于 在 进 一 步 精 简 网 络 结 构 的 同 时提 高 检 测 精 度、降 低 漏 检 率。同 时 丰 富 数 据 集,增加 检 测 类 别 以 提 高 模 型 泛 化 能 力,从 而 使 模 型 更 适用 于 真 实 场 景。今 后 的 研 究 重 点 是 在 进 一 步 精 简网 络 结
50、 构 的 同 时,提 高 检 测 精 度,降 低 漏 检 率。同时,丰 富 数 据 集,增 加 检 测 类 别,提 高 模 型 的 泛 化 能力,使模型更适合真实场景。参考文献:1 陈 荣,徐 浩.高压输 电线路 的无人 机电力 巡检技 术研究J.电子测试,2021(20):92 94.CHEN Rong,XU Hao.Research on UAV power inspectiontechnology for high voltage transmission linesJ.ElectronicTest,2021(20):92 94.2 刘 亦 书,杨 力 华,孙 倩.轮 廓 矩 不 变 量