1、湖 南 农 业 大 学全 日 制 普 通 本 科 生 毕 业 设 计字符图像识别系统的预处理算法设计与实现 DESIGN AND IMPLEMENTATION OF PRE-PROCESSING ALGORITHM ON CHARACTER IMAGE RECOGNITION SYSTEM湖南农业大学全日制普通本科生毕业设计诚 信 声 明本人郑重声明:所呈交的本科毕业论文是本人在指导老师的指导下,进行研究工作所取得的成果,成果不存在知识产权争议。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体在文中均作了明确的说明并表示了
2、谢意。本人完全意识到本声明的法律结果由本人承担。毕业论文(设计)作者签名:年 月 日目 录摘 要 .1关键词 .11 前言 .21.1 研究意义 .21.2 国内外研究现状 .22 MATLAB 软件与图像预处理 .42.1 MATLAB 简述 .42.2 MATLAB 软件与图像预处理 .52.2.1 MATLAB 处理图像的特点 .62.2.2 MATLAB 在图像方面的应用 .63 预处理介绍 .73.1 图像灰度化 .73.1.1 灰度的概念 .73.1.2 图像灰度化介绍 .73.1.3 图像灰度化的常用方法 .83.2 图像增强 .93.2.1 灰度变换 .93.2.2 直方图变换
3、 .113.3 图像平滑去噪 .123.3.1 图像噪声 .123.3.2 平滑去噪常用方法 .143.4 图像二值化 .183.4.1 图像二值化介绍 .183.4.1 图像二值化常用方法 .184 算法设计与实现 .194.1 总体设计 .194.2 具体代码 .204.3 具体实例 .234.3.1 实例一 .234.3.1 实例二 .255 总结 .27参考文献 .28致 谢 .291字符图像识别系统的预处理算法设计与实现摘 要:在图像处理的过程中,由于获取图像的工具或手段的影响,使获取图像无法完全体现原始图像的全部信息。因此,以改善图像数据、抑制不需要的变形或者增强某些对于后续处理来
4、说比较重要的图像特征为目的的图像预处理在图像处理的过程中就显得非常重要。常用的图像预处理手段包括图像大小的修改、图像浓度的扩展,图像由彩色差到灰度的转变、图像二值化、图像的锐化处理及图像平滑处理等方法。本文在简单介绍数字图像处理技术的基础上,着重讨论了灰度直方图的构建、直方图均衡、图像平滑、图像二值化和噪声处理的原理及实现方法,并用MATLAB 开发工具实现了上述图像预处理算法并给出了各种算法的处理结果。关键词:图像预处理;图像增强;平滑去噪;中值滤波Design and Implementation of Pre-Processing Algorithm on Character Image
5、 Recognition SystemAbstract: In the process of image processing, due to the affection of image tools, the acquisition image cant reflect the original image information completely. Therefore, to improve image data, inhibit deformation and enhance image characteristics is very important in image proce
6、ssing.Common image preprocessing method include the image size modification, the image thickness expansion, changing color image to gray, image gray-scale binary, image sharpening and the image smooth processing. Based on the brief introduction of digital image processing technique, this paper discu
7、ssed the construction of gray histogram, equilibrium of histogram, the image smoothing,image gray-scale binary and noise treatments principle and method. The realizations of all those image preprocessing algorithm which is realized with MATLAB has been discussed in this paper, and all those result h
8、as been given after the implementations. KeyWords:image pre-processing;image enhancement;image denoising;median filter1 前言1.1 研究意义视 觉 是 人 类 感 觉 中 最 高 级 的 , 而 图 像 又 在 人 类 的 感 知 中 起 着 重 要 的 作 用 。 图 像 作 为2一 种 重 要 的 信 息 源 , 通 过 对 图 像 的 处 理 和 预 处 理 可 以 帮 助 我 们 了 解 信 息 的 内 涵 , 增 强 对信 息 的 把 握 度 , 然 而 图 像 容
9、 易 受 到 损 坏 或 噪 声 污 染 , 失 去 原 来 的 信 息 , 因 此 图 像 预 处 理就 是 在 这 一 需 求 下 应 运 而 生 的 。 图 像 预 处 理 作 为 图 像 处 理 的 重 要 组 成 部 分 , 对 于 人 们 获得 货 真 价 实 的 图 像 信 息 以 及 复 原 图 像 本 来 的 面 目 具 有 决 定 性 的 作 用 1。 图 像 预 处 理 顾 名思 义 就 是 在 图 像 分 析 中 , 对 我 们 输 入 的 图 像 进 行 特 征 抽 取 、 分 割 及 匹 配 前 所 进 行 的 处 理 。进 行 图 像 预 处 理 主 要 目 的
10、是 为 了 消 除 图 像 中 无 关 紧 要 的 信 息 , 恢 复 有 用 的 真 实 的 信 息 ,增 强 相 关 信 息 的 可 检 测 性 和 最 大 限 度 地 简 化 我 们 需 要 的 数 据 , 从 而 增 加 特 征 抽 取 、 图 像分 割 、 匹 配 和 识 别 等 后 续 图 像 处 理 步 骤 的 可 靠 性 2。 因 此 对 图 像 进 行 预 处 理 就 成 了 人 们获 得 图 像 信 息 的 首 要 解 决 的 事 情 , 然 而 人 们 对 于 图 像 预 处 理 的 知 识 了 解 不 是 很 多 , 而 且图 像 预 处 理 方 法 繁 多 , 单 单
11、 就 平 滑 处 理 来 说 就 有 好 多 种 方 法 , 它 们 相 比 有 哪 些 优 缺 点 ,以 及 中 值 滤 波 有 何 改 进 之 处 , 这 就 是 本 文 要 探 讨 和 研 究 的 地 方 3。 图 像 预 处 理 是 一 个 广阔 的 学 科 , 应 用 广 , 分 类 细 , 但 是 远 远 不 能 满 足 社 会 当 今 的 需 求 , 需 要 不 断 的 完 善 和 发展 , 有 很 多 新 的 方 面 需 要 探 索 。1.2 国内外研究现状对 于 获 取 来 的 静 态 图 像 做 的 一 个 去 噪 处 理 过 程 , 增 强 等 处 理 的 过 程 即 是
12、 图 像 的 预 处理 过 程 。 在 实 际 应 用 中 , 各 种 因 素 都 可 能 对 拍 摄 的 图 像 产 生 影 响 , 例 如 天 气 好 坏 , 光 线强 弱 或 者 人 为 因 素 , 以 及 设 备 使 用 时 间 过 长 等 。 为 了 能 最 大 程 度 减 少 外 界 干 扰 对 于 整 个系 统 的 影 响 , 应 该 在 车 牌 定 位 以 前 将 图 像 中 的 干 扰 和 噪 声 滤 除 5。 有 些 研 究 者 专 门 针 对图 像 的 预 处 理 阶 段 提 出 了 一 些 算 法 , 例 如 , 李 战 明 等 人 提 出 了 一 种 图 像 预 处
13、理 算 法 , 该算 法 分 四 个 步 骤 来 逐 步 实 现 对 图 像 的 去 噪 和 增 强 操 作 , 处 理 步 骤 包 括 尺 寸 归 一 化 , 中 值滤 波 , 图 像 增 强 以 及 二 值 化 , 在 原 有 理 论 研 究 的 基 础 上 引 入 了 一 些 新 思 想 和 新 方 法 1。董 玲 娇 等 人 提 出 了 一 种 新 的 图 像 预 处 理 算 法 , 该 算 法 充 分 考 虑 由 于 各 种 原 因 造 成 的 图 像歪 斜 、 模 糊 或 缺 损 等 情 况 , 具 有 较 好 的 处 理 效 果 4。 也 有 一 些 研 究 者 考 虑 先 通
14、过 用 形 态运 算 来 过 滤 掉 图 像 的 背 景 信 息 , 因 为 图 像 的 背 景 信 息 对 于 车 牌 的 定 位 以 及 后 续 环 节 无 关紧 要 , 去 掉 背 景 信 息 还 可 以 提 高 处 理 的 效 率 , 使 用 该 种 方 法 的 研 究 者 例 如 朱 光 忠 等 人 提出 了 一 种 基 于 多 尺 度 Top-Hat 算 子 的 图 像 预 处 理 算 法 , 该 算 法 针 对 不 同 的 图 像 模 块 引 入不 同 尺 度 结 构 元 素 来 对 图 像 进 行 处 理 , 取 得 了 较 好 的 效 果 5。 以 上 列 举 出 来 的 部
15、 分 图 像预 处 理 算 法 大 多 都 为 传 统 的 数 字 图 像 处 理 算 法 , 因 此 并 没 有 考 虑 到 图 像 的 特 殊 性 , 在 实际 的 系 统 中 处 理 的 效 果 不 理 想 。 为 了 保 证 算 法 达 到 较 好 的 效 果 , 必 须 针 对 图 像 展 开 研 究 ,系 统 的 观 察 各 个 环 境 以 及 受 到 不 同 干 扰 的 情 况 下 车 牌 的 效 果 , 以 及 图 像 所 受 到 的 干 扰 对3整 个 算 法 的 影 响 , 从 而 设 计 专 门 的 算 法 来 进 行 预 处 理 , 这 就 是 目 前 图 像 预 处
16、理 算 法 所 存在 的 一 些 缺 陷 和 不 足 。随 着 计 算 机 和 人 工 智 能 的 迅 速 发 展 , 数 字 图 像 处 理 技 术 向 着 更 高 、 更 深 的 层 次 发 展 。人 们 开 始 研 究 如 何 利 用 计 算 机 系 统 的 解 释 处 理 图 像 , 这 类 被 称 为 图 像 理 解 或 者 计 算 机 视觉 。 发 达 国 家 投 入 了 大 量 的 人 力 物 力 来 研 究 这 项 技 术 , 取 得 了 不 少 重 要 的 成 果 , 其 中 比较 有 代 表 性 的 成 果 是 70 年 代 Marr 提 出 的 视 觉 计 算 理 论 ,
17、 此 理 论 成 为 计 算 机 视 觉 领 域 的主 导 思 想 6。 当 前 , 由 于 计 算 机 技 术 的 飞 速 发 展 , 图 像 处 理 总 的 发 展 研 究 趋 势 是 以 数 字处 理 为 主 。 数 字 图 像 处 理 实 质 上 是 计 算 机 技 术 、 信 息 论 和 信 号 处 理 相 结 合 的 综 合 性 应 用学 科 , 与 其 它 学 科 有 着 密 切 的 关 系 。 图 像 去 噪 就 是 数 字 图 像 处 理 技 术 中 的 重 要 技 术 之 一 。近 些 年 , 国 内 外 发 表 的 数 字 图 像 预 处 理 方 面 的 论 文 提 出
18、了 很 多 卓 有 成 效 的 对 图 像 处 理 的模 型 或 方 法 , 其 中 最 主 要 的 是 图 像 去 噪 , 图 像 去 噪 的 方 法 从 不 同 处 理 域 的 角 度 可 以 划 分空 域 和 频 域 两 种 处 理 方 法 : 前 者 是 在 图 像 本 身 存 在 的 二 维 空 间 里 对 其 进 行 处 理 ; 而 后 者则 是 用 一 组 正 交 函 数 系 来 逼 近 原 信 号 函 数 , 获 得 相 应 的 系 数 , 将 对 原 信 号 的 分 析 转 化 到了 系 数 空 间 域 , 即 频 域 中 进 行 7。 空 间 域 的 线 性 滤 波 算 法
19、 理 论 发 展 较 为 成 熟 , 数 字 分 析简 单 , 对 滤 除 与 信 号 不 相 关 的 随 机 噪 声 效 果 显 著 , 但 是 它 本 身 存 在 着 明 显 的 缺 陷 , 如 需要 随 机 噪 声 的 先 验 统 计 知 识 , 对 图 像 边 缘 细 节 保 护 能 力 较 差 等 , 特 别 是 后 者 使 得 线 性 滤波 无 法 很 好 地 适 应 于 图 像 的 噪 声 滤 除 处 理 。 与 线 性 滤 波 相 对 应 的 非 线 性 滤 波 大 都 考 虑 到了 人 的 视 觉 标 准 和 最 佳 滤 波 准 则 , 提 高 了 图 像 分 辨 率 和 边
20、 缘 保 护 能 力 , 特 别 是 一 些 改 进后 的 非 线 性 滤 波 方 法 一 般 都 具 有 了 一 定 的 自 适 应 性 , 这 就 使 得 非 线 性 滤 波 的 功 能 更 为 强大 , 可 以 广 泛 地 应 用 到 医 学 、 遥 感 等 领 域 的 图 像 处 理 中 。 1971 年 , 图 基 提 出 了 中 值 滤 波的 思 想 , 并 首 先 应 用 与 时 间 序 列 的 分 析 中 , 后 来 这 种 方 法 引 入 到 图 像 处 理 中 , 用 来 滤 除图 像 的 噪 声 , 收 到 了 良 好 的 效 果 8。 随 之 而 来 的 是 各 种 中
21、 值 滤 波 的 改 进 方 案 。 其 中 有 一种 被 称 为 自 适 应 中 值 滤 波 的 改 进 算 法 引 起 了 人 们 的 关 注 , 这 种 方 法 最 突 出 的 特 点 是 具 有自 适 应 的 性 能 并 且 对 图 像 的 边 缘 保 护 能 力 较 传 统 算 法 具 有 明 显 提 高 。 另 外 数 学 形 态 学 和统 计 学 的 引 入 为 数 字 滤 波 技 术 开 辟 了 新 的 途 径 , 1982 年 Serra 出 版 的 专 著 Image Analysis and Mathematical Morphology 成 为 数 学 形 态 学 应
22、用 于 数 字 图 像 领 域 的 咀 程 碑 ,由 此 孕 育 了 很 多 相 天 的 滤 波 算 法 , 使 得 图 像 滤 波 算 法 对 图 像 的 处 理 有 了 显 著 提 高 , 边 缘保 护 能 力 也 得 到 增 强 9。 图 像 去 除 脉 冲 噪 声 特 别 是 椒 盐 噪 声 的 方 法 有 很 多 , 其 中 非 线 性中 值 滤 波 器 作 为 排 序 统 计 滤 波 器 的 典 型 代 表 而 广 泛 应 用 于 数 字 图 像 的 预 处 理 领 域 。 它 与线 性 平 滑 滤 波 器 相 比 , 能 在 一 程 度 上 去 除 椒 盐 噪 声 , 同 时 减
23、 少 图 像 模 糊 。 但 中 值 滤 波 的4滤 波 窗 口 大 小 固 定 , 随 着 图 像 噪 声 率 的 增 加 , 其 噪 声 去 除 能 力 下 降 很 快 。 这 是 由 于 随 着噪 声 率 的 增 加 , 图 像 中 有 用 的 信 号 点 逐 渐 减 少 , 噪 声 点 因 邻 域 内 可 用 于 滤 波 的 信 号 点 太少 而 不 能 被 有 效 滤 除 10。 除 了 上 述 方 法 之 外 , 实 际 上 还 有 许 多 学 者 提 出 了 其 他 方 面 的 方法 , 比 如 自 适 应 加 权 滤 波 等 , 各 种 改 进 方 法 的 优 劣 不 一 ,
24、目 的 都 是 为 了 图 像 预 处 理 。1.3 论文安排及主要研究问题第 一 章 为 绪 论 , 首 先 阐 述 了 本 论 文 的 研 究 目 的 和 意 义 , 然 后 介 绍 图 像 预 处 理 技 术 的国 内 外 研 究 现 状 , 最 后 给 出 了 本 论 文 的 主 要 工 作 安 排 及 结 构 。 第 二 章 介 绍 MATLAB 软 件 ,以 及 MATLAB 对 图 像 处 理 的 几 种 基 本 方 法 。 第 三 章 进 行 图 像 灰 度 化 设 计 。 第 四 章 进 行图 像 增 强 。 第 五 章 重 点 介 绍 图 像 平 滑 滤 波 技 术 , 围
25、 绕 平 滑 滤 波 的 分 类 重 点 介 绍 了 均 值 滤波 、 高 斯 滤 波 、 中 值 滤 波 及 频 域 低 通 滤 波 等 几 个 方 法 的 原 理 以 及 算 法 流 程 图 , 并 且 分 析各 个 算 法 的 优 缺 点 。 第 六 章 主 要 介 绍 图 像 灰 度 化 , 以 及 灰 度 化 算 法 的 。 最 后 一 章 是 对 论文 的 主 要 工 作 进 行 了 总 结 , 并 找 到 不 足 之 处 及 改 进 的 方 向 。2 MATLAB 软件与图像预处理2.1 MATLAB 简述MATLAB 是矩阵实验室(M atrix Laborator)的简称,是
26、美国 MathWorks 公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括 MATLAB 和 Simulink 两大部分。MATLAB 是由美国 mathworks 公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如 C、 Fortran)的编辑模式,代表了当今国际科学计
27、算软件的先进水平。MathWorks 公司针对不同领域的应用,推出了信号处理,控制系统,神经网络,图像处理,小波分析,鲁棒控制,非线性系统控制设计,系统辨识,优化设计,统计分析,财政金融,样条,通信等 30 多个具有专门功能的工具箱,这些工具箱是由该领域内的学术水平较高的专家编写的,无需用户自己编写所用的专业基础程序,可直接对工具箱进行运用。同时,工具箱内的函数源程序也是开放性的,多为 M 文件,用户可以查看这些文件的代码并进行更改,MALAB 支持用户对其函数进行二次开发,用户的应用程序也可以作为新的函数添加到相应的工具箱中。MATLAB 中的数字图像是以矩阵形式表示的,这意味着5MATLA
28、B 强大的矩阵运算能力用于图像处理非常有利,矩阵运算的语法对 MATLAB中的数字图像同样适用。MATLAB 和 Mathematica、 Maple 并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB 可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。MATLAB 的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用 MATLAB 来解算问题要比用 C, FORTRAN 等语言完成相同的事情简捷得多,并且 MATLA
29、B 也吸收了像 Maple 等软件的优点,使 MATLAB 成为一个强大的数学软件。在新的版本中也加入了对 C, FORTRAN, C+ , JAVA 的支持。可以直接调用,用户也可以将自己编写的实用程序导入到 MATLAB 函数库中方便自己以后调用,此外许多 的 MATLAB 爱 好 者 都 编 写 了 一 些 经 典 的 程 序 , 用 户 可 以 直 接 进 行 下 载 就 可 以用 。2.2 MATLAB 软件与图像预处理MATLAB 最 突 出 的 功 能 就 是 简 洁 , 用 更 直 观 的 符 合 人 们 思 维 的 代 码 代 替 了 C 和VC+的 冗 长 的 代 码 ,
30、给 用 于 带 来 了 最 直 观 最 简 洁 的 程 序 开 发 环 境 。 而 且 MATLAB 的 图形 功 能 很 强 大 , 在 MATLAB 里 数 据 的 可 视 化 非 常 简 单 , MATLAB 还 具 有 较 强 的 编 辑 图形 界 面 的 能 力 。 MATLAB 的 另 一 大 特 色 是 功 能 强 大 的 工 具 箱 。 MATLAB 软 件 里 包 含 两部 分 : 核 心 部 分 和 各 种 可 自 由 选 取 的 工 具 箱 。 核 心 部 分 则 有 数 百 个 内 部 函 数 , 工 具 箱 又分 为 两 个 方 面 : 功 能 性 工 具 箱 和 学
31、 科 性 工 具 箱 。 前 者 用 来 扩 充 符 号 计 算 功 能 , 图 像 建 模仿 真 功 能 , 文 字 处 理 功 能 和 硬 件 实 时 交 互 功 能 等 。 可 以 看 出 功 能 性 工 具 箱 用 于 多 种 类 型的 学 科 , 而 学 科 性 工 具 箱 是 比 较 专 业 性 的 工 具 箱 , 如 signl processing toolbox, communication toolbox 等 等 , 所 以 用 户 可 以 不 编 写 自 己 学 科 内 的 基 础 性 程 序 ,直 接 进 行 高 端 的 程 序 研 究 。 在 上 述 工 具 箱 中
32、, 图 像 处 理 工 具 包 是 由 一 系 列 支 持 图 像 处 理操 作 的 函 数 构 成 的 , 所 支 持 的 图 像 操 作 有 : 图 像 几 何 操 作 , 邻 域 操 作 、 图 像 变 换 、 图 像增 强 与 恢 复 、 线 性 滤 波 和 滤 波 器 的 设 计 与 实 现 等 等 。2.2.1 MATLAB 处理图像的特点(1)MATLAB 的基本数据单位是矩阵,它的指令表达式与数学,工程中常用的形式十分相似,故用 MATLAB 来解算问题要比用 C,FORTRAN 等语言完成相同的事情简捷得多。6(2)友好的工作平台和编程环境。MATLAB 由一系列工具组成。这
33、些工具方便用户使用 MATLAB 的函数和文件,其中许多工具采用的是图形用户界面。包括MATLAB 桌面和命令窗口、历史命令窗口、编辑器和调试器、路径搜索和用于用户浏览帮助、工作空间、文件的浏览器。(3)简单易用的程序语言。MATLAB 一个高级的距阵 /阵列语言,它包含控制语句、函数、数据结构、输入和输出和面向对象编程特点。用户可以在命令窗口中将输入语句与执行命令同步,也可以先编写好一个较大的复杂的应用程序(M 文件)后再一起运行。(4)强大的科学计算机数据处理能力。MATLAB 是一个包含大量计算算法的集合。其拥有 600 多个工程中要用到的数学运算函数,可以方便的实现用户所需的各种计算功
34、能。(5) ,出色的图形处理功能,MATLAB 自产生之日起就具有方便的数据可视化功能,以将向量和距阵用图形表现出来,并且可以对图形进行标注和打印。高层次的作图包括二维和三维的可视化、图象处理、动画和表达式作图。可用于科学计算和工程绘图。(6) ,应用广泛的模块集合工具箱,MATLAB 对许多专门的领域都开发了功能强大的模块集和工具箱。一般来说,他们都是由特定领域的专家开发的,用户可以直接使用工具箱学习、应用和评估不同的方法而不需要自己编写代码。2.2.2 MATLAB 在图像方面的应用( 1) 图 像 文 件 格 式 的 读 入 和 写 出 。 MATLAB 提 供 了 图 像 读 入 函
35、数 imread(), 用 来读 取 各 种 各 样 的 文 件 , 如 bmp、 pcx、 jgpeg 、 hdf、 xwd 等 格 式 的 图 像 。 MATLAB 还 提供 了 图 像 写 出 函 数 imwrite(), 另 外 还 有 图 像 显 示 函 数 image()、 imshow()。( 2) 图 像 处 理 相 关 的 基 本 运 算 。 MATLAB 提 供 了 图 像 线 性 运 算 以 及 卷 积 、 相 关 、滤 波 等 非 线 性 算 。 例 如 , 用 函 数 conv2(A, B)实 现 了 A, B 两 幅 图 像 的 卷 积 运 算 。( 3) 图 像
36、变 换 。 图 像 变 换 技 术 是 图 像 处 理 的 重 要 工 具 , 常 运 用 于 图 像 压 缩 、 滤 波 、编 码 和 后 续 的 特 征 抽 取 或 信 息 分 析 过 程 。 MATLAB 工 具 箱 提 供 了 常 用 的 变 换 函 数 , 如fft2()与 ifft2()函 数 分 别 实 现 二 维 快 速 傅 立 叶 变 换 与 其 逆 变 换 , dct2()与 idct2()函 数实 现 二 维 离 散 余 弦 变 换 与 其 逆 变 换 , Radon()与 iradon()函 数 实 现 Radon 变 换 与 逆 Radon变 换 。( 4) 平 滑 与 锐 化 滤 波 。 平 滑 技 术 用 于 平 滑 图 像 中 的 噪 声 基 本 采 用 在 空 间 域 上 的 求