1、3.2 深度图像二值化图像二值化是图像处理中的一项基本技术,也是很多图像处理技术的预处理过程。在颗粒分析、模式识别技术、光学字符识别(OCR) 、医学数据可视化中的切片配准等应用中,图像二值化是它们进行数据预处理的重要技术。由于图像二值化过程将会损失原图像的许多有用信息,因此在进行二值化预处理过程中,能否保留原图的主要特征非常关键。在不同的应用中,图像二值化时阈值的选择是不同的。因此,自适应图像阈值的选取方法非常值得研究。研究者对图像二值化方法进行了讨论,在此基础上提出了一个新的图像二值化算法。该算法基于数学形态学理论,较好地保留了图像二值化时原图的边缘特征。本文主要研究二值化及灰度图像二值化
2、方法。3.2.1.灰度图像与二值图像数字图像是将连续的模拟图像经过离散化处理后得到的计算机能够辨识的点阵图像。在严格意义上讲,数字图像是经过等距离矩形网格采样,对幅度进行等间隔量化的二维函数。因此,数字图像实际上就是被量化的二维采样数组。一幅数字图像都是由若干个数据点组成的,每个数据点称为像素(pixel)。比如一幅256400,就是指该图像是由水平方向上256列像素和垂直方向上400行像素组成的矩形图。每一个像素具有自己的属性,如颜色(color)、灰度(grayscale)等,颜色和灰度是决定一幅图像表现里的关键因素。数字图像又可分为彩色图像、灰度图像、二值图像。3.2.1.1 彩色图像彩
3、色图像是多光谱图像的一种特殊情况,对应于人类视觉的三基色即红(R)、绿(G)、蓝(B)三个波段,是对人眼的光谱量化性质的近似。彩色图像中的每个像素的颜色有R、G、B三个分量决定,而每个分量有255种值可取,这样一个像素点可以有1600多万的颜色的变化范围。而灰度图像是R、G 、B三个分量相同的一种特殊的彩色图像,一个像素点的变化范围为255种。图1-1为彩色图像。图 1-1 3.2.1.2 灰度图像灰度图像是指只含亮度信息,不含色彩信息的图像。单纯的看,灰度图也是黑白的,就像黑白电视显示的图像一样,但是点与点之间黑的程度是不一样的、这就是深度。如果称不同深度的颜色为一色的话,灰度图像就不止只有
4、黑色和白色两种颜色,一般使用的灰度图为 256 级灰度图,就是说图像由 256 种不同灰度级的颜色组成。图像灰度化的效果如图 1-2。图 1-2灰度图像是 R、G、B 三个分量相同的一种特殊的彩色图像,其一个像素点的变化范围为 255 种。YUV 是编译颜色空间的种类,“Y” 表示明亮度“U”表示色度“V”表示浓度,根据 YUV 的颜色空间,Y 的分量的物理意义是点的亮度,由该值反映亮度等级,根据 RGB 和 YUV 颜色空间的变化关系可建立亮度 Y 与R、G、B 三个颜色分量的对应:Y=0.3R+0.59G+0.11B (1-1)以这个亮度值表达图像的灰度值。3.2.1.3 二值图像二值图像
5、就是指只有两个灰度级的图像,二值图像具有存储空间小,处理速度快,可以方便地对图像进行布尔逻辑运算等特点。更重要的是,在二值图像的基础上,还可以进一步对图像处理,获得该图像的一些几何特征或者其他更多特征。在图像相关方面, 用二值图像进行相关比用灰度级图像进行相关有更好的相关性能和去噪作用。在用硬件实现时可避免乘法运算,从而提高硬件系统的速度和降低成本。在图像的符号匹配方面,二值图像比灰度级图像更适合于用符号来表达。二值图既保留了原始图像的主要特征,又使信息量得到了极大的压缩。图 1-3 为二值图像。图 1-33.2.2 灰度图像二值化方法研究图像二值化是图像处理中的一项基本技术,也是很多图像处理
6、技术的预处理过程。图像的预处理在进行图像二值化操作前要对图像进行预处理,包括彩色图像灰化和增强。由于选取阈值需要参照直方图,因此在图像进行处理后,我们再获取图像的直方图以帮助选取阈值。整个流程如下所示: 读取图像灰度图像图像增强图像直方图二值化处理图像二值化是图像数据预处理的重要技术,如果二值化过程中阈值选取不当会损失原图像的许多有用信息。图像二值化处理的方法包括全局阈值法、局部阈值法。3.2.2.1 全局阈值法3.2.2.2 全局阈值法的概念全局阈值法是指在二值化过程中只使用一个全局阈值 T 的方法。它将图像的每个像素的灰度值与 T 进行比较,若大于 T,则取为前景色(白色);否则,取为背景
7、色。根据文本图像的直方图或灰度空间分布确定一个阈值,以此实现灰度文本图像到二值图像的转化,其中全局阈值法又可分为基于点的阈值法和基于区域的阈值法。阈值分割法的结果很大程度上依赖于对阈值的选择,因此该方法的关键是如何选择合适的阈值。选择不同的初始灰度也会产生不一样的二值化图像,图21 所示3 幅图像则是分别采取T=109,T=127,T=155 三种初始值对Lena 进行基本全局门限二值化后的图像。可以看出效果都不一样。因此要获得最佳效果,必须要考虑选择一个好的初始T 值。另外使用迭代法虽然能得到很精确的阈值,但是也占用了大量的时间,即时间复杂度比较高,效率较其他算法低。图213.2.2.3 全
8、局阈值法的方法典型的全局阈值法包括 Otsu 方法、最大熵方法等。全局阈值法算法简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对于由于光照不均匀、噪声干扰较大等原因使直方图分布不呈双峰的图像,二值化效果明显变差。下面重点介绍 Otsu 方法:Otsu 方法是一种全局化的动态二值化方法,又叫大津法,还称为最大类间差发,是基于整幅图像的统计征,实现阈值的自动选取。其原理是把图像直方图用某一灰度值分割成两类,分别计算这两类的像素点数和灰度平均值,然后计算它们的类间方差。当被分割成的两类间方差最大时,此灰度值就作为图像二值化处理的阈值。大津法的使用范围比较广,不论图像的直方图有无明显
9、的双峰,都能得到较满意的结果,在很多领域得到了应用和发展。 对图像 Image,记 为目标与背景的分割阈值,目标像素数占图像比例为 ,平t 0均灰度为 ;背景像素数占图像比例为 ,平均灰度为 。图像的总平均灰011度为: 。从最小灰度值到最大灰度值遍历 ,当 使)()(10tt t得值 最大时 即为分割的最佳阈值。对大津法可220g t作如下理解:该式实际上就是类间方差值,阈值 分割出的目标和背景两部分构成了整幅图像,而目标取值 ,概率为 ,背景取值 ,概率为 ,总均值0011为 ,根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大说明构成图像的两部分差别越大,当部分目标点错
10、分为背景或部分背景点错分为目标点都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小。记 为 图像 点处的灰度值,灰度级为 ,不妨假设 取值),(jifMN),(ji ),(jif。记 为灰度值为 k 的频率,则有:10m)kp(2-1)kjif),(1(假设用灰度值 t 为阈值分割出的目标与背景分别为: 和),(tjif,于是目标部分比例: , (2-2),(tjiftip0)()(目标部分点数: (2-3)tipMNt00 )(背景部分比例: (2-4)11)(mit背景部分点数: (2-5)(itP目标均值: (2-6)tipt00)(/背景均值: (2-7)111)(mi
11、t ti总均值: (2-8)(0t大津法指出求图像最佳阈值 g 的公式为:(2-9)()( 21201-mt0 tttMaxArg该式右边括号内实际上就是类间方差值,阈值g分割出的目标和背景两部分构成了整幅图像,而目标值 ,概率为 ,背景取值 ,概率为 ,总)(0t)(1t)(1t)(0t均值为 ,根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小,这便是大津法的真正含义。其实,换一种思想也能很好的理解大津方法。 和 ,可以分别代表目标和背
12、景的中心灰度, 则代表整)(0t1t 幅图像的中心灰度,要使目标和背景得到最好的分割,当然希望分割出的目标尽量远离图像中心,即 或 尽量大,背景也尽量远离中心,20)(t|)(|0t即 或 尽量大,由于希望两者都大,于是有:21)(t|)|1t(1) 两者之加权和最大:(2-10)()( 21201-mt0 tttMaxArg(2) 两者之积最大:(2-11)()( 21201-t0ttr注意到有 ,且 ,因此有:)(1 )(10tt。可见是二者等价222120 )()()( tt的。图2-2 为灰度图像由Otsu方法得到的二值图像。原图 Otsu 方法得到的二值图像图 2-23.2.2.4
13、全局阈值法的优缺点介绍及阈值选取全局阈值方法依然存在一些不足,主要表现在:若目标与背景之间灰度差不明显,可能出现大块黑色区域,甚至丢失整幅图像的信息;仅利用一维灰度直方图分布,没有结合图像的空间相关信息,处理效果不好;当图像中有断裂现象或者背景有一定噪声时,无法得到预期效果。为了满足图像处理应用系统自动化及实时性要求,图像二值化的阈值的选择最好由计算机自动来完成。下面列举几个阈值的自动选择算法;(1)平均灰度值法以图像中所有像素灰度值的平均值为阈值。(2)大津法:又称最大类间差发,和上文中的 Otsu 方法相同。(3) 边缘算子法;采用Laplace算子、Robert算子、Sober算子等对像
14、素点进行灰度级增强或减弱的变换。对于灰度均匀分布的区域内的像素点,这些算子对其进行灰度减弱;对于在边缘附近的像素点,这些算子对其进行灰度增强。3.2.3 局部阈值法3.2.3.1 局部阈值法的概念局部阈值法是用像素灰度值和此像素邻域的局部灰度特性来确定该像素的阈值的,当照明不均匀,有突发噪声,或者背景灰度变化较大时,局部阈值确定技术必须根据像素的坐标位置关系自动确定不同阈值,实施动态的自适应二值化处理。局部阈值选取一般将图像划分为若干子图像,在每个子图像区域上使用整体阈值法,从而可以构成是整幅图像的局部阈值法(根据每个子图像确定相应的阈值,具体的阈值确定方法同全局阈值的确定类似)。用这种方法分
15、割后的图像在不同的子图像的边界处有灰度的不连续分布,因此必须采用平滑技术来消除灰度的不连续性。3.2.3.2 局部阈值法的方法比较典型的局部二值化算法有 Bernsen 方法、多阈值的梯度强度法、基于纹理图像的方法、最大方差法等。下面着重介绍 Bernsen 方法局部阈值法把灰度阈值选取为随像素位置变化而变化的函数,它是一种动态选择阈值的自适应方法。设图像在像素点 处的灰度值为 ,考虑以像素点 为中心的),(ji ),(jif ),(ji窗口,( 表示窗口的边长),则 Bernsen 算法可以描述如12)(12下:计算图像中各个像素点 的阈值),(ji),(jiT(2-12)mnmax(5.0
16、),( nffjiTn 对图像中各像素点 用 值逐点进行二值化。),(ji),(jib(2-13),(),(10),( jiTjifjib用 存储灰度图像的值,设 为 ,把 边界扩展成 extendIIMNI2MN矩阵。3.2.3.3 局部阈值法的优缺点介绍局部阈值法一般用于识别干扰比较严重、品质较差的图像,相对整体阈值方法有更广泛的应用,但也存在缺点和问题,如实现速度慢、不能保证图像连通性以及容易出现伪装现象等。图 2-3 为灰度图像由 Bernsen 方法得到的二值图像。原图 Bernsen 二值图像图 2-33.2.4 灰度图像二值化的应用图像二值化是图像处理中一个非常活跃的分支, 其应
17、用领域非常广泛,作为一种高效智能的人机交互手段,身份证的快速识别技术可以广泛的应用于公民身份核查、暂住人口调查、旅店业登记核查、犯罪追逃等公安业务当中,大大提高了工作效率。由于身份证图像背景复杂,由激光防伪阴影网格线及各种版面噪声构成:且因激光防伪标志和打印条件的千差万别,再加上身份证的字符识别带来了很大的困难。必须经过预处理,除去大量的噪声信号,才能更好的进行字符的定位、分割,以及识别。而二值化是,预处理中非常重要的一步也是最为关键的一步,他直接影响到 OCR 系统的性能。在传真技术领域里,文件传真机是具有黑白二值信息的文字和图表。在颗粒分析、模式识别技术、光学字符识别(OCR)、医学数据可
18、视化中的切片配准等应用中,图像二值化是它们进行数据预处理的重要技术。激光雕刻中图像处理的二值化处理激光雕刻是近十几年随着激光技术的发展而产生的一种新的雕刻技术,它与计算器图形学、图像处理等学科的结合,应用在各种材料上进行文字、图像加工。如何能得到光滑且能真实反映原图像的雕刻图像是其中的主要问题,但是激光器的开关只有两种状态,因此,图像的二值化处理就成为了关键性技术,其中阈值的选取是决定二值化图像好坏的因素。现实世界中黑白二值图像很少用,大多数图像都是灰度图像或是彩色图像。要使这些图像适用于激光雕刻中,就需要对其进行二值化处,研究者针对激光雕刻总结了适用于雕刻的二值化方法,使得得到的二值图像效果最好。在信息社会中人的身份识别得到广泛关注。指纹识别技术除了在传统的法律公安上得到应用之外,还有更广阔的应用前景,如计算器用户的确认、访问网络资源的口令、银行 ATM 机和信用卡的使用、各类智能 IC 卡的双重确认,以及雇员证明、海关身份鉴定、家用电子门锁等一个完整的自动指纹识别系统(AFIS )包括指纹采集、指纹图像预处理、指纹特征提取和比对等几个模块。在自动指纹识别系统中,指纹图像的预处理是正确进行特征提取、比对等操作的基础,而二值化是指纹图像预处理中必不可少的一步。