1、如何学习机器视觉在与大家交流的过程中,发现了一个问题,一直想说出来。可是通常实话都不会那么顺耳,所以总有些犹豫。可后再一想,既然大家来此的目的不过是为了讨论问题、互通有无,那么说了也应无妨。 这个问题就是:我发现国内 80%搞这行(机器视觉) 的朋友所走的路子是错的。7 u2 g$ F1 D1 f) p R这个感觉是从论坛上大家所问的问题得出来的。因为。在论坛中看到不少朋友所问的问题,是相当可笑的。说可笑并非指所提问题过于简单幼稚,而是所问的问题一看就是从书本上抄来的,而不是在实际情况下所遇到的。换句话说,论坛中的朋友大多只是在纸上谈兵,极少有人真正自已动手开发视觉系统。这样说是因为自己搞开发
2、的人绝对问不出某些奇怪问题来的。往深了说一点,好象国内的朋友们只喜欢啃书本,并不愿意(也可能是懒得) 动手。 8 _; t! j3 - d7 1 Q) 现在就回到本文的题目上来:到底如何学习机器视觉?为了说明这个问题,我觉得应该先要简单地说明另一个问题:国内外机器视觉发展的不同。我本人认为,只有先搞清了两边的不一样,才便于说清如何下手学习。 国外机器视觉发展到今天,已经从 “一包到底” 式的工作程序,发展到了细致分工的阶段了。由于篇幅问题。就不细讲这一行当如何从“一包到底”发展到细致分工过程。! U8 H( 2 K T8 L + h7 l * S1 * M一句话,国外机器视觉发展到今天,已经可
3、以清清楚楚分为三个部分: 1,底层开发部分。2,二次开发部分。 3,最终使用部分。于是在国外,从事这一行业的人现在也就可以简单而清楚地分成三种人: 1,底层开发的人(从事底层开发工作的人)。 2,二次开发的人(从事二次开工作的人)。 3,使用及操作机器视觉系统的人 (从事最终使用工作的人)。 第一类人。就是我们常说的,开发通用视觉系统(如:DVT,西门子,欧姆龙,EVISION,COGNEX 等等)的开发人员,也就是 DVT,COGNEX 这些公司开发部的技术职工。 第二类。就是大家所说的 OEM 用户。是专门用第一类人所开发出的系统,给第三类人搞二次开发,开发各种专为第三类人所用的系统。 第
4、三类人,就是用户(end user)。这类人是真正将机器视觉系统应用到各个领域中的人,他们不仅在各自的行业中使用种种已经开发成型的机器视觉系统。而且负责对各类系统进行测试及评估。 q+ + B5 T9 W- R5 _举个实际例子,这里有不少朋友问过这类问题:如何检测某一工件;检测光盘表面的系统该如何配置 CCD 相机、镜头及灯源等。问这些问题的朋友应该算是第三类人。他们公司要他们寻找一个系统可以用来检测本公司的产品。但由于第一类人所开发的,只是通用的系统以及视觉系统开发工具的软件包。并没有哪家公司专门开发一套系统来检测光盘或是某种特定的工件。所以,这些朋友就应该来找我,因为我是第二类人。9 l
5、: Y3 X; E, B0 Q3 C我的工作就是,专门用 DVT,EVISION ,COGNEX 等的视觉卡,以及视觉系统开发工具软件包为他们专门开发一套他们所需要的光盘检测系统或是工件检测系统。 但是,我在这里所看到奇怪的现象却是,这些第三类的朋友一直问的,都是第二类人所问的问题。如:问应该用哪家公司的开发软件;用什么样的 CCD;如何标定等等。我真的不知道如何回答你:你明明是第三类人,要找第二类人帮忙。现在却以第二类人的身份甚至是以第一类人的身份问问题。 绕了老大一圈,其实要说的问题就是一个 -我所发现的问题:这里 80%以上朋友把自己的身分混淆了,越俎代庖。$ A o1 m. v p“
6、d或许有的朋友会这样说:我虽然是第三类人,但我对机器视觉有兴趣,想自己学习啊!。这就是我想讨论的:到底如何学习机器视觉? 我个人认为,应该先确定自己的身份,从自己具体的需要入手来学习。举个例子:大家一定都有学习英文的经验,而且也一定都有同样的感觉-怎么学也学不好- 我就是这样。我们抛开所谓的语言天分不说,大家学不好的原因其实很简单:没有语言环境。一语中的啊!学而不用,怎么也不会学好。 ( W/ d- R 7 O- Q! N; v0 f$ d, n b; K“ S* G5 R2 L同样,学习机器视觉,无论你在书本上看了多少理论,你自己若没有实际动手操作、编程的经验也是枉然。还不如从你每天能接触得
7、到的东西开始学习。教游泳的教材随手可得,但为什么并非人人都下得了水呢?! 不客气的说,目前国内搞这行的朋友似乎都有些好高骛远。不少从事第二部分工作朋友(搞二次开发的第二类人) 对于机器视觉有关知识的了解,尚不如国外第三类人的知识水平(我是从大家所问的问题感觉到的) 。而国内第三类朋友知识水平就更可想而知。( # h9 I# a T. P+ n+ w9 D( t U6 K可是奇怪的是,每个人所问的却都是第二类人要问的,有些甚至是一类人才会问的问题。好象,机器视觉是个十分简单的技术,凭大家随便问几个“关键性”的问题,再由所谓的“专家”三言两语的回答一下。大家就一夜之间都可以自己搞底层开发,成第一类
8、人了。 , F) F, B4 F f% D4 O要成为第一类人,又分硬件及软件两种。要对自己所负责的这个模块非常了解,搞软件要知道算法及运行速度;搞硬件要明白公司所选用芯片的特点等等。同时还要清楚对手公司的优缺点以及机器视觉这一行的种种动态和最新技术。 想成为第二类人,你一定要是个通才。就是说什么都要知道一点。不仅要了解第三类人的要求,而且也要知道各种第一类人(不同品牌的视觉卡及软件包) 的水平。 要成为第三类人,不仅要有机器视觉基本的相关知识。而且,要对自己所工作的行业及领域的机器视觉系统非常熟悉。专作你这行的机器视觉公司有哪几家?各有什么优缺点等等。总结一下。这三种人相比,第一类人一定要专
9、业,对机器视觉的某一领域非常非常了解;第二类人虽比不上第一类人那么专业,但更加全面;第三类人更熟悉各个应用系统开发公司(第二类人) 的优缺点。( E. l0 c5 X; m4 j0 Z! H: U6 U/ U“ l$ F: a“ H* q现在大家可以看得出,机器视觉发展到今天,其分工已经越来越细,每个部分的工作其实是很难相互取代的。大家不要以为第三类人就比第一类人低一等,这是一个错误的等级概念。我本人过去曾属于第一类人,现在作的是第二类工作。而我的几个“师弟师妹”( 当初曾一起作第一类人时的同事)现在就在干第三类工作。大家别小看第三类工作,以为这是小儿科,你能真作好这一行也不是很容易。毕竟这也
10、是一门行当也是一个饭碗!另外,以我个人来看:以国内现在机器视觉的水平,对于那些想作第一类人的朋友我在这里劝一句:还是算了吧。6 ?. , k; 7 U3 x3 国内的机器视觉水平打根子上就差,您还打算搞底层?算法本身都是抄人家的,就只能和对手拼程序的写法了。不过我觉得那更没戏。 这样说我绝没有看不起初学者的意思。我说过:所问的问题再简单,我都不会笑话你。对于每样事物我们都是从无知开始的。但是,对于那些极不实际的好高骛远的问题,我还是要说,希望大家踏实下来,戒浮躁,从最基本地学起-先确定自己的身份。 以上所讲,是从工程(engineering)以及实际应用的角度来谈如何学习机器视觉。如果是想作学
11、问,写论文的博士、硕士们就不太适合了。且全是本人一家之言,实话实说,言语间若有得罪各位之处,请原谅。再推荐一个廉价的学习方案1,PC+WindowXP 英文操作系统(USB Camera Driver 需要英文版 );2,LabVIEW 评估版,参加 NI 的研讨会可以得到,网上下载或直接电话 NI 要;“ o; B b0 _5 r: 9 u 3 o, H3,NI Vision Module 评估版,参加 NI Vision 研讨会可以得到,或直接电话 NI 要;/ ?) l# g m, I# . c9 h4,USB Camera Driver,http:/ 1. 分辨率(Resolution
12、):摄像机每次采集图像的像素点数(Pixels) ,对于数字摄像机一般是直接与光电传感器的像元数对应的,对于模拟摄像机则是取决于视频制式,PAL 制为 768*576,NTSC 制为 640*480。2. 像素深度( Pixel Depth):即每像素数据的位数,一般常用的是 8Bit,对于数字摄像机一般还会有 10Bit、12Bit 等。3. 最大帧率(Frame Rate)/ 行频(Line Rate):摄像机采集传输图像的速率,对于面阵摄像机一般为每秒采集的帧数(Frames/Sec.) ,对于线阵摄像机为每秒采集的行数(Hz ) 。4. 曝光方式(Exposure)和快门速度(Shut
13、ter ):对于线阵摄像机都是逐行曝光的方式,可以选择固定行频和外触发同步的采集方式,曝光时间可以与行周期一致,也可以设定一个固定的时间;面阵摄像机有帧曝光、场曝光和滚动行曝光等几种常见方式,数字摄像机一般都提供外触发采图的功能。快门速度一般可到 10 微秒,高速摄像机还可以更快。5 f: U9 L, x1 M0 8 P5. 像元尺寸(Pixel Size):像元大小和像元数(分辨率)共同决定了摄像机靶面的大小。目前数字摄像机像元尺寸一般为 3m-10m,一般像元尺寸越小,制造难度越大,图像质量也越不容易提高。6. 光谱响应特性(Spectral Range):是指该像元传感器对不同光波的敏感
14、特性,一般响应范围是 350nm1000nm,一些摄像机在靶面前加了一个滤镜,滤除红外光线,如果系统需要对红外感光时可去掉该滤镜。给图像处理和机器视觉的一些建议和一些基本知识给图像处理和机器视觉的一些建议和一些基本知识最近发生的事情特别多,遇到的问题特别多,接触很多图像处理和机器视觉的初学者,发现很多人很茫然,在不同的领域来回徘徊,和他们交流和沟通,感觉他们好像懂得很多,但交流深入起来,发现他们连基本的概念和视觉的总体框架都没有搞明白,鉴于此我写了如下的文字,希望和同行们一起交流,共同从基础学起,一起交流。我正在申请一个图像处理和机器视觉的研究所,一旦申请成功,到是我会在研究所的网页上,专门开
15、设一个免费的网络讲座,有我和我邀请一起机器视觉领域的人一起,来帮助刚刚接触这个领域的人快速的进入。0 C8 I# W6 S J$ Z先说两个基本的概念,1:什么是数字图像?我想很多人就会发笑,这个谁不知道,我估计就有人不知道,以前我朋友的老板交给一个任务,做基于视觉的欧元识别,用在欧元验钞机上,他一下晕啦,不知道如何下手,按说他做图像处理的编程挺不错的,这次为什么不知道如何下手呢?原因在于以前他所做的图像都是有直觉形象的,比如图片、相片、图案、文字图样以及从通过采集卡采集到的视频图像等等,而他这次所接触的图像是一个“特殊”的图像:无直觉形象而只有信号的波形,我们都知道欧元和人民币一样在中间有一
16、条比较明的磁条,此磁条上含有该钱币“身份”的信息,如人民币,用逻辑分析仪看一下,可以看到等宽度的规则的方形波,欧元的波形是宽度变化的方形波。基于视觉的验钞机是通过一个滚动的轴性图像传感器来获得欧元上的图像信息,对这样的图像信息的处理让我朋友无所适从,其根本原因是他对什么是图像都没有搞清楚。$ V“ Q% p3 S- O8 d那到底什么是图像呢?你知道吗?从信息论的角度来看, “图像”所包含的信息量最大,内容机器广泛,概括来说可以分为两个类型:有直觉形象的信号和无直觉形象而只有数据或者信号的波形的信号。别把图像太特殊化,其实图像只是一种信号而已,对图像的处理就是对信号的处理,只是对不同的信号采取
17、不同的信号处理方式而已。2:不要简单的看几本机器视觉的书,做两个机器视觉的小项目,就认为你懂得机器视觉啦,机器视觉的研究内容非常广泛,她涉及计算机、图像处理、模式识别、人工智能、信号处理、光学、机械等多个领域。用简单的一句话来概括就是用机器代替人眼来作各种测量和判断。所以学习机器视觉或者图像处理,要从两个看似相互矛盾的角度着手,一方面要对所涉及的学科进行概念性的学习,基本原理性的学习,另一方面一定要为自己选定一个相对确定的目标深入学习和研究。而所有的前提必须学好数学。说完两个基本概念,我简单说一下,一个完整的机器视觉系统的一些主要的工作过程:! _ V8 m6 ) W, . 1:首先通过工件检
18、测器检测物体是否接近或运动到摄像机视野的中心,如果是,向图像采集卡发送触发脉冲信号;; 9 e# o“ z- 4 K2:图像采集卡按照设计人员预先设定的程序和延时,分别向摄像机或照明设备发出启动脉冲,但也有摄像机和照明设备在系统初始化话时,就开始启动。3:摄像机停止目前的扫描,重新开始新的一帧扫描;有的时候需要摄像机在启动脉冲来到之前一直处于等待状态,启动脉冲到来后启动以帧扫描;4:如果所采用的策略是曝光策略,那么在摄像机开始新的一帧扫描之前,要打开曝光结构,其曝光时间要根据你的实际需要通过程序或者硬件设定好;8 a7 Z) S+ T K1 c. O5 E5:如果采用曝光策略的话,要用另一个启
19、动脉冲打开照明设备,特别要保持启动时间应该与摄像机曝光时间匹配;+ f% 1 g3 f9 q; $ I, Q6:摄像机曝光后,正式开始一帧图像的扫描和输出;7:如果摄像机输出的是模拟信号,图像采集卡就把从摄像机接受过来的信号进行 A/D 转化将其数字化,如果输出的是数字信号,这样就省图像采集卡的事情拉; s$ R$ o8 n7 m4 W0 1 o- g0 V8:图像采集卡将图像信号送到缓冲器、处理器或者计算机的内存中,以便图像的处理和显示;5 Z- 8 f4 S6 o/ B9:处理器或者计算机对图像进行处理、分析、识别以得到测量结果或逻辑控制量,然后根据这些结果进行处理以控制别的装置(比如机械
20、装置等)来完成相关动作,进行定位。纠正运动的误差等等,比如修正机器手臂的位置。+ p9 J6 5 q“ C+ y4 K4 D. x: s总而言之,机器视觉系统是一个比较复杂的系统,涉及很多学科,很多领域的知识,是一个系统工程,所以如果你决定成为机器视觉的一员,一定要博学和专攻,博学是为了形成大致的框架和系统的思想,专攻是为了你的深入,学习任何一门学科和技能,要沉下心来,好好把基础打好,不要心浮气躁,浅浅而学。看似你知道很多,其实什么都不懂,机器视觉是个很有前途的领域,只有你用心去做,踏踏实实,一步一步自信地习和实践,我相信你能得到意想不到的收获。机器视觉常用词和专业化词汇词汇表旨在使读者避免对
21、常用词和专业化词汇产生混淆。下述定义同数字图像处理的一般用法一致,但绝不是本领域的标准化定义。它们和已出版的图像处理和计算机技术书籍中对有关词汇的定义是大体一致的。 Algebraic operation 代数运算 一种图像处理运算,包括两幅图像对应像素的和、差、积、商。 Aliasing 走样(混叠) 当图像象素间距和图像细节相比太大时产生的一种人工痕迹。 Arc 弧 (l)图的一部分(2)表示一段相连曲线的像素集合。 / V6 T- K4 O( T6 |Binary image 二值图像 只有两级灰度的数字图像(通常为 0 和 1,黑和白) 。 Blur 模糊 由于散焦、低通滤波、摄像机运
22、动等引起的图像清晰度的下降。 Border 边框 一幅图像的首、未行或列。 , Q w5 l( d- i9 U3 uBoundary chain code 边界链码 定义一个物体边界的方向序列。 “ X2 t“ Z, _* c, EBoundary pixel 边界像素 至少和一个背景象素相邻接的内部像素(比较:外部像素、内部像素) 。 2 X1 v# S5 h2 R; r % S“ d* mBoundary tracking 边界跟踪 一种图像分割技术,通过沿弧从一个像素顺序探索到下一个像素的方法将弧检测出来。 Brightness 亮度 和图像一个点相关的值,表示从该点的物体发射或反射的光
23、的量。 4 N / P7 G9 h7 3 w- H# i* L0 d“ tChange detection 变化检测 通过相减等操作将两幅匹准图像的像素加以比较从而检测出其中物体差别的技术。 Class 类 见模或类。 Closed curve 封闭曲线 一条首尾接于一点的曲线。 “ I8 Q/ u- d5 4 _6 Y a5 O2 vCluster 聚类,集群 在空间(如在特征空间)中位置接近的点的集合。 ) H“ e1 z, u9 n9 K; S- ICluster analysis 聚类分析 在空间中对聚类的检测、度量和描述。 9 T5 z( ( + h5 A“ SConcave 凹的
24、如果说某个物体是“凹的” 是指至少存在两个物体内部的点,其连线不能完全包含在物体内部(反义词为凸的) 。 T; U+ j- R“ F7 v/ Connected 连通的。 - J% # Y“ b- s. v9 M6 FContour encoding 轮廓编码 对具有均匀灰度的区域,只将其边界进行编码的一种图像压缩技术。 # J8 N/ o+ M Z/ . hContrast 对比度 物体平均亮度(或灰度)与其周围背景的差别程度。 Contrast stretch 对比度扩展 一种线性的灰度变换。 Convex 凸的 指连接物体内部任意两点的直线均落在物体内部。 Convolution 卷积
25、一种将两个函数组合生成第三个函数的运算,卷积刻画了线性移不变系统的运算。 ; ?4 C# Z8 N) HConvolution kernel 卷积核 (1)用于数字图像卷积滤波的二维数字阵列;(2)与图像或信号卷积的函数。 Curve 曲线 (1)空间的一条连续路径;(2)表示一路径的像素集合(见弧、封闭曲线) 。; $ 6 v+ R2 U, i; J$ eDeblurring 去模糊 (1)一种降低图像模糊,锐化图像细节的运算;(2)消除或降低图像的模糊,通常是图像复原或重构的一个步骤。 Decision rule 决策规则 在模式识别中,用以将图像中物体赋以一定量的规则或算法,这种赋值是以
26、对物体特征度量为基础的。 , u- - s% t0 X5 T“ 3 lDigital image 数字图像 (l)表示景物图象的整数阵列;(2)一个二维或更高维的采样并量化的函数,它由相同维数的连续图像产生;(3)在矩形(或其他)网格上采样一连续函数,并在采样点上将值量化后的阵列。 ) ?5 ?! D: s- j ODigital image processing 数字图像处理 对图像的数字化处理;由计算机对图片信息进行操作。 Digitization 数字化 将景物图像转化为数字形式的过程。 ( | V l. + X7 u, Q r) M. : mEdge 边缘 (l)在图像中灰度出现突变的
27、区域;( 2)属于一段弧上的像素集,在其另一边的像素与其有明显的灰度差别。 ; : R6 o: y% K: x ?+ + VEdge detection 边缘检测 通过检查邻域,将边缘像素标识出的一种图像分割技术。 Edge enhancement 边缘增强 通过将边缘两边像素的对比度扩大来锐化图像边缘的一种图像处理技术。 Edge image 边缘图像 在边缘图像中每个像素要么标注为边缘,要么为非边缘。 Edge linking 边缘连接 在边缘图像中将边缘象素连成边缘的一种图像处理技术。 Edge operator 边缘算子 将图像中边线像素标记出来的一种邻域算子。 Edge pixel
28、边缘像素 处于边缘上的像素。 Enhance 增强 增加对比度或主观可视程度。 Exterior pixel 外像素 在二值图像中,处于物体之外的像素(相对于内像素) 。 : C; e( a$ A, ; z! a( r9 CFalse negative 负误识 在两类模式识别中,将属于物体标注为不属于物体的误分类。 ( C “ |: Q _/ z2 P# ?0 N- d% OFalse positive 正误识 在两类模式识别中,将不属于物体标注为属于物体的误分类。 ) i8 B- o2 y2 h2 o5 m) ?% FFeature 特征 物体的一种特性,它可以度量。有助于物体的分类,如:大
29、小、纹理、形状。Feature extraction 特征检测 模式识别过程中的一个步骤,在该步骤中计算物体的有关度量。Feature Selection 特征选择 在模式识别系统开发过程中的一个步骤。旨在研究质量或观测能否用于将物体赋以一定类别。 : S! P( |- U2 ; Feature space 特征空间 参见度量空间。 2 x: B4 d3 s; T“ F7 l5 I4 x JFourier transform 傅里叶变换 采用复指数作为核函数的一种线性变换。 6 A2 Y5 u g4 E. s; k: F. |( w* w- t* s, tGeometric correctio
30、n 几何校正 采用几何变换消除几何畸变的一种图像复原技术。 ; K“ x) K3 y: r$ B2 J+ % wGray level 灰度级 (1)和数字图像的像素相关连的值,它表示由该像素的原始景物点的亮度;(2)在某像素位置对图像的局部性质的数字化度量。 7 R+ V/ Z, x. y8 E0 pGray scale 灰度 在数字图像中所有可能灰度级的集合。 # 9 j; t“ y: x“ _Gray-scale transformation 灰度变换 在点运算中的一种函数,它建立了输入灰度和对应输出灰度的关系。Hankel transform Hankel 变换。 F1 E4 I* g1
31、 j5 mHarmonic signal 谐波信号 由余弦实部和相同频率的正弦虚部组合的复数信号。 ! J* z% K7 e7 Q+ a, _Hermite function Hermite 函数 具有偶实部和奇虚部的复值函数。 High-pass filtering 高通滤波 图像增强(通常是卷积)运算,相对于低频部分它对高频部分进行了提升。 Hole 洞 在二值图像中,由物体内点完全包围的连通的背景点。 6 z0 r% g; N“ NImage 图像 对物理景物或其他图像的统一表示称为图像。 , k2 o/ T: Q4 l, N; U g! ?: K; V0 ?Image Compress
32、ion 图像压缩 消除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。 . c) e2 H$ o6 W! P# d$ PImage cording 图像编码 将图像变换成另一个可恢复的形式(如压缩) 。 x8 b5 a7 R- L. fImage enhancement 图像增强 旨在提高图像视觉外观的任一处理。 7 % I) 2 _7 6 u) E1 Image matching 图像匹配 为决定两副图像相似程度对它们进行量化比较的过程。 $ |( b$ V“ H: Q5 L5 w1 D0 J, p7 u6 Q7 T6 B: , c+ 1 cImage-processin
33、g operation 图像处理运算 将输入图像变换为输出图像的一系列步骤。 3 D: D) D6 b% f- T7 GImage reconstruction 图像重构 从非图像形式构造或恢复图像的过程。 2 $ R0 C; p; O“ tImage registration 图像配准 通过将景物中的一幅图像与相同景物的另一幅图像进行几何运算,以使其中物体对准的过程。 / 0 F3 C% _/ S n T/ P4 x7 N S5 Z- K( F( uImage restoration 图像恢复 通过逆图像退化的过程将图像恢复为原始状态的过程。 Image segmentation 图像分割
34、(1)在图像中检测并勾画出感兴趣物体的处理;(2)将图像分为不相连的区域。通常这些区域对应于物体以及物体所处的背景。 7 R3 K5 I8 c T6 L9 MInterior pixel 内象素 在一幅二值图像中,处于物体内部的像素(相对于边界像素、外像素)。 4 P0 F T$ U# q8 e( H0 1 k( / K7 P“ Y |8 X9 lInterpolation 插值 确定采样点之间采样函数的过程称为插值。Kernel 核 见卷积核。 q4 s5 H9 ) |“ e: v: V$ y1 w+ r. E/ k( N V- KLine detection 线检测 通过检查邻域将直线像素
35、标识出来的一种图像分割技术。 Line pixel 直线像素 处于一条近似于直线的弧上的像素。 . A1 M* b“ g+ P4 L% w; P/ _! e* L4 K: Local operation 局部运算 基于输入象素的一个邻域的像素灰度决定该像素输出灰度的图像处理运算,同邻域运算(对比:点运算) 。 + s, v* l; q3 JLocal property 局部特征 在图像中随位置变化的感兴趣的特性(如:光学图像的亮度或颜色;非光学图像高度、温度、密度等) 。 7 b+ u! $ i0 k8 S6 v3 q V- “ E P* O% mLossness image compress
36、ion 无损图像压缩 可以允许完全重构原图像的任何图像压缩技术。. ?* 0 ! R! F5 V6 - oLossy image compression 有损图像压缩 由于包含近似,不能精确重构原图像的任何图像压缩技术。 + k2 5 % x+ I* iMatched filtering 匹配滤波 采用匹配滤波器检测图像中特定物体的存在及其位量。 Measurement space 度量空间 在模式识别中,包含所有可能度量向量的 n 维向量空间。 w9 q; u9 x- F i+ z5 5 H: Y“ a uMisclassification 误分类 在模式识别中,将物体误为别类的分类。 Mu
37、lti-spectral image 多光谱图像 同一景物的一组图像,每一个是由电磁谱的不同波段辐射产生的。 Neighborhood 邻域 在给定像素附近的一像素集合。 + L6 C“ x K4 A8 f4 “ - x: wD9 j# P y8 H5 f/ ( ZNeighborhood operation 邻域运算 见局部运算(对比:点运算) 。 $ ) ( r E % 2 Q5 j. P% c+ KNoise 噪声 一幅图像中阻碍感兴趣数据的识别和解释的不相关部分。 Noise reduction 噪声抑制 降低一幅图像中噪声的任何处理。 4 u: s# i; a# PObject 目标
38、,物体 在模式识别中,处于一二值图像中的相连象素的集合,通常对应于该图像所表示景物中的一个物体。 ) |. q; 0 . X3 p1 d K j. c1 Pattern class 模式类 可预先赋予一个物体的相互不包容的任一个类。 / ! u0 J, ! p1 OPattern classification 模式分类 将物体赋予模式类的过程。 ) s1 Q! * l! U8 t0 YPattern recognition 模式识别 自动或半自动地检测、度量、分类图像中的物体。 ; B. Y, j2 2 K, U0 W( uPel 像素 图像元素(picture element)的缩写。 9
39、w+ X; u! j% Y) - “ x; b2 C5 N+ A7 L+ w6 |/ TPerimeter 周长 围绕一物体的边界的周边距离。 V* u6 u! p- B lPicture element 图像元素,像素 数字图像的最小单位。一幅数字图像的基本组成单元。 Pixel 像素 图像元素(picture element)的缩写。 G* D5 % U9 ?3 P% 6 6 l2 “ _7 z! I T; D% sPoint operation 点运算 只根据对应像素的输入灰度值决定该像素输出灰度值的图像处理运算(对比:邻域运算) 。 N C; 6 E* w/ l7 5 N2 M9 U6
40、 c7 N+ S: m1 y2 d- P5 k AQuantitative image analysis 定量图像分析 从一幅数字图像中抽取定量数据的过程。 Quantization 量化 在每个象素处,将图像的局部特性赋予一个灰度集合中的元素的过程。# S9 K2 N- * T- u; X8 . a: o8 V“ z( ( w( 数字图象处理技术词汇表Algebraic operation 代数运算 一种图像处理运算,包括两幅图像对应像素的和、差、积、商。 * W9 I, F% q- b! b; h4 D8 K- B; d- Q) p. ! w“ b M3 mAliasing 走样(混叠)
41、当图像像素间距和图像细节相比太大时产生的一种人工痕迹。 , ( G; W- V/ , I: R6 LArc 弧 图的一部分;表示一曲线一段的相连的像素集合。 3 d7 X l4 m8 ?+ d4 S( M: R+ X* Z$ r! n3 * K D2 V8 K1 l) T“ k$ p* S* ( kBinary image 二值图像 只有两级灰度的数字图像(通常为 0 和 1,黑和白) $ _( d+ I. 8 d* wBlur 模糊 由于散焦、低通滤波、摄像机运动等引起的图像清晰度的下降。 Border 边框 一副图像的首、末行或列。 , 7 z6 D“ L! M0 m# J5 J5 D%
42、n6 |; o9 g: 3 C8 y4 BBoundary chain code 边界链码 定义一个物体边界的方向序列。 . r n$ _$ u! yBoundary pixel 边界像素 至少和一个背景像素相邻接的内部像素(比较:外部像素、内部像素) 0 i5 u5 A/ c - F 6 J! h$ w/ w% t( _$ U6 h, _ |, . F; zBoundary tracking 边界跟踪 一种图像分割技术,通过沿弧从一个像素顺序探索到下一个像素将弧检测出。 + H8 g/ L _* U4 i! 9 N9 S. W8 S( W5 bBrightness 亮度 和图像一个点相关的值
43、,表示从该点的物体发射或放射的光的量。 V5 ?/ h# s# Q% . “ a( g! Change detection 变化检测 通过相减等操作将两幅匹准图像的像素加以比较从而检测出其中物体差别的技术。 Class 类 见模或类 Closed curve 封闭曲线 一条首尾点处于同一位置的曲线。 ) s) c! M( G, # hCluster 聚类、集群 在空间(如在特征空间)中位置接近的点的集合。 Cluster analysis 聚类分析 在空间中对聚类的检测,度量和描述。 / g$ R“ l1 x/ 2 X- R8 FConcave 凹的 物体是凹的是指至少存在两个物体内部的点,其
44、连线不能完全包含在物体内部(反义词为凸) * V: | N% o( g U% T- j5 J/ YConnected 连通的 Contour encoding 轮廓编码 对具有均匀灰度的区域,只将其边界进行编码的一种图像压缩技术。 $ V5 y) X; d* * c9 Z5 a n: W# E“ d) e/ nContrast 对比度 物体平均亮度(或灰度)与其周围背景的差别程度 # K6 C$ W) t3 k0 ?* L. a“ Contrast stretch 对比度扩展 一种线性的灰度变换 5 f4 d“ N9 t U* C- X2 s# X3 B! Q- ?3 r5 a3 K# ICo
45、nvex 凸的 物体是凸的是指连接物体内部任意两点的直线均落在物体内部。 , d. l- n0 g4 h$ Z6 pConvolution 卷积 一种将两个函数组合成第三个函数的运算,卷积刻画了线性移不变系统的运算。 1 S ( a! x2 ( r C V( a H1 zCorrvolution kernel 卷积核 1,用于数字图像卷积滤波的二维数字阵列,2,与图像或信号卷积的函数。 $ N1 K; E“ l5 5 s0 3 XCurve 曲线 1,空间的一条连续路径 ,2 表示一路径的像素集合(见弧、封闭曲线) 。 5 W o4 _1 H/ k- n+ q) xDeblurring 去模糊
46、 1 一种降低图像模糊,锐化图像细节的运算。 2 消除或降低图像的模糊,通常是图像复原或重构的一个步骤。 Decision rule 决策规则 在模式识别中,用以将图像中物体赋以一定量的规则或算法,这种赋值是以对物体特征度量为基础的。 1 C. P+ ?% W2 s: n3 A- r+ T rDigital image 数字图像 1 表示景物图像的整数阵列 , 2 一个二维或更高维的采样并量化的函数,它由相同维数的连续图像产生,3 在矩形(或其他)网络上采样一连续函数,并才采样点上将值量化后的阵列。 . I0 v4 J! - k% X( FDigital image processing 数字
47、图像处理 对图像的数字化处理;由计算机对图片信息进行操作。 $ c- I V$ p: m/ E3 _ r. O2 C7 K/ 8 HDigitization 数字化 将景物图像转化为数字形式的过程。 ) G9 w0 U# d7 GEdge 边缘 1 在图像中灰度出现突变的区域,2 属于一段弧上的像素集,在其另一边的像素与其有明显的灰度差别。 ( q+ |+ P+ I* pEdge detection 边缘检测 通过检查邻域,将边缘像素标识出的一种图像分割技术。 . A: C# s W3 x- z“ u$ jEdge enhancement 边缘增强 通过将边缘两边像素的对比扩大来锐化图像边缘的
48、一种图像处理技术。 3 8 A( w0 q3 o ZEdge image 边缘图像 在边缘图像中每个像素要么标注为边缘,要么为非边缘。 2 y, $ b; c$ I0 k+ I q* B% # XEdge linking 边缘连接 在边缘图像中将边缘像素连成边缘的一种图像处理技术。 . Z+ c* ( J% b; t Edge operator 边缘算子 将图像中边缘像素标记出来的一种邻域算子。 Edge pixel 边缘像素 处于边缘上的像素 $ u3 C _+ b O: P |False negative 负误识 在两类模式识别中,将属于物体标注为不属于物体的误分类 False positive 正误识 在两类模式识别中,将不属于物体标注为属于物体的误分类。 “ Z. N/ S8 / u6 1 R S; d I. SFeature extraction 特征检测 模式识别过程中的一个步骤,在该步骤中计算物体的有关度量。 n$ H N8 l1 Y/ i2 f6 X) I3 O/ l9 uFeature selection 特征选择 在模式识别系统开发过程中的一个步骤。旨在研究质量或观测能否用于将物体赋以一定类别。