1、基于背景差分法的物体识别OBJECT RECOGNITION BY BACKGROUND DIFFERENCE METHOD专 业: 自动化摘 要图像识别技术在很多领域都是产业现代化的基础,所以在当今社会它成为了研究的热门学科。由于被测物体会由于时间的不同,背景的不同,气候的不同,被测物体会表现出不同的外形特征,具有错综复杂和瞬间转变的性质 1 ,所以图像识别的准确率一直是一个难以解决的课题。而基于背景差分的图像识别技术则能很好地解决这一困难的问题,它是整个图像识别领域中最基础并且可靠性最高的一门科学 2 。这种方法以将背景图片与实时图像作差分的方法有效提高普通图像识别方法的准确度 3 ,也可
2、以对运动物体做出准确性较高的识别,并且具有较快的处理速度,能在 OpenCV1.0 的帮助下完成目标。目前,基于背景差分的图像识别主要应用于车辆流量检测技术 4 、车牌检测 5 、弱信号的目标检测、稻米粒优劣的判断、运动人体检测等领域。本文使用 USB 外接摄像头从外界获得背景与被测视频流,在 Windows 系统下利用 Visual Studio C+6.0 与 OpenCV 1.0 结合编程的方法 6 ,对背景与被测视频流做差分,从而达到物体识别的目的。由于使用的摄像头分辨率较低,所以测量的结果精确度并不是很高,测量物体也较为简单,如何利用高分辨率的摄像头以及高版本OpenCV 函数来识别
3、更复杂的被测物体是今后的研究目标。关键词: 背景差分; 图像识别; Opencv;Visual Studio C+6.0 ABSTRACTImage Recognition has been one of the most popular deciplines because that its the key of Industrial modernization in numerous fields. The measured objects will be in difference shape for the difference of seasons; background and t
4、emperature.They are complex and variable, thus, its really a tough work to increase the accuracy of Image Recognition. Image recognition technology based on background subtraction, a subject that is very reliable and accurate in the Image Recognition field, solves that problem well.This method impro
5、ves the accuracy effectively by differencing the video stream to a background picture, it also can identificat the moving subject effectively, it can progress a subject in high speed by the using of the opencv 1.0. At present, Image Recognition is often utilized in the field such as vehicle traffic
6、detection technology,target detection of weak signals, judge the merits of rice and Human Movement detection,there we get backgroud and video stream from the outside world by USB external camera, programme with opencv 1.0 by visual studio C+6.0 in the operating system of Windows.Then we identificate
7、 a subject by differencing backgroud and video stream.The acurracy of Image Recognition is below the ideal situation because of the resolution of USB external camera.Also the subject is very simple.Its our future research goals that using USB external camera with a high resolution and a high version
8、 of the opencv function to identificate more complex objects.Key words: Background difference;Image Recognition;opencv;visual studio C+6.0目 录摘 要 .IABSTRACT.II目 录 .III第一章 前言 .1第一节 计算机领域的物体识别的发展历史 .1第二节 计算机图像获取技术现状及前途 .2第三节 计算机图像识别技术现状及前途 .4第四节 色彩标准分类 .5第二章 差分法应用 .6第一节 数学中的差分法 .6第二节 背景差分法和帧间差分法 .6第三章
9、Opencv 的介绍与使用 .8第一节 opencv 简介 .8第二节 有关图像识别的 opencv 函数 .9第四章 利用 C+实现图像获取与识别 .13第一节 C+的发展阶段 .13第二节 C+的特点 .14第三节 基于背景差分法的物体识别的程序 .14第四节 程序运行结果 .22第五章 结论 .27参考文献 .28致 谢 .301第一章 前言本章主要介绍了与论文相关的计算机的发展历程和计算机图像识别和背景差分的发展现状,并列举了一系列的研究成果,论述了本实验的实验目的以及工作条件。第一节 计算机领域的物体识别的发展历史图像识别,又称计算机图像识别,指通过计算机摄录或存储等途径获得的图片进
10、行处理,分析最终对其进行识别理解的过程。在工业生产自动化的当代社会,仅仅通过人类对物体进行感官判断来辨别产品或者其他事物显然已经不能满足快节奏运转的世界,在这种大背景下,计算机图像识别技术诞生了,它通过摄像头从外界获取视频形式的数据,再将其变成图片形式数据,和已经输入的或者即时更新的数据作比较,以此来判断目标物体是否符合要求,这一工作模式十分类似于人脑和眼的协调工作模式,因此计算机图像识别这一技术在很多行业迅速得到应用,利用摄像头工作的计算机,甚至机器人等高科技产品不断产生,在一些高危险性,环境恶劣,可活动体积小等不适合人类行动或需长时间工作的特殊环境下发挥了重要作用,大大的降低了特殊职业人群
11、的工作环境和生存率,也加快了行业发展速度。在这一社会大环境下,越来越多的企业以及个人都着手研发计算机图像识别这一门科学,计算机 1946 年被发明至今这不到 100 年时间里,计算机图像识别技术已经获得了很大的进步。工业自动化以来,每个工厂每天都要出厂数以万计的产品,由自动化流水线制造的产品虽然次品率已经极大降低,但还是存在,用人眼来判断正品次品虽然可行,但是需要耗费大量人力物力,不但降低了生产效率,还为企业浪费大量资金,在企业的需要下,产生了基于图像识别的次品监测装置,该装置只需要少量操作人员,而且操作简单,一般工人经过培训即可使用,既加快了工作效率,也节约了资金,迅速在工业生产、制造业广泛
12、应用。洪水、地震、火灾乃至核事故造成的辐射等等恶劣环境下往往是人类所不能长期停留甚至不能生存的,一旦遇到这些事故,救援工作往往十分难以展开,救援人员经常束手无策,坐视一个个生命远去。为了改变现状,科学家研制出一种救灾机器人,它能在这些环境下以人操作,和自主探测方式进行救灾活动,提高了救援速度,也提高了救援人员的生还率,立即成为世界机器人研究界的研究热点。在当今社会反恐环境日益严峻的情况下,相应的武器装备的改变也在悄然发生,二战以来的大威力,大杀伤2力进程火炮逐渐失去了原来的地位,取而代之的是火力适当,附带伤害小的精确战术武器电视制导导弹,图像制导导弹,这种武器快速精确,能够有效打击武装分子并把
13、平民伤害降到最低,符合当今世界人道主义的主题,逐渐受到各国的青睐。人脸识别是现今最热门的研究方向之一,在磁卡解锁的锁闭方式安全性以及稳定性不能得到保证的情况下,愈来愈多的对安全性要求过高的机构采取了人脸识别或虹膜识别模式,虽然价格昂贵,仪器体积庞大,具有科研能力的单位较少,但这种方式具有可靠性高,使用方便等优势。迄今为止,图像识别领域已经取得了极大的进步,但随着科技的发展,它随时都有可能获得更大的进步。第二节 计算机图像获取技术现状及前途自 1973 年面世以来,摄像机一直是人类记录动态物体的唯一方法,在计算机上应用的图像获取装置也只有摄像头,所以摄像头的发展极大地影响了图像获取技术的发展。4
14、0 多年前美国安培公司推出世界第一台可以投入实际使用的摄像机。这种摄像机采用摄像管作为摄像元件,因此寿命低,性能不稳定而且价格高昂等缺陷限制了摄像机的普及,一直到摄像机的下一次革命,这种高贵的产品一直只能用于特定领域,无法民用化。1976 年,摄像机技术迎来了一次革命性的飞跃。JVC 公司推出第一台家用摄像机,使用的是 VHS 格式(Video Home System,家用摄像系统) ,VHS 采用12.65 毫米盒带,极大地降低了摄像机价格,简便了其操作,使其在推出之后广受大众喜爱,迅速在民用市场上普及,将摄像这一技术带入人们观念。在市场的推动下,VHS 很快暴露出了其弱点清晰度低,仅仅有
15、250 线的清晰度广为使用者诟病,为弥补这一不足,JVC 公司很快研制出一种 SVHS 摄影机,这种摄像机可以拍摄高达 400 线的视频,满足了大众需求。然而 VHS 与 SVHS 庞大的体积却让它在流通的时候遇到了巨大的阻力,因此,1982 年,VHS-C 和 S-VHS-C 两个型号的摄像机应运而生。这两种摄像机的机能与前两种相差无几,均使用同样宽度的磁带,可以通过适配器连接到录像机上观看,但 92mm X 69mm X 23mm 的轻便体积让其在对前者的竞争中占尽优势,称为社会主流,摄像机也由这股风潮进入我国。VHS-C 和 S-VHS-C 的成功并没有终结摄像机轻便小体积化的脚步,反而
16、加速了其进程,继 JVC 公司之后,索尼(SONY) ,夏普(Sharp) ,佳能(Canon )也推出了自己的小型摄像机8mm 摄像机,通称 V8。这种摄像机采用 8mm 磁带,体积的缩小给摄像3机带来的负面效果就是拍摄清晰度降低为 270 线,而且这种摄像机拍摄的磁带不能再用 VHS 录像机播放,只能用摄像机播放。V8 面世不久,索尼公司又独自推出了一款家用摄像机 Hi8,同样使用8mm 磁带的 Hi8 结构更加精密,摄像清晰度达 400 线,将家用摄像机性能推至又一高水平。随着时代发展,VHS、S VHS、VHS-C、S-VHS-C、V8 和 Hi8 都不能满足用户需求,于是,DV 应运
17、而生。DV,全称 digital video camrecoder(数码摄像机) ,以小体积的 Mini DV 为存储介质,分辨率可达 500 线远高于前面任何一种摄像机的清晰度的低于 400的清晰度。DV 拥有超高频宽的亮度和色彩度,是普通摄像机的六倍,纯正的色彩士气基本达到专业级水平,它基本可以无限翻录不损失画质,使用 ieee 1394 数码输出端子,使数据传输简单可靠,基本无损。以上的优势让 DV 在出现不久就迅速占据市场。2003 年,索尼,夏普,佳能,JVC 公司联合推出了 HDV 格式,目的是为了开发一种能录制具有更高清晰度和高质量的家用便携摄像机。这种摄像机的诞生使得电视的清晰
18、度第一次超越了胶片拍摄的电影。达到 720 线逐行扫描或1080 线隔行扫描的清晰度。由于 DV 格式的深入人心和 HDV 刚刚出现不久, 2005 年前,数码摄像机的主要存储介质还基本都是 Mini DV,它的记录时间一般为 60 分钟,部分摄像机具有 LP 功能,可以将记录时间延长到 90 分钟,而不损失画质, 由于其高画质小体积,令其在专业摄影界也拥有了一席之地,如松下的 DVCPRO 和索尼的 DVCAM 等都是著名的专业摄影机,他们为了满足专业人士需要,将录像时间长度调整为 180 分钟,依然采用 Mini DV 作为主要存储介质。表 2.1 HDV 和 DV 的比较HDV(1080
19、i) HDV(720i) DV存储介质 DV 磁带720/25p 720/50p(PAL)视频信号1080/60i 及1080/50i 720/30p 720/60p(NTSC)720576 (PAL)像素 14001080 1280/720720480(NTSC)宽高比 16:9 4:3(16:9)压缩(视频) MPEG-2 视频(框架和级别,MPH-14)DV4亮度抽样频率 55.6875 MHz 74.25 MHz 13.5MHz抽样格式 4:2:0 4:2:0(PAL )4:1:1(NTSC)量化值 8 比特压缩后比特率(视频) 25 Mbps 19 Mbps 25 Mbps压缩(音频
20、) MPEG-1 音频层 II抽样频率 48 kHz 48kHz/44.1kHz(2 声道模式)32kHz( 4 声道模式)量化值 16 比特 16 比特(2 声道模式)/12比特 非线性(4 声道模式)压缩后比特率(音频) 384kbps 1.5Mbps音频模式 立体声(2 声道) 立体声(2 声道)/立体声2(4 声道)数据格式 MPEG-2 系统 -流类型 打包基本流 传输流 -流接口 IEEE1394(MPEG-2-TS) IEEE1394(DV)随着时代的发展,各国又推出了高清这一模式,使清晰度达到 16:9 比例下的 1280*720,1920*1080。当然每个公司都有着自己的特
21、有清晰度,使得市场上的视频产品规格不一,不过随着产业升级,各个不同的规格一定会统一成更好的规格。第三节 计算机图像识别技术现状及前途计算机图像识别这门学科在当今人工智能领域中已经占据了相当大的空间,为了能更加精确的模拟人类智能,图像识别必不可少,为此人们提出多种图像识别模型,如模板匹配模型。模板匹配模型,又叫模板,是一种对比识别的识别模式,即,计算机如果想识别一个图像,负责识别的存储空间内必须有与其相对应的模板,如果有,则可识别,没有,则无法识别。例如,电脑要识别 B这个字母,就要首先在脑内寻找与 B 这个图形大小、方位和形状都匹配的的模板,如果找到了,就可以完成识别,确认这个字母是 B。这种
22、方法非常简单,但是这只是一种十分理想化的识别方法,现实世界中的,物体的物力外形虽然不会经常变化,但随着视角,光线5和外力的影响,物体的视觉外形是经常变化的,把所有的可能性全部做成模板显然过于复杂,不能实际应用。而且单单从字母识别这个问题上看,如果模板里的字母 B 是印刷体,而被测物体是手写体,也会造成识别不成功,所以模板法并不可行。格式塔心理学在模板法识别图像这一研究上也提出了具有格式塔心理学特征的原型匹配模型。这种模型强调人类识别某个物体并不是基于长时间大量记忆某个物体的全部形态,而是通过相似性来识别,这种相似性是从记忆的模板中提取出来,用以衡量当时视线里看到的物体的一种原型,当看到一个图像
23、时,搜索脑内,寻找拥有相似特性的模板,如果有相似的模板在,那么成功识别,否则无法识别,计算机不认识这个物体。它也很好的说明了人类对不规则物体的识别。但是这种模板有一个缺憾,就是没有说明人类如何获得这种相似性,没有编程依据,也就无法在计算机上实现。随即,又有新的模型,这种模型更加复杂,它就是“泛魔”识别模型。 “泛魔”识别模型图像识别系统,基于特征分析,1959 年由 B.塞尔弗里吉提出,这种识别模型第一次把特征觉察原理应用与图像识别。 “泛魔”识别模型把图像识别分为多个不同的层次,每个层次各司其职,各自进行不同的特征识别机制,一步一步识别,最终把每部分的结果合成起来,作为最终识别。每一种特征识
24、别层被它的发明者塞尔弗里吉戏称为“小魔鬼“ ,许多这样的层合在一起,形成了所谓的“ 泛魔”识别模型。 “泛魔”识别模型解决了相似图像识别、失真图像识别、比例放缩图像识别等难题。它可以进行学习,而且是每一层的“认知鬼”进行单独学习,这让“泛魔”识别模型具有很强的灵活性,可以随着使用者的需要进行升级。如字母识别,每个认知鬼可以逐渐学会一个字母的某一方面特征,如大小、形状,颜色等等,很多很多认知鬼合起来就可以进行一次完整的识别。现在“泛魔”识别模型已经被用于人的识别工作。第四节 色彩标准分类RGB 色彩模式是工业界的一种颜色标准,通过红绿蓝这三种基础颜色的不同比例搭配几乎可以获得自然界中所有颜色,而且非常符合人类对颜色的感知。RGB 即是代表红( Red) 、绿(Green) 、蓝(Blue)三个通道的颜色,因为这个标准几乎包括了人类视力所能感知的所有颜色,而且简单易懂,所以是目前运用最广的颜色系统之一,而且衍生出各种子标准,如RGB1、RGB4、RGB8、RGB555,广泛已用于各个领域。CIE L*a*b*:由于同时使用过多无法被统一的色彩标准,导致了诸多生产设计上的不便,所以国际标准色彩协会(International Color Consortium)于1931 年专门制订了一套国际通用的