分享
分享赚钱 收藏 举报 版权申诉 / 78

类型人体行为识别方法的研究.doc

  • 上传人:weiwoduzun
  • 文档编号:2316779
  • 上传时间:2018-09-10
  • 格式:DOC
  • 页数:78
  • 大小:1.31MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    人体行为识别方法的研究.doc
    资源描述:

    1、北京工业大学硕士学位论文人体行为识别方法的研究姓名:乔晓梅申请学位级别:硕士专业:计算机应用技术指导教师:苏开娜20050501摘要人体行为识别指对人体运动的模式进行分析和识别,是计算机视觉领域被广泛关注的研究热点。人体行为识别是人体运动分析的重要组成部分,属于高级视觉分析。它在智能监控、高级人机交互、视频会议、医 疗诊断及基于内容的图像存储与检索等方面具有广泛的应用前景和潜在的经济价值。在人体行为识别中, 为了描述人体运动的模式,采用运动历史图像的方法进行运动的表示。本文中的运动历史图像是从人体行为图像序列中提取出来的,是一种时空模型,既能表明行为发生的区域,又能表示行为是如何发生的,其中每

    2、个像素值都是运动历史的函数。基于矩描述的信息冗余性,本文提出了基于矩的人体行为识别方法。利用图 像的重建过程来确定分类时用到的矩的最高阶次。为了充分反映特征图像的局部信息,提出了基于矩的人体行为识别方法。根据特征的类间距离和类内距离来衡量特征的分类识别能力,选取最优的矩组。经规范化 处理后,提取的矩特征对尺度、位移和旋 转具有不变性。 实验中,对不同的人体行为进行了测试,应用矩和矩特征的分类精度高于用规则矩和矩作为特征的方法,从而证明了基于矩和矩的人体行为识别方法的有效性。为了能有效地处理运动遮挡问题,本文提出了基于运动光流特征的人体行为识别方法。采用基于图像的方法描述人体运动的模式。根据规范

    3、化特征图像中灰度的层次分布特点,搜索实际运动区域,从中提取出基于梯度的运动特征。在特征提取中加入多分辨率思想形成了分等级的特征提取方法。最后利用极坐标的运动方向直方图进行分类的匹配。对具有遮挡的人体行为序列进行了实验,都能得到有效的识别结果。本文介绍的两类人体行为识别方法,一种是全局的特征提取,一种是局部的运动分析,都能有效地应用到合适的运动分析场合。关键词:人体行为识别、运动历史图像、矩、矩、运 动光流北京工业大学学硕士学位论文,曲,锄,廿),:,独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人

    4、已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名关于论文使用授权的说明期:生堕:兰:三本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:二茸垡牡导师签名:耋睡日期:垒坐第章绪论第章绪论课题研究的目的和意义人类在推动社会进步的过程中,面临着自身能力、能量的局限性,因而发明和创造了许多机器来辅助

    5、或代替人类完成任务。智能机器人是最理想的形式,它能模拟人类的功能,能感知外部世界并有效地解决人需要解决的问题。因此,赋予智能机器人以人类视觉功能对发展智能机器人是极其重要的,是人类科学研究中所面临的最大挑战之一。如何让计算机自动甚至是主动地识别与判断外界信息已经成了当今计算机科学研究的重要课题,这样计算机就能主动地给人类提供各种有用的信息和服务。有数据表明,人类约 的信息来自于视觉,这些信息也构成了人类感知和理解周围环境的基础。计算机视觉正是通过电子感知和理解图像来模拟人类的视觉功能,是研究用计算机来模拟生物宏观视觉功能的科学和技术。其中人体运动分析已经成为当今计算机视觉科学的一个很活跃领域。

    6、人体行为识别指对人体运动的模式进行分析和识别,是人体运动分析的重要组成部分,属于高级视觉分析。人体运 动分析是近年来 计算机视觉领域中备受关注的前沿方向,属于图像分析和理解的范畴。人体运动的视觉分析主要是针对包含人的运动图像序列进行分析处理,它通常涉及到运动检测、目标分类、人的跟踪及行为理解与描述几个过程,其一般性处理框架如图卜所示。图卜人体运动 分析的一般 处理框架其中,运动检测 、目 标分 类、人的跟踪属于 视觉中的低级( 疗)和中级处理部分(),而行为理解和描述则属于高级处理(西)。当然,它们之间也可能存在交叉(比如跟踪过程中运动检测的使用)。从技术角度而言,人体运动分析的研究内容相当丰

    7、富,主要涉及到北京二业大学工学硕士学位论文模式识别、图 像处理、 计 算机视觉、人工智能等学科知 识;同时, 动态场景中运动的快速分割、人体的非刚性运动、人体自遮 挡和目标之间互遮挡的处理等也为人的运动分析研究带来了一定的挑战。人体行为识别的研究具有广泛的应用前景,下面针对一些主要应用领域,对其典型应用做出介绍。()智能监控()动态场景视觉监控是计算机视觉领域一个新兴的应用方向。视觉监控区别于传统意义上的监控系统在于其智能性,它不仅用摄像机代替人眼,而且用计算机代替人、协助人,来完成监视或控制任务,从而减 轻人的负担。智能 监控系统需求主要来自那些对安全要求敏感的场合,如银行、商店、停车场、

    8、军事基地等【 】。目前监控摄像机在商业应用中已经普遍存在,但并没有充分发挥其实时主动的监督作用,因为它们通常是将摄像机的输出结果记录下来,当异常情况(如停车场中的车辆被盗)发生后,保安人员才通过记录的结果观察发生的事实,但往往为时已晚。而我 们需要的监控系统应该是实时地监视,并自动分析摄像机捕捉的图像数据,当盗窃发生或发现到具有异常行为的可疑人时,系统能向保卫人员准确及时地发出警报,从而避免犯罪的发生,同 时也减少大量人力、物力和财力的投入。另外,人的运动分析在自 动售货机、机、交通管理、公共场所行人的拥挤状态分析及商店中消费者流量统计等监控方面也有着相应的应用。这项技术由于具有广泛的应用前景

    9、而受到重视。特别是“”事件后,人们反恐意识的不断提高,更使智能视觉监控显得益迫切,世界各国纷纷将其列入重要研究计划。()感知接口():在高级用户接口应用领域中,我们希望未来的机器能像人一样与我们更加容易和便捷地交流,如行为驱动控制等。人与人之间的信息交流主要是依靠语言,并适当结合肢体行为和面部表情等,因此视觉信息可以作为语音和自然语言理解的有效补充来完成更加智能的人机交互。这就要求未来的计算机必须具备感知外部环境的能力,即代替传统的键盘或鼠标输入模式,独立地提取周围环境的重要第章绪论信息(如检测到人的存在等);更进一步的能力是进行人的识别和行为理解,结合面部表情、肢体语言等纠的分析来与人进行相

    10、应的交流。对于机场等高噪声的场合,基于视觉 的高级用户接口能够提供比语音识别更加准确的信息输入。()运动分析():在体育运动、舞蹈等 训练中,通常我 们关注于人体某部分的关节运动,这就需要进行人体运动分析,建立人体的几何模型、解释人体的运动行为机制,从而对于提高运动性能有着积极的推动作用。目前的医学步态分析【】是一个旨在提供诊断和治疗支持的研究领域,它可以提供人体正常步态建模的线索,有助于开发生物反馈系统来分析病人的步态,判断其腿步受伤情况或者畸形程度,从而做出积极的整形补偿或有效的治疗:另外,人的行为识别也可以应用于从大量的体育活动数据库中进行基于内容的快速搜索等。()虚拟现实():目前许多

    11、电脑游戏中人的形体、运动和行为交互的设计逼真性实际得益于物理空间中人的运动分析,包括人体模型和关节运动机制的获取及行为的恢复等;基于互联网络的交互式空问的开发刚刚起步,如虚拟聊天室,它在通过文本交流的同时可以通过二维图标来导航用户,如果增加人体行为、面部表情等线索,将会给参与者们提供更加丰富的交互形式;另外,人的运动分析在视频会议、人物动画、虚拟工作室等其它虚拟现实场合也有着相当广泛的应用。鉴于人体行为识别在智能监控、感知接口、运 动分析及虚拟现实等方面具有广泛的应用前景和潜在的经济价值,所以开展这方面的研究有着重大意义。国内外研究状况及分析人体行为识别在智能监控、高级人机交互、 视频会议、医

    12、疗诊断及基于内容的图像存储与检索等方面具有广泛的应用前景和潜在的经济价值,从而激发了世界上广大科研工作者及相关商家的浓厚兴趣,尤其在美国、英国等国家已经开展了大量相关项目的研究“。例如,美国国防高级研究项目署设立了以卡内基梅隆大学为首、麻省理工学院等高校参与的视觉监控重大项目(北京工业大学工学硕士学位论文),主要研究用于战场及普通民用场景进行监控的自动视频理解技术:英国的雷丁大学已开展了对车辆和行人的跟踪及其交互作用识别的相关研究;与等公司也正逐步将基于视觉的手势识别接口应用于商业领域中。人体行为识别可以简单地被认为是时变数据的分类问题,即将测试序列与预先标定的代表典型行为的参考序列进行匹配。

    13、因此它的关键问题是:如何从学习样本中获取参考行为序列;学习和匹配的行为序列必须能够处理在相似的运动模式类别中空间和时间尺度上轻微的特征变化。到目前为止,匹配 时变数据的技术已经很多,主要有下面几种:()动态时间规整()具有概念 简单、算法 鲁棒的优点,早期被广泛地 应用于语音识别中,并且最近才被用于匹配人的运动模式;对而言,既使测试序列模式与参考序列模式的时间尺度不能完全一致,只要时间次序约束存在,它仍能较好地完成测试序列和参考序列之间的模式匹配。()隐马尔可夫模型()纠 是更加成熟的匹配 时变数据的技术,它是随机状态机器。的使用涉及到训练和分类两个阶段,训练阶段包括指定一个隐马尔克夫模型的隐

    14、藏状态数,并且 优化相应的状态转换和输出概率以便于产生的输出符号与在特定的运动类别之内所观察到的图像特征相匹配。对于每一个运动类别,一个是必须的。匹配 阶段涉及到一个特定的可能产生相应于所观察图象特征的测试符号序列的概率计算。在学习能力和处理未分割的连续数据流方面比有更好的优越性,当前被广泛地应用于人的运动模式匹配中,。()神经网络()神经网络同样也是目前比较感兴趣的匹配时变数据的方法,如等用其分析人的运动模式。时延神经网络()也是一种分析时变数据的有趣的方法。因为当有效数据集越大时,在神经网络上的时第章绪论间信息就被强调得更充分。已 经被成功的运用于手势的识别和人说话时的嘴唇的形状的识别上了

    15、。()句法技术()机器视觉中的句法识别方法已被广泛运用到序列图像中上下相关的静态图片的模式识别中。最近, 语法识别的方法经常用于视觉行为识别。基本思想是把识别问题分为两层:底层通过标准的独立的瞬时事件概率检测方法,提供底层瞬时特征的候选检测部分。检测的输出作为随机上下文无关语法分析程序的输入流。语法和语 法的分析器提供了更大范围的时间限制,消除不确定的底层检测,在某些给定的情况下允许包含关于瞬时事件结构的先验知识。()非决定论有限自动机()是一种简单的方法,且具有即时性和完全不确定性,和把用作为一种序列分析器,提出了一种新颖的通过事件判断的多目标识别的方法。人体行为识别系统正如上文所述,人体行

    16、为识别有着诸多重要和实际的应用。因此,对于该问题科学家们作了不少有益的工作。然而到目前为止,还没有任何一套系统可以真正鲁棒地从视频序列中得到或恢复人体的运动信息和三维结构。究其原因主要有:人体运动是一个复杂的运动系统,人体的运动具有很大的自由度和高度的非线性特点;人体是非刚体,而且结构复杂,在运动中存在着严重的遮挡现象;人体的外表由于穿着服装,因此其外观表现出极大的差异,很难用统一的模型加以表达。正是由于上述问题的存在,目前 对于人体运动分析的研究工作,都是从各种不同的角度着手,采取各类不同的约束与前提条件来简化研究工作。人体行为识别方法,也往往随着应用领域的不同变化而不同,存在着多种分类的方

    17、法。根据采用摄像机的数目可分为基于单目的方法和基于多目的方法。单目方法指的是采用一台摄像机获取图像,只对从某一角度的视频序列进行分析。而多目指的是采取多台摄像机,对从多角度获得的视频序列进行处理。单目方法,应用北京业大学工学硕士学位论文范围比较普遍,但信息量不足;多目方法,可较好地获得深度信息,但其往往需要在实验室条件下进行,与单目相比增加了许多限制条件。另一类分类标准是是否准备从视频序列中提取人体的三维运动信息并从中恢复人体三维结构。诸如在视频监控领域中,所关注的一般是人的整体行为与位置,因此不需要人体各个肢体部分的详尽信息,一般只需二维图像信息即可。而在类似角色动画中, 获取人在三维空间的

    18、精确位置是应用成功的关键,因此一般采取在实验室环境中,使用昂贵的运动捕捉系统,主要研究三维运动恢复。根据人体不同的运动形式分类。人体运动的形式多种多样,要提出一个一般的技术分析框架来容纳所有的人体运动,达到普遍的适应性,从目前而言很难现实。而不同的运动,往往有不同的运动模式,可以从中 总结获得不同的运动模型,而这些运动模型往往可以在特殊的人体运动研究中作为先验知识,起到关键性的指导工作。而且,就某种具体的应用目标而言,其所涵盖的人体运动形式往往有限,因此这类 方式有其实际意义。根据是否采用形状模型,可分为特征对应的方法和基于模型的方法。基于特征的方法一般通过基于位置、形状、 纹理等相关的特征进

    19、行特征匹配;而基于模型的方法主要是模型数据与图像之间的匹配工作。在计算复杂度上,基干特征的方法利用较低层次的视觉特征,计算简单,速度一般较快;而基于模型的方法利用较高层次的模型,需要在匹配和搜索上花费大量时间,计算代价较高。下面介绍几种典型的人体行为识别方法:()模板匹配方法(丑)基本思想:首先将图像序列转换为一组静态形状模式,然后在识别过程中和预先存储的行为标本相比较。”埘】等人的方法明是一种基于运动的低级特征的方法。所谓低级特征就是直接针对像素进行处理,称之为具体地,利用二 维网格的特征进行人的运动识别,首先计算连续帧间的光流场,并将每个光流帧在空间栅格上沿和方向分解,每个单元格的幅度被累

    20、加,从而形成一高 维特征向量用于识别;为了归一化运动的持续时间,他们假设人的运动是周期性的,并将整个序列分解为该行为的许多循环过程;采用最近邻算法进行行为识别。等人【 】采用运动能量图像()和运动历史图第章绪论像()来解释图像序列中人的运 动。序列中的运动图像首先经差分运算并二值化:而后这些包含运动区域的二值化运动图像随着时间累加形成;最后增强为,中每个像素的值与该位置的持续运动时间成比例。每个行为由其图像序列的和所组成,从中提取出基于矩的行为特征用于识别阶段的模式匹配。模板匹配技术的优点:是计算复杂度低、实现简单,然而它对于噪声和运动时间间隔的变化是敏感的。()状态空间方法()基本思想:定义

    21、每个静态姿势作为一个状态,这些状态之间通过某种概率联系起来。任何运动序列可以看作为这些静态姿势的不同状态之间的一次遍历过程,在这些遍 历期间计算联合概率,其最大 值被选择作为分类行为的标准。目前,状态空 间模型已经被广泛地应用于时间序列的预测、估计和检测,最有代表性的是隐马尔可夫模型()。图描述了的基本结构。每个状态中可用于识别的特征包括点、线或二维小区域。,但【句仁瞠)马】仁岬,幛抛驷坶砷,岛,图卜的基本结构北京业 大学学硕十学位论文例如等利用二维小区域块的运动、彩色、纹理等特征进行人的行为识别:人的运动区域块的网格特征被用作学习和识别的低级特征;学习是利用为每个类别产生符号模式;模型参数的

    22、优化是利用算法 实现的;识别是以给定序列图像下前向计算()的结果而确定。状态空间方法的优缺点:虽然能克服模板匹配的缺点,但通常涉及到复杂的迭代。()基于模型的方法(基于模型的方法需要建立或的人体模型。一般将三维人体看作由关节点连接的刚体的集合,如上肢是由肘关节连接的上下臂两个刚体,上臂与躯干是由肩关节连接的等等, 这样用三维的人体骨架来描述人体运动。通常需要模型的重建来进行识别。基于模型方法的优缺点:对计算量和设备的要求都高,因而准确性好,能很好的处理遮挡问题。在实际的应用场合下,必须要根据实际情况,具体情况具体分析,合理选择方法。一般情况下,人体行为识别系统的大体结构如图卜所示。图卜人体行为

    23、识别 的基本 过程的第章绪论本文主要研究内容本文对人体行为识别方法进行了一定的研究,实现了基于不同方法的人体行为识别系统。利用 计算机进行系统实现,并比 较各类方法进行性能评估。系统的主要功能是对于输入的包含人体行为的图像序列,进行运动检测与分割得到人体行为的二值化图像序列,图像序列的规范化(针对不同的方法可省略),由图像序列生成特征图像,基于不同方法对特征图像进行特征提取,设计分类器,进行识别。此系统的实现,使用了图像处理、模式识别和计算机视觉的技术,它能对类一般的人体行为(例如坐、蹲、跳、四肢运动等)进行识别。对输入的包含人体行为的图像序列,能够准确的识别图像序列中的人的行为是否是标准行为

    24、库中的行为或是库中的哪一种行为。考虑到人体运动的特殊复杂性,做如下前提假设:静态背景;单一固定摄像头;无主要遮挡。系统结构图如图卜所示。至口、测试人体行为序列、一识别蕾训练厂而丽。矿、!型堂!、,图人体行为识别系统结构在人体行为识别方法的设计中,为了更完备地描述行为序列,提高识别的准确率,主要就以下几个方面展开工作:行为特征的空 间信息和 时间信息相结合。生成的特征图像既能表明行为发生的区域,又能表示行为是如何发生的, 这样就不需要进行明显的时间分析和北京丁二业大学工学顾十学位论文各个序列帧间的匹配了。在行为特征的矩描述上,针对矩和规则矩表示的冗余性,提出了利用矩用于行为描述的方法,并提出了一

    25、种利用图像的重建过程来确定分类时用到的矩的最高阶次的方法。为了能更好地描述行为的局部运动特征,引入小波分析的理论,利用小波矩不变量来描述行为特征。在特征选择中,根据特征的类间距离和类内距离来衡量特征的分类识别能力,选取最优的小波矩组。为了能处 理小范围的遮 挡问题,采用提取局部运动光流的方法,引入梯度算子来计算运动的方向和速率,并采用极坐标直方图的方法进行匹配。其中,为了弥补特征图像中损失的时间信息,更好地描述运动的速率,采用金字塔图像的方法进行不同等级的梯度计算。模板匹配的方法对视 角很敏感,解决方案主要有:对系统性能加以限制,只能处理给定的某一视角的行为:针对每种行为建立多个视角下的表示,

    26、使用统计的模型既能识别行为的视角,又能识别行为。分类器设计 方面,每种分类器都有不同的复杂度,但并不是说,越复杂的分类器就有越好的分类效果。分类器的复杂度与问题是如何描述的有密切关系。由于实验 中样本有限,我们采用最近邻分类器进行识别。目前用于行为识别的方法通常在计算代价和行为识别的准确度之间进行折中,故仍需用寻找和开发新的技术以利于在提高行为识别准确度的同时,又能有效地降低计算的复杂度。本文分为五章:第章:绪论, 对人体行 为识别的研究背景以及 发展状况进行简要的介绍;第章:阐述了矩技术在模式识别中的应用;第章:详细介绍基于矩特征的人体行为识别方法;第章:详细介绍基于运动光流特征的人体行为识

    27、别方法;第章:实验结果与分析;最后结论部分是对本文研究工作的总结及今后工作的展望。第章娟技术在模式识别中的应用第章矩技术在模式识别中的应用利用矩不变量进行图像识别是模式识别中的一种重要的方法。矩在统计学中用于表征随机量的分布,在力学中用于表示物质的空间分布。若把二值图像或灰度图像看作是二维密度分布函数,就可以把矩技术应用于图像分析中。这样,矩就可以用于描述一幅图像的特征,并提取为与统计学和力学相似的特征。近年来,由二维和三维图像所求取的矩值的不变特性己引起的图像界人士的重视。矩技术类型很多,现已被应用于图像分类与识别处理的许多方面。】在年首先提出了矩不 变量的概念。谰 变换的不变性推导出一种构

    28、造任意阶矩不变量的方法,并指出矩就是它的一个特例。建议利用正交多 项式构造正交矩来克服矩不变量包含大量冗余信息的缺点,矩不变量就是一种正交矩不变量。,等人指出正交矩在信息冗余度、图像表达以及在识别效果方面比其它类型的矩要好。以上提到的矩特征都是在整个图像空间中计算的,得到的是图像的全局特征,且能反映目标的不变性特征。和【】提出的利用小波变换来构造的目标旋转不变性的特征小波矩,不仅可以得到图像的全局特征,也可以得到图像的局部特征,因而在识别相似形状的物体时有更高的识别率。规则矩规则矩的定义 :概率密度分布函数为(,)的二维连续随机函数的()阶规则矩(也称几何矩)。的定义为:二二,)睇()二维(

    29、)数字化 图像(,)的二维矩的定义为:】。,(,)()阶次为,的 规则矩的完 备集包括所有满足 ”的条件的牌。,因而共有()丰()个元素。单项式乘积 。是这种矩定义的基底函数。北京工业大学工学硕上学位论文的唯一性定理()。:如果(,)是分段连续的,并且只有在(,)的平面的有限区域内具有非零值,那么所有 阶的矩都存在。由(,)可唯一确定矩集研。,反之,由矩集。)可唯一确定(,)。既然一幅图像具有有限的面积,并且在最坏的情况下也是分段连续的,那么所有阶的规则矩都存在,所求得的矩集可唯一描述该幅图像所描述的信息。要将一幅图中的信息全部表征出来需要无限多的矩值,对于实际应用来讲,需要选取矩值的一个子集

    30、,只要这个子集对于某个特定的应用包含表征该图像的足够有用信息就可以了。用无穷矩集。,矽,)表示(,)的公式如下:(,庐仁印,(训荟荟。等等出咖低阶规则矩的性 质:低阶规则矩值可表征一个分布或目标的基本几何性质,下面以二值连续分布函数(也就是目标的剪影图)的规则矩值为例来进行说明。零阶矩(,的零阶矩的定义为:。(,它表示给定分布函数或图像的总质量()。目标的剪影图的零阶矩表示该目标的总面积。一阶矩:质心两个一阶矩伽,川)用来确定目标的质心(),质心的坐标(;,了)给出了两条分别平行于轴和轴 的直线工;和歹的交点。质心坐标由下式计算:一一一一一,一一。如果目标的质心与坐标系的原点重合,即;和,那么

    31、由此求得的矩值称为中心矩(),由来表示:“。 (),()饰,), 办中心矩“。可由 规则矩。来表示,例如:“,“ , “一一;州“了一;一;一歹;。】“歹二阶矩:二阶矩。,:。又惯性矩,表征图像的大小和方向。事实上,如果仅考虑阶次为的矩集,则原始图像完全等同于一个具有确定的大小,方向,和离心率,以图像质心为中心且具有恒定辐射度的椭圆。假定坐标原点与图像质心重合,图像 椭圆如图所示。、。,硝,),弋,一眵?、。,一 ;图图像椭圆该图像椭圆的参数如下:长半轴:口(业出嚣坦监),北京工业大学工学硕士学位论文短半轴:(麴 堑二睦二型: 堡、!。椭圆倾角:()上“一“图像椭圆的辐射度在椭圆内为:一。翮;

    32、在椭童为零椭圆倾角矽的取值是不确定的,因此, 规定庐为半长轴与轴之间的夹角(拍)。椭圆倾角庐的取值由表 给出,该倾角值取值范围为于一。,。)内,该取值可确定主轴 所在直线的方向,但若要唯一确定图像内目标的方向,还存在。的模糊性。三阶中心矩可用于解决这个问题,根据实际应用硬性规定图像的三阶矩“,。的符号,就可以确定主轴的唯一方向。袁一二阶矩各取 值情况下的 椭圆倾角柏芦卜 一地,零零岑:叠零负零爱零卫:() “吾(妒。)佼(,)赫一毒(。砖负止()于螂(。妒。)扭韭()【一。妒叫。)三阶矩及三阶以上矩对于三阶或三阶以上矩,使用图像在工轴或轴上的投影比使用图像本身的描述更方便。三阶矩:投影扭眭()

    33、两个三阶中心矩。,描述了图像投影的扭曲程度。扭曲是一个经典统计量,用来衡量关于均值对称分布的偏差程度。 图像投影在,轴的扭曲系数为:第苹矩技术在模式识别中的垭用屯瓷“瀑扭曲系数的符号反映了图像对坐标轴的扭曲方向。表 给出了扭曲系数符号与图像扭曲的关系。三阶矩可以解决图像旋转。的主轴方向问题。这是根据该扭曲系数的符号来判定的。表扭曲系数与投影扭曲方向的关系轴投影轴投影豳:娃。扭曲方向扭曲方向轴左侧 轴下方对称于轴 对称于轴轴右侧 轴上方四阶矩:投影峰度()两个四阶中心矩“。,。描述了图像投影峰度。峰度是一个用来测量分布峰度的经典统计量。 图像在,轴的投影峰度系数为:哎鼍屯砖 薏一。当峰度系数为时

    34、,表示高斯分布;当峰度系数小于时,表示平坦的少峰分布;当峰度系数大于时,表示狭窄的多峰分布。矩变换图像经过基本的几何变换后,其矩表示也有相应的变化。这些变换在矩域中比在原始像素域中更容易实现。尺度变换()将图像(,)在轴上伸缩口倍,在轴方向上伸缩倍可得到新图,(,),由下式定义:厂(,)(口,)变换后的矩值。以(,)的原始矩值(川。)表示如下:二口”。当口时聊:一口 当口 时平移变换()将图像(,)在轴上平移口倍,在轴方向上平移倍可得到新图,),由下式定义:,(,)。(,)变换后的矩值之)与(,)的原始矩值。)的关系如下:二萎薹(多)(习一一。旋转变换()将图像(,)绕原点旋转角后得到的新图厂,力由下式定义:,(工,)(,一口臼)口)变换后的矩值川二(,)的原始矩值,。的关系如下:小名,笔(;(划”一一一,十一,反射变换

    展开阅读全文
    提示  道客多多所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:人体行为识别方法的研究.doc
    链接地址:https://www.docduoduo.com/p-2316779.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    道客多多用户QQ群:832276834  微博官方号:道客多多官方   知乎号:道客多多

    Copyright© 2025 道客多多 docduoduo.com 网站版权所有世界地图

    经营许可证编号:粤ICP备2021046453号    营业执照商标

    1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png



    收起
    展开