1、基于字典学习的远程监控方法 陈亦飞 成都市第七中学 摘 要: 现有的监控系统是由人员值守, 由于人眼长时间看屏幕会发困, 人也有发困的时候, 现有这种实时监控效果不佳。本论文的主要创新点在于将摄像头前端增加图像处理器, 通过机器学习算法, 识别监控范围是否有东西入侵或者发生大的变化, 从而将发生变化的图像发送到监控者手机或电脑终端, 提高监控效率。关键词: 实时监控; 图像处理; 机器学习; 本论文的主要创新点在于将摄像头前端增加了图像处理器, 通过利用机器学习算法, 来识别监控范围内是否有东西入侵或者发生较大变化。当识别到有东西入侵或者监控范围的环境发生变化后, 立即启动图片传输功能, 并通
2、过通信模块将这些信息传输到电脑上, 由电脑接入到云服务器。这些信息由云服务器处理之后, 通过通信模块触发值守人员的手机终端, 并且进行报警。与此同时, 将监控现场的图片传到手机上, 这样做可以有效地避免误警信号。另外, 通过监控摄像点编号的地理位置, 通知值勤人员及时前往事故地点进行相关处理工作。图 1 所示为系统基本架构。一、字典学习算法1.1 压缩感知压缩感知将信号的稀疏性 (或可压缩性) 作为前提, 提出可以先利用一个与变换矩阵无关的观测矩阵对原始信号进行降维操作, 然后通过求解一个优化问题就可以近乎完美地重构原始信号1。对于信号 x, 根据稀疏模型理论可知 x 可以表示为一组正交变换基
3、的稀疏线性组合 x=y。在压缩感知理论中, 首先利用一个与变换矩阵 无关的观测矩阵 对原始信号 x 进行降维处理, 得到降维后的观测值 s=x。将 x=y代入, 有 s=y。由于变换系数 y 的稀疏性, 那么解码问题转化为以下 l0稀疏编码问题:通过求解上述优化问题可以得到变换系数的一个估计, 然后根据 x=y 便可得到重建后的信号。1.2 字典学习在稀疏模型中, 信号被表达为某组基或字典的少量元素的线性组合。研究表明, 这个模型在诸如图像去噪, 人脸识别, 纹理分析等图像处理领域能够取得很好的性能。给定信号 x 和字典 D, 如果可以找到一个稀疏系数 使得xD, 那么称 x 为字典 D 上的
4、一个稀疏表达。实验数据表明, 在各种图像处理应用中, 学习字典能够取得比预定义字典更好的性能。为了求解基于稀疏表达的字典学习问题, 学者们提出了多种有效的算法。K-SVD正是这样一种算法。它是一种迭代算法, 在它的主循环中包括两个阶段, 稀疏编码阶段和字典更新阶段。在稀疏编码阶段, 利用正交匹配跟踪算法或是 LARS算法等求解稀疏系数。在字典更新阶段, 固定字典中的其他原子并利用 SVD 分解求解新的字典原子, 算法每次只更新一个原子和它对应稀疏系数中的非零项元素2。由于在图片分类实际应用中原始图片通常都很大, 因此在字典学习算法中对相互重叠的图片块而不是整个图片进行处理。给定图片 1, 假设
5、图片 1 中共有 M个相互重叠的图片块, 将这 M 个图片快拉成向量得到 M 个长度为 n 的向量y ii=1。那么学习一个有 k 个原子的字典 D, 同时使得在稀疏条件约束下 D能够适应于 M 个图片块向量 yi, 可以通过求解下述优化问题得到:图 1 基本架构 下载原图图 2 云处理架构 下载原图图 3 通信模块架构 下载原图上式中, A=A= 1, 1, 21, , (43) , , MM 是稀疏系数矩阵, i是图片 1 中第 i 个图片块向量 yi对应的稀疏系数, D i是 yi的一个近似表达。此外, 字典 D 是一个归一化矩阵, 即字典 D 中的每个原子 di的长度均为1。在实际应用
6、中, p 的取值常为 0 或 1。为解决字典学习问题, 学者提出了多种有效的算法。在这些算法中, K-SVD 算法被广泛应用于图片重构任务中3。K-SVD 算法首先将字典初始化为任意一个归一化矩阵, 通常离散余弦变换 (Discrete Cosine Transform, DCT) 矩阵或是归一化后的原始图片向量矩阵都是很好的选择。K-SVD 算法的主要循环中包括稀疏编码字典更新两个步骤。二、基于云计算的数字图像处理技术2.1 云计算的概念如图 2 所示为常见的云处理架构, 作为全新的网络服务方式, 云计算在处理方式上主要以网络为核心, 将网络作为媒介进行如计算、传递等服务, 其中的“云”主要
7、由计算机与服务器构成, 利用互联网提供网络服务4。因此, 对云计算的概念可理解为:它能通过互联网提供计算机基础设施、应用程序以及运作平台等计算机服务。而且云计算具有一定的特征即:其资源包括硬件范畴与软件范畴;资源能够实现动态配置与扩展;云计算提供的服务需根据不同的需求计费。2.2 图像处理云平台的搭建基于云计算的数字图像处理平台中设有图像处理操作系统以及相关的工具与软件、存储中心、用户登录终端等。平台整体功能结构中包括底层硬件系统层、操作系统资源层、平台管理层以及终端登录层5。底层硬件设备主要指网络交换设备与物理计算机。通常在搭建的过程中应以物理计算机性能进行分类, 根据其性能的高低进行虚拟化
8、计算机数量和虚拟机性能的创建, 通过局域网便可实现物理计算机之间的联网。在虚拟机操作系统安装完成后, 便可根据不同的图像处理要求进行相应软件与工具的安装, 在虚拟机系统管理软件的作用下实现虚拟化计算机的联网, 从而形成虚拟机集群系统。对虚拟机集群进行管理过程中应注意对系统资源以及虚拟机的系统状态进行掌握, 在受到云平台管理系统所传达的指令后, 进行相应的部署与启动和停止操作。在平台管理层方面, 主要有图像处理管理系统、资源管理系统、存储管理系统、安全管理系统以及复杂均衡管理系统。在资源管理系统中又包括虚拟操作系统向对应的物理计算机层、与机群资源管理系统对应的虚拟计算机集群层、虚拟机资源管理系统
9、的虚拟计算机层以及与云平台资源管理系统对应的云平台资源层, 有效地实现了计算机的联网、信息的传递以及对资源的管理。用户在计算机中可进行终端登录软件的安装并将用户密码输入, 当登录验证成功后, 便可对其进行使用, 用户用户也可根据自身不同的需要, 对平台中的计算机能力等方面进行适当的处理。2.3 通信模块图 3 所示为本论文中将监测信息传输到电脑上所用通信模块基本架构。所获信息由云服务器处理之后, 通过通信模块触发值守人员的手机终端, 并且进行报警。2.4 基于微信的报警处理方法本论文选择微信平台作为用户发送命令个查看数据的工具。微信平台有着很好的开放性, 通过这一平台, 个人和企业都可以打造属
10、于自己的微信公众帐号, 并且可以实现与个人或群体之间通过文字、图片、语音等方式沟通和互动。目前公众平台的主要功能包括消息群发、定向推送、一对一互动、多样化开发和智能回复等6。同时, 这些功能也为公众平台的实际运营带来了客户、媒体、营销、公共服务等发展方向。微信公众平台提供了服务号、订阅号、企业号三种账号类型的选择。我们选择使用订阅号, 因为订阅号主要向个人用户开放, 而且订阅号的使用几乎不产生任何费用, 对于节约开发和运营的成本有着很好的帮助。订阅号还支持开通开发者模式, 在开发者模式下, 公众平台的消息接口为开发者提供了与用户进行消息交互的能力。对于成功接入消息接口的公众帐号, 当用户发送命
11、令给公众帐号时, 微信公众平台服务器使用 HTTP 请求对接入的开发者服务器进行消息推送, 开发者服务器通过响应该请求, 处理接收到的命令, 生成新的返回结果, 从而达到回复消息的目的。开发者可以根据不同的应用场景的需求定制相应的应用, 实现数据智能化。2.5 多站点接入信号碰撞避免方法RFID 中的碰撞问题主要分为两类:一是阅读器碰撞问题, 它产生于同一个物理区域内存在多个不同的阅读器, 它们以同一频率同时与区域内的标签通信而引起的冲突。另一类是标签碰撞问题, 如过标签同事处于阅读器的有效工作区内时, 可能会发生多个标签同时发送信号的情况, 这时要求阅读器能在很短的时间内识别多个标签, 由于
12、阅读器和标签通信共享无线信道, 阅读器或标签的信号可能发生信道争用, 信号互相干扰等问题, 使阅读器不能正确识别标签7。2.5.1Aloha 算法纯 Aloha 算法是一种最简单最基本的防碰撞算法。Aloha 协议的思想很简单, 只要有数据发送过来了, 就让它发送过来。当然, 这样会产生冲突从而造成帧的破坏。但是, 由于广播信道具有反馈性, 因此发送方可以在发送数据的过程中进行冲突检测, 将接收到的数据与缓冲区的数据进行比较, 就可以知道数据帧是否遭到破坏, 如果检测到碰撞, 那么就等待一段随机长的时间后重发该帧8。时隙 Aloha 协议是一种能把信道利用率提高一倍的信道分配策略, 其原理是用
13、时钟来统一用户的数据发送。它将时间分为离散的时间片, 用户每次必须等到下一个时间片才能开始发送数据, 从而避免了用户发送数据的随意性, 减少了数据产生冲突的可能性, 提高了信道的利用率。时隙 Aloha 的信道利用率为纯 Aloha 协议的两倍, 其优点是可以将冲突减少一半, 但是, 它需要全网同步, 需要设置一个特殊站点, 由该站点发送时钟信号。而且当信道负载微小的增加时, 冲突会呈现指数增加, 降低信道性能。在时隙Aloha 算法中, 每个时隙存在无标签响应、唯一标签响应、和多标签响应三种情况。当电子标签的数据帧在某个时隙发生了碰撞, 该标签就会随机等待一段固定的时隙长度后, 再向阅读器发
14、起通信。帧时隙 Aloha 算法是在时隙 Aloha 算法的基础上, 在时间域上进一步离散的结果。帧时隙 Aloha 将 N 个时隙组合成一帧, 其中时隙长度固定, 一帧中所包含的时隙数也固定。在整个识别过程中不改变帧的大小, 每一帧的最大时隙数 N默认。帧中每个时隙都足够一个发送端向接收端发送完自身的 ID 信息。发送端随机选择 N 个时隙中的一个与接收端通信, 一旦发生碰撞则等到下一帧的时候再随机选择时隙重发。而不是随机延迟若干时隙后重发。这样每个发送端在每一个帧中只占用一个时隙进行通信, 在同一帧中, 同一个发送端不会重复发送数据。这样不仅避免了不完全碰撞造成的冲突, 而且简化了随机退避
15、时间的选择机制。该算法又被称为固定帧时隙 Aloha 算法。2.5.2CSMA/CDCSMA/CD (Carrier Sense Multiple Access with CollisionDetection) 即带冲突检测的载波监听多路访问技术 (载波监听多点接入/碰撞检测) 。在传统的共享以太网中, 所有的节点共享传输介质。如何保证传输介质有序、高效地为许多节点提供传输服务, 就是以太网的介质访问控制协议要解决的问题。当几个站同时在总线上发送数据时, 总线上的信号电压摆动值将会增大 (互相叠加) 。当一个站检测到的信号电压摆动值超过一定的门限值时, 就认为总线上至少有两个站同时在发送数据,
16、 表明产生了碰撞。所谓“碰撞”就是发生了冲突。因此“碰撞检测”也称为“冲突检测”9。CSMA/CD 是一种争用型的介质访问控制协议, 它起源于 ALOHA 网所采用的争用型协议, 并进行了改进, 使之具有比 ALOHA 协议更高的介质利用率。主要应用于现场总线 Ethernet 中10。另一个改进是, 对于每一个站而言, 一旦它检测到有冲突, 它就放弃它当前的传送任务。换句话说, 如果两个站都检测到信道是空闲的, 并且同时开始传送数据, 则它们几乎立刻就会检测到有冲突发生。它们不应该再继续传送它们的帧, 因为这样只会产生垃圾而已;相反一旦检测到冲突之后, 它们应该立即停止传送数据。快速地终止被
17、损坏的帧可以节省时间和带宽。CSMA/CD 应用在 OSI 的第二层数据链路层, 它的工作原理是:发送数据前先侦听信道是否空闲, 若空闲, 则立即发送数据。若信道忙碌, 则等待一段时间至信道中的信息传输结束后再发送数据;若在上一段信息发送结束后, 同时有两个或两个以上的节点都提出发送请求, 则判定为冲突。若侦听到冲突, 则立即停止发送数据, 等待一段随机时间, 再重新尝试。它的主要目的是提供寻址和媒体存取的控制方式, 使得不同设备或网络上的节点可以在多点的网络上通信而不相互冲突。三、小结本论文提出了一种基于图像压缩学习的动态监控方法, 通过在图像信息获取前端增加智能学习单元, 当识别到监控信息
18、发生变化时, 再传输图像。这个方法可以有效地降低传输量的要求、提高监控效率。参考文献1郎彦昆, 邹建成.基于压缩感知和稀疏编码的数字图像压缩编码Z.第九届中国通信学会学术年会, 2012. 2郭亮, 姚磊, 高宏力等.基于字典学习和稀疏编码的振动信号去噪技术J.振动.测试与诊断, 2015, 35 (4) :752-756. 3刘雅莉, 马杰, 王晓云等.一种改进的 K-SVD 字典学习算法J.河北工业大学学报, 2016 (2) :1-8. 4金伟.基于云计算的数字图像处理平台D.浙江大学, 2011. 5安春燕.基于云计算的数字图像处理平台J.数字技术与应用, 2015 (1) :88.
19、6余溢文, 虞蓓蓓, 赵惠祥.基于微信平台的学术期刊交流平台构建研究J.中国科技期刊研究, 2014, 25 (5) :664-666. 7杨晓娇, 吴必造.RFID 系统中的碰撞问题研究J.电脑知识与技术, 2017 (1) :276-278. 8吴海锋, 曾玉.RFID 动态帧时隙 ALOHA 防冲突中的标签估计和帧长确定J.自动化学报, 2010, 36 (4) :620-624. 9屈星龙, 安葳鹏, 王磊.基于 CSMA/CD 的改进调度算法研究J.测控技术, 2016, 35 (12) :98-101. 10关鑫.基于 CSMA/CD 的改进调度算法研究D.哈尔滨工业大学, 2011.