1、无线移动多信道感知网络上的数据聚集传输规划 冯诚 李治军 姜守旭 哈尔滨工业大学计算机科学与技术系 摘 要: 智能交通系统上的实时导航、交通监控、安全保障等应用需要实时地收集大量的交通流量、车辆位置以及道路通行时间等信息.车上很多传感器(如 GPS)可以实时采集这些数据,而由车及路边设备构成的车联网可以实时地传输这些数据.面对大量感知数据的实时传输,无线通信能力远远不能满足传输需求,而车移动导致的链路变化又使得无线信道资源很难被高效利用.该文综合了 3 个方面内容来解决这一问题:考虑基于 802.11p 的多信道数据传输提高无线传输能力;利用数据聚集降低数据传输量;利用网络动态变化结构规划高效
2、的传输.该文提出的数据聚集规划包括两个步骤:首先是构建一棵带信道个数约束的优化聚集路由树.基本思想是通过选择连通时刻较多的链路作为树边优化传输时刻可规划的空间.同时建树时需要满足干扰半径内的树间冲突数量不大于信道数量,实现多信道无冲突并行传输;然后规划优化的传输时刻.其核心是在避免树内冲突的前提下利用有限的无线网络资源将尽可能多的数据聚集到 AP 节点.该文给出了一个动态规划算法实现了最优传输规划.该文在真实轨迹数据集和模拟轨迹数据集上进行了大量的对比实验.结果表明该文的方法在数据收集率上比现有算法提高了近 1/4,同时也减少了数据平均收集延迟.关键词: 车联网; 数据聚集; 动态规划; 多信
3、道; 数据收集; 物联网; 作者简介:冯诚,女,1986 年生,博士研究生,主要研究方向为移动感知网络上的数据收集、数据聚集技术.E-mail:.作者简介:李治军,男,1977 年生,博士,副教授,主要研究方向为 P2P 网络、普适计算、传感器网络、操作系统.作者简介:姜守旭(通信作者),男,1968 年生,博士,教授,博士生导师,主要研究领域为 P2P 网络、数据库、传感器网络、普适计算.E-mail:.收稿日期:2014-12-28基金:国家自然科学基金(61370214,60803148)资助Data Aggregation Scheduling in Wireless Mobile M
4、ultichannel Sensor NetworksFENG Cheng LI Zhi-Jun JIANG Shou-Xu Department of Computer Science and Technology,Harbin Institute of Technology; Abstract: Real-time navigation,traffic monitoring,warning broadcasts applications in Intelligent Transportation Systems need a large number of real-time traffi
5、c volume,vehicle locations travel time through the roads and so on.Many kinds of sensors on the vehicles(e.g.GPS)can sense these data.Vehicular networks composed by vehicles and access points can transmit these data.A mass of real-time data need be transmitted.But the capacity of wireless communicat
6、ion cannot satisfy the transmission requirements.Moreover,the frequent change of wireless links caused by the mobility of vehicles makes wireless resource difficult to be utilized.This paper synthesizes three aspects to solve this problem:utilize multi-channel transmission of 802.11 p protocol to im
7、prove the capacity of wireless communication;utilize data aggregation to decrease the amount of data transmission;utilize dynamic communication topology to schedule effective transmissions.This paper proposes data aggregation transmission scheduling,which includes two steps.The first step is to crea
8、te an optimal aggregation routing tree with channel constraints.The basic idea is to choose the links with more connected timeslots as edges on the tree to optimize the space of transmission time scheduling.At the same time,the algorithm needs to satisfy that the amount of inter-tree conflicts in th
9、e interference range is less than the amount of channels in order to realize multi-channel transmission without conflicts.The second step is to schedule the optimaltransmission time.The key point is to utilize limited wireless resource to aggregate data to AP as much as possible without transmission
10、 conflicts.In this part the paper proposes a dynamic programming algorithm to get optimal transmission scheduling.Finally,we conduct a mass of simulation experiments on a real taxi trajectory data set.The result demonstrates that compared with existing data aggregation algorithms,our algorithm impro
11、ves nearly 1/4in the data collection rate,and decreases the average delay.Keyword: VANET; data aggregation; dynamic programming; multi-channel; data collection; Internet of Things; Received: 2014-12-281 引言近年来,随着无线通信技术和感知技术的发展,车用自组织网络(Vehicular Adhoc NETworks1或 Vehicular Sensor Networks2)成为无线移动通信领域的新
12、的热点研究,受到工业界和学术界的极大关注.车用自组织网络是由移动的车辆节点和静态的路边接入点 AP(Access Point)形成的无线移动感知网络.车用自组织网络为智能交通系统(Intelligent Transportation Systems,ITS)3的应用提供了实现的平台.实时导航4、安全警示广播5等许多 ITS 上的应用都需要实时车辆的速度位置等信息.因此,如何在 VANET 上高效地收集移动的车辆节点的实时数据成为车用自组织网络上的一个核心问题.车用自组织网络场景如图 1 所示.随着道路上车辆节点不断移动,车辆节点之间以及车辆节点与路边接入点 AP 之间的无线通信链路不断变化.在
13、 1 时刻,节点 a与节点 b,节点 b 与节点 d 以及节点 d 与节点 c 之间都存在无线链路,这时,节点a 向节点 b 传数据,节点 c 向节点 d 传数据,当移动节点采用 802.11p 协议进行多信道无线通信时,在该时刻节点 a 和节点 c 通过控制信道协调分别采用信道 2和信道 1 传输数据,即实现了该时刻两对节点对的无干扰数据传输.在时刻 2,随着车辆节点的移动,节点之间的通信拓扑结构也随之发生变化,这时节点 b 和节点 d,节点 d 和节点 g,节点 g 和节点 c 之间存在无线链路,此时,节点 b 将上一时刻收到的节点 a 的数据与自身的数据进行聚集,得到聚集数据,将该聚集数
14、据通过信道 2 传给节点 d,节点 g 用信道 1 将数据传给节点 c.从上述场景我们可知VANET 上数据采集和处理的过程包括以下 3 个部分:首先移动节点感知获得实时的速度、位置等信息,然后移动节点之间通过多信道无线通信进行数据路由和聚集到 AP 节点,最后在 AP 节点再进行解压缩、数据近似等处理分析.由于移动节点产生的实时数据的信息量是非常大的,在数据的路由过程中传输这些数据需要消耗大量的无线宽带资源,同时移动节点之间的可用无线宽带资源是非常有限的,这就出现了大量的数据传输与有限的无线通信资源之间的矛盾.因此我们要合理地规划数据路由和聚集的路径和时刻.图 1 VANET 上的数据收集场
15、景图 下载原图目前在 VANET 上有一些关于数据聚集的研究6-27.这些研究主要是通过静态参数控制单节点上的聚集操作和数据传输14-16.但这些方法没有考虑到动态链路的细节信息.数据路由聚集到聚集节点需要一定的时间,同时由于节点的移动,节点与 AP 之间的无线链路也存在时效性,因此节点在与 AP 节点的链路失效之前要将收到的所有的可聚集数据转发给 AP 节点,这样才能使得 AP 节点收集到移动节点的数据,同时有效地降低网络传输的带宽资源消耗.现有的研究没有考虑利用 802.11p 协议的多服务信道的特征进行传输规划.在数据传输的过程中,节点之间的通信采用无线通信方式.同一信道上的无线通信会有
16、无线干扰的问题.无线干扰会导致传输效率下降.802.11p 协议规定 VANET 上节点间的无线通信有 7 个信道:1 个控制信道、6 个服务信道.当在干扰范围内的多个节点对进行数据传输时,他们可以通过控制信道进行协调使得不同的节点对利用不同的服务信道,从而达到同一时刻干扰半径内的多节点对之间进行无干扰数据通信.综上,我们研究基于动态网络拓扑信息利用多信道规划移动节点的数据路由和数据聚集传输时刻的问题.针对该问题,本文分两个步骤进行求解.首先确定数据路由结构.本文提出了构造k 约束优化聚集路由树的 CreateMRT 算法.然后规划无冲突聚集传输时刻.本文提出了基于动态规划思想的 DAS-MR
17、T 算法.本文将上述两个算法组合形成 DAC-WMMN 算法,用以求解无线多信道移动感知网络下的数据聚集传输规划问题.最后,我们通过真实数据集和人工数据集上的模拟实验,分析了该算法的数据聚集平均时延、收集数据量等性能.实验结果表明本文的算法比现有的算法时延更小、效率更高.本文第 2 节介绍现有的 VANET 上的数据聚集的研究工作;第 3 节描述本文采用的系统模型;第 4 节形式化了 k 约束优化聚集路由树的构造问题,并提出构造 k约束优化聚集路由树的算法,同时分析该算法的时间复杂度;第 5 节给出树上的数据聚集传输规划问题的形式化定义,提出基于动态规划思想的数据聚集传输规划算法,并证明该算法
18、的优化性,同时给出算法的时间复杂度的分析;第 6 节通过大量真实轨迹数据集和模拟轨迹数据集上的实验分析本文算法在收集数据的数据量和时延上的性能,并与现有的聚集算法进行比较.最后总结全文.2 相关工作近年来,国内外对 VANET 上数据聚集已经进行了一些研究6-27.这些研究主要集中在 3 个方面:(1)考虑聚集路由的结构;(2)考虑聚集数据的精度;(3)考虑数据聚集的延迟.文献6-11是研究数据聚集中的路由结构.SOTIS6和 TrafficView7采用无结构广播方式进行单节点上的数据聚集和分发.采用无结构数据聚集的优点是没有额外的维护路由结构的开销,缺点是同一数据的聚集数据会出现多个版本,
19、如何从收集到的多个版本中选择最优的是核心问题.CGP8采用的算法的基本思想是分簇.它根据地理划分的路段对路面上的车进行分簇,选择簇头,将数据收集到簇头再进行聚集.簇方法的优点是不会产生多版本的不完整数据,同时节省了节点的计算资源,缺点是需要在数据路由前建立分簇,但节点快速移动时,维护簇结构的代价较高.文献9-11采用基于层次结构进行聚集.基于层次结构的聚集是先基于地图建立多层次聚集区域,然后逐层进行聚集.文献11的思想是利用分层界标对车辆通行时间进行聚集.层次性聚集的优点是聚集过程中传输的数据量是可控的,传输数据量随层级呈指数级下降,缺点是聚集引入的误差是不可控的.现有的一些研究12-16是考
20、虑聚集数据精度,他们解决的问题主要是权衡聚集数据精度损失和传输数据需要的网络带宽的消耗.TrafficView7考虑单节点上数据聚集算法,使得聚集数据的精度满足给定阈值的前提下聚集出最少的聚集数据.CASCADE12算法进行无损数据聚集,主要思想是存储聚集数据和原始数据与聚集数据的方差.文献13对 CASCADE 算法进行改进,主要是对簇的大小进行了优化.文献14基于模糊推理进行数据聚集.它研究的是在高速公路场景下对数据进行聚集,最后得到的聚集数据能反映车流速度的实际分布情况.这种聚集方法考虑数据真实分布,但聚集后的数据量不容易控制.还有一些研究是考虑数据聚集延迟.Catch-up17-18是
21、控制数据路由的算法.该文中采用马尔可夫模型对节点上数据的延迟进行优化,但没有考虑无线通信时出现冲突时如何调度节点进行传输的问题和移动节点之间无线链接的时效性的问题.文献19提出了一个查询响应协议 DB-VDG,该协议设计的主要思想是数据如果能在限定的延迟内被携带到目的地,就尽量少进行转发,这样可以最大限度地节省带宽.还有一些其他的有关 VANET 数据聚集的研究.Dietzel 等人22给出了 VANET 上数据聚集模型,对不同类型的数据不同的聚集操作等建立统一的聚集过程模型.文献23-24研究可扩展的数据聚集模式需要满足的理论性能.文献25的研究是针对停车位这类离散信息的应用,他利用的方法只
22、适用于离散性数据的收集,不能用于收集速度、位置等连续性数据.3 系统模型与问题描述3.1 动态网络模型我们考虑基于时间片的时钟同步系统.首先我们对车辆节点的移动进行建模.假设车辆节点 i 在时刻 j 处于(x i,yi)处,随着车辆节点的移动,车辆 i 在各个时间槽所处位置序对形成车辆 i 的移动轨迹 Tradi=(xi,yi),(xi,yi),(xi,yi).对于节点之间的无线通信我们采用圆盘通信模型.车辆 i 与车辆 j 在 k 时刻可以进行通信当且仅当在 k 时刻节点 i 和节点 j 之间的欧氏距离小于无线通信半径 R.假设已知车辆的移动轨迹,根据移动轨迹集以及圆盘通信模型,可以得到 D
23、 个时刻的通信拓扑图序列.然后我们利用通信拓扑图序列构造移动通信拓扑.移动通信拓扑涵盖了 D 个时刻的节点之间的连通关系.下面给出移动通信拓扑的定义.定义 1(移动通信拓扑). 移动通信拓扑定义为 1 个三元组 G=(V,E,LT),其中 V 为节点集合,E 为链路集合.i,j(其中 i,jV)是 E 中的一条链路当且仅当存在一个时刻,i 和 j 的距离小于通信半径 R.移动造成的动态拓扑,其核心是使得链接i,j可以出现在多个时刻上,LT(i,j)表示了链接i,j出现的时刻集合.图 2 所示的是 3 个时刻的通信拓扑图序列,其中节点是a,b,c,d,e,虚线表示在该时刻节点之间存在无线链路.通
24、过该图序列,我们可以构造移动通信拓扑 G,如图 3 所示.该移动通信拓扑 G 共有 5 个节点,虚线为无线链路边,其中边上标识的集合为该链路的连通时刻集,例如,节点 a 和节点 b 之间的链路 lac,该链路在1,2 这两个时刻是连通的,其他时刻不连通.图 2 3 个时刻的通信拓扑图序列 下载原图图 3 移动通信拓扑 G 示例图 下载原图3.2 树状路由模型在给定的移动通信拓扑上移动节点进行聚集传输数据时,我们采用以 AP 节点为根的树型结构进行数据路由和聚集,这样使得每个节点到 AP 的路径唯一,即可以保证每个节点的聚集数据单版本.下面我们给出移动聚集路由结构的定义.定义 2(移动聚集路由结
25、构). 移动聚集路由是以 AP 节点为根节点,所有移动节点到 AP 节点的唯一路由路径构成的树型结构,表示为 T =(V,E,LT),其中 V 为节点集,E 为树 T 的边集,LT(i,j)表示了链接i,j出现的时刻集合.本文考虑多信道无线通信模式.这里假设可用信道的个数为 k.节点可以选择任一信道进行数据传输,但一个节点在一个时刻只能发送数据或接收数据,当接收数据时,只能接收一个节点发送的数据.当多对节点在同一信道中进行数据传输时,本文考虑一跳冲突模型,即一个节点在接收数据时在它的通信半径内不能有其他的节点对进行通信.3.3 传输规划及数据聚集在数据聚集传输的过程中,节点发送数据的时刻决定传
26、输是否存在冲突以及 AP节点最终能收集到的聚集信息量.因此规划数据聚集传输时,即规划节点发送数据的时刻.每个节点 i 被规划的聚集传输时刻记为 Wi.因此一个聚集传输规划 W是一个从移动节点集到时刻集的映射.下面我们给出聚集传输规划的定义.定义 3(聚集传输规划). 一个聚集传输规划是映射 W :V/APLT,其中LT=LT e|eE,E 为移动聚集路由结构 T 的边集.节点 i 的 Wi表示通过聚集传输规划 W 得到的发送数据的时刻,当 Wi为 0 时,表示规划节点 i 不发送数据.在发送数据之前节点要执行数据聚集操作.我们假设这里的聚集操作为可分函数.可分函数指的是可以分治计算的函数,例如
27、 MIN,MAX,SUM 等聚集操作.这些操作也是数据聚集中常常出现的操作.同时假设在节点上进行聚集计算的时间是可以忽略的,即不占用单独的时间片.在初始时刻,每个移动节点产生一个感知数据,即为原始数据.一个原始数据的信息量为 1.然后节点在传输数据的过程中通过聚集操作得到聚集数据.一个聚集数据包含的信息量是参与该聚集数据计算的原始数据的个数,即该数据包含的移动节点的信息的个数.一个节点上累积的聚集信息量为该节点感知数据的信息量和该节点接收到的所有聚集数据的信息量之和.我们下面给出节点上的累积聚集信息量的定义.定义 4(节点上的累积聚集信息量). 该值是节点 i 感知数据的信息量和节点 i截止到
28、 t 时刻接收的聚集数据的聚集信息量之和,记为 M (i,t).M(i,t)定义如下:其中:V 为移动聚集路由结构 T 中的叶节点集合;C i为节点 i 的儿子节点集.4 k 约束优化聚集路由结构及其构造算法4.1 k 约束优化聚集路由结构构造移动聚集路由结构即确定了数据路由的路径,也就是确定了节点发送的数据的接收节点.根据移动聚集路由结构将冲突情况分为两种类型:一种是节点不能同时接收多个数据,即在移动聚集路由结构上同一父节点的多个儿子节点不能同一时刻向父节点发送数据,同时父节点发送数据的时刻不能和儿子节点发送数据的时刻相同,这种冲突被称为树内冲突;另一种是节点在接收数据时不能受到其他发送节点
29、的影响,即接收节点不能在其他发送节点的通信范围内,这种冲突被称为树间冲突.图 4(a)所示的情况即是树内冲突,如图所示节点 u 和节点 v 有共同的父节点 x,如果节点 u 和节点 v 同时给节点 x 发送数据,那么在节点 x 处会发生冲突,节点 x 无法同时接受节点 u 和节点 v 的数据.图 4(b)所示的是树间冲突的情况.节点 u 给父节点 x 发送数据,节点 v 给父节点 y 发送数据,但节点 x 在节点 v 的通信半径内,如果节点 u 和节点 v 同时发送数据,那么在节点 x 处会受到节点 v 传输数据的干扰,无法接收到节点 u 的数据.我们考虑在建树时加入节点在树上的度的约束,使得
30、树间冲突可以采用不同信道进行避免,也就是在构造路由树时,使得每个节点的树间边的个数不超过 k,这也就保证了当一个节点发送数据的时刻与它的除父节点和儿子节点的其他邻居节点接收数据的时刻相同时,他们可以采用 k 个信道中的不同信道,使得树间冲突不会存在.因此建树问题的约束条件是树上的任一节点 i 要满足 i- ik,其中 i为节点 i 在移动通信拓扑 G 上的度数, i为节点 i 在移动聚集路由结构上的度数,k 为可用信道数量,即任一节点 i 在通信半径范围内可能被规划同时传输的节点个数不超过信道个数,则当这些节点被规划同时传输时,则采用不同信道进行传输.该树结构是传输时刻规划问题的输入,因此该树
31、的结构影响传输规划的性能.建树时考虑连通时刻较多的边作为树上的边,这样在规划传输时刻时,可选择的空间更大,也就是可规划的空间更大,因此更利于最大化收集数据量这一目标的实现.综上,我们给出 k 约束优化聚集路由结构的定义如下.图 4 两种冲突情况 下载原图定义 5(k 约束优化聚集路由结构). 树 T=(V,E,LT)为移动通信拓扑 G 上的 k 约束优化聚集路由结构当且仅当在该树上的边的连通时刻集的基数之和最大,且每个节点满足 i- ik 限制,其中 i为节点 i 在移动通信拓扑 G 上的度数, i为节点 i 在移动聚集路由结构上的度数,k 为信道数量.如图 5 所示,图 5(a)为 5 个节
32、点的移动通信拓扑,图 5(b)为该拓扑的 2 约束优化路由结构,其中 2 约束体现在对于节点 b 来说,在路由结构中虚线连接的节点个数小于 2,这里与节点 b 虚线相连的只有节点 e.优化体现在对于节点 e,它可以选择节点 a 作为父节点,也可以选择节点 b 作为父节点,但链路 ae 的连通时刻集为1,2,3,链路 be 的连通时刻集为1,2,链路 ae 的连通时刻更多,因此节点 e选择节点 a 作为父节点.图 5 2 约束优化聚集路由结构 下载原图我们将构造 k 约束优化聚集路由结构的问题形式化为如下形式,记为 k-MRT 问题:k-MRT 问题:已知:移动通信拓扑 G=(V,E,LT),其
33、中 APV,无线通信可用的信道个数为 k.求:以 AP 为根的 k 约束优化聚集路由结构 T.4.2 k 约束优化聚集路由树算法k-MRT 问题是基于移动通信拓扑求以 AP 为根节点的 k 约束优化聚集路由树.我们给出 Create-MRT 算法.该算法首先保证 k 约束,即每个节点的至少 min i-k,0个邻居节点会被构建为儿子节点,这就保证了每个节点的树间边的个数不超过 k,在选择哪些节点加入时,根据链路的连通时刻集的大小进行选择.然后,当一个节点选择哪个节点作为父节点时,我们仍考虑它与该节点的链路连通时刻集,选择这个集合基数最大的链路的节点作为父节点.这里 Ni表示节点 i 在 G 上
34、的邻居节点集.该算法的伪码如算法 1.算法 1. CreateMRT 算法.首先初始化树的节点集和边集为空.将 AP 节点加入节点集,作为根节点.然后对于每个新加入的节点 i,判断该节点在图 G 上的度 i与信道个数 k 的关系,如果大于,则要选择 i-k 个节点添加为节点 i 的儿子节点,这时要将节点 i 的未加入的邻居节点与节点 i 的链路的连通时刻集进行排序,从中选择最大的前 i-k个,将这些节点加入新加节点集 tempV,加入树节点集 V,相应的边加入边集.接下来我们要考虑节点 i 的未加入的邻居节点集中仍没处理的节点,设其中的一个节点 j,判断它与节点 i 的链路连通时刻集的大小是否
35、为它的所有相连链路中最大的,如果是,节点 j 选择节点 i 作为父节点,相应地做些加入和删除操作.循环上述过程,直至新加节点集为空,算法终止.4.3 算法时间复杂度分析设移动通信拓扑 G 的节点个数为 n,边数为 m,节点在 G 上的最大度为 .定理 1. CreateMRT 算法的时间复杂度为 O(nlog+).证明. 该算法的主体部分为步 310.对于每个新加入的节点,要对该节点的所有未添加的邻居节点进行排序,时间复杂度为 O(log),其他的加入删除等操作时间复杂度为 O(1),因此对于所有节点进行上述操作的时间复杂度为O(nlog).对于步 910,要找出一个节点的所有链路的连通时刻集
36、基数最大的,时间复杂度为 O(),对每个节点来说,做这个操作的次数不超过 ,因此这部分总时间复杂度为 O().综上,CreateMRT 算法的时间复杂度为 O(nlog+).证毕.5 移动聚集路由结构上的聚集传输规划问题及其算法5.1 移动聚集路由结构上的聚集传输规划问题k 约束优化聚集路由树确定了数据的路由,下面就是在该结构上规划数据聚集传输时刻.已知 k 约束优化聚集路由结构 T,在 T0时刻移动节点 i 产生感知数据 di,求解无冲突的聚集传输规划 W 使得 AP 节点收集的聚集信息量 M (AP,WAP)最多,其中 WAP=1+argmaxt|tLT i,AP,iC AP.我们将移动聚
37、集路由结构上的数据聚集传输规划问题进行形式化定义,记为 DAS-MRT 问题.DAS-MRT 问题:其中式(2)约束表示的是当儿子节点和父节点都传输数据时,儿子节点传输数据的时刻要小于父节点传输数据的时刻,即儿子节点要在父节点发送数据之前将数据发送给父节点,式(3)约束表示的是同一父节点的多个儿子节点都传输数据时,它们传输数据的时刻不能相同.5.2 移动聚集路由结构上的传输规划算法通过对 DAS-MRT 问题的分析,我们给出了基于动态规划思想的 DAS-MRT 算法.我们首先进行分层,将叶子节点作为第 0 层,父节点的层数为儿子节点的层数的最大值加 1.按照层数由低到高的顺序,对每个节点与父节
38、点的链路的连通时刻计算该时刻传输可以收集的最大数据量.设 Xi,W 表示节点 i 在传输时刻为 W 时发送的聚集数据包含的最大信息量.设节点 i 的父节点为 pi.设节点 i 的儿子节点集为 Ci,有 k 个儿子节点 c1,c2,ck,对应传输时刻为 .该算法的伪码如算法 2.算法 2. DAS-MRT 算法.在该算法中,前两步是初始化的步骤,从步 312 是计算除叶节点和根节点的所有其他节点在所有可传输时刻的 Xi,W ,步 13 是计算根节点 AP 节点的 XAP,WAP.这里从步 312 是 DAS-MRT 算法的核心.步 710 是一个优化处理,即将没有冲突的时刻直接分配给节点,步 1112 是确定节点的候选时刻集,用候选时刻集和儿子节点集构造二部图的最大权值匹配问题,然后利用 KM 算法28进行求解.5.3 分析算法的优化性