1、基于相关向量机的网络通信负载状态识别模型 邓蕾蕾 陈霄 吉林农业大学信息技术学院 摘 要: 为了改善网络通信负载状态识别效果, 提出一种基于相关向量机的网络通信负载状态识别模型.首先提取影响网络通信质量的参数, 分析它们与负载状态间的联系;然后将无线传感器网络吞吐率作为负载状态识别的标准, 采用相关向量机构建网络通信负载状态的分类器, 实现网络通信负载状态的识别;最后采用具体数据对网络通信负载状态识别性能进行测试.测试结果表明, 相关向量机可准确识别网络通信负载状态, 且网络通信负载状态识别正确率高于其他模型.关键词: 无线传感器网络; 网络通信负载; 识别模型; 相关向量机; 网络吞吐率;
2、作者简介:邓蕾蕾 (1979) , 女, 汉族, 硕士, 副教授, 从事嵌入式理论和网络技术的研究, E-mail:.收稿日期:2016-08-02基金:吉林省教育厅“十二五”科研项目 (批准号:201452) Identification Model of Network Communication Load State Based on Relevance Vector MachineDENG Leilei CHEN Xiao College of Information Technology, Jilin Agricultural University; Abstract: In ord
3、er to improve the identification effect of network communication load state, we proposed a identification model of network communication load state based on relevance vector machine.Firstly, the parameters which affected the quality of network communication were extracted, and the relationship betwe
4、en them and their load states was analyzed.Secondly, the throughput of wireless sensor network was regarded as the standard of load state identification, and the relevance vector machine was used to construct the classifier of network communication load state to realize the identification of network
5、 communication load state.Finally, the specific data was used to test the performance of network communication load state identification.The test results show that the relevance vector machine can accurately identify the network communication load state, and the correct rate of the network communica
6、tion load state identification is higher than other models.Keyword: wireless sensor networks; network communication load; identification model; relevance vector machine; network throughput; Received: 2016-08-02无线传感器网络由许多传感器节点组成, 这些传感器节点部署在一定的区域中, 通过多跳形式进行信息传输, 它们对监测对象状态信息进行实时采集, 并通过协作方式将信息发送到目的地1-4.
7、随着无线传感器网络应用范围的不断拓宽, 网络上传输的数据量急剧增加, 同时传感器节点规模也不断扩大, 节点之间的通信会产生一定干扰, 数据传输冲突概率增加, 这些都会对无线传感器网络通信质量产生不利影响5-6.为了降低节点之间通信的相互干扰, 常采用跳频通信、多信道等传输机制, 以提高无线传感器网络通信的稳定性, 同时为了充分利用无线传感器网络的信道, 当网络通信负载较小时, 减少网络行为控制操作, 否则加强网络行为控制操作.网络通信负载状态识别是进行网络行为控制的基础, 对其进行研究具有重要意义7.针对无线传感器网络通信负载状态识别问题的研究目前已有许多成果:文献8提出了基于数据包长度预测的
8、网络通信负载状态识别模型, 根据数据包长度对网络拥挤程度进行识别, 并根据识别结果对网络通信速度进行动态调整;文献9提出了基于数据包达到时间的网络通信负载状态识别模型, 通过对数据包到达时间进行估计判断网络传输状态, 根据网络传输状态对网络服务质量参数进行改变;文献10根据数据包的接收和转发的速率比识别网络通信负载状态;文献11构建了基于接收数据包缓存状态的网络通信负载状态识别模型, 将缓存划分为接受、过滤和拒绝 3 种状态, 用它们描述网络拥挤程度, 当缓存区的数据包较少时, 表示网络不拥挤, 实现正常无线传感器网络通信;当缓存区的数据包较多时, 表示网络拥挤, 传感器节点拒绝接收数据.但这
9、些方法都存在不足, 如网络通信负载状态根据阈值进行识别, 而阈值常采用人工方式进行设置, 具有一定的主观性, 对网络数据传输状态分析不准确.赵泽等12为了解决阈值识别存在的不足, 设计了基于支持向量机的网络通信负载状态识别模型, 将网络通信负载状态识别作为支持向量机的输出, 网络基本传输参数作为支持向量机的输入, 通过支持向量机的学习描述输出与输入之间的变化关系, 可对网络通信负载状态进行准确识别.在实际应用中, 支持向量机学习是一个耗时的过程, 影响网络通信负载状态速度, 无法满足大规模无线传感器络网络通信负载状态识别的实时性.相关向量机 (relevance vector machine,
10、 RVM) 不仅具有支持向量机的优异学习性能, 同时克服了支持向量机学习速度慢的缺陷, 在许多领域广泛应用13-15.为了改善网络通信负载状态识别效果, 本文提出一种基于相关向量机的网络通信负载状态识别模型.首先提取影响网络通信质量的参数, 分析它们与负载状态之间的联系;然后将无线传感器网络吞吐率作为负载状态识别的标准, 采用相关向量机构建网络通信负载状态的分类器;最后采用具体数据对网络通信负载状态识别性能进行测试.1 相关向量机假设训练样本集为 (x n, tn) , n=1, 2, , N, xn瓗, t n (0, 1) , N 表示样本数, 则相关向量机的分类函数为其中, i为权值向量
11、;K (x, x i) 为核函数;w= ( 0, 1, , N) .选择 Sigmoid 函数为连接函数, 则训练样本的似然估计概率为其中 y= (t1, t2, , tN) .w 可采用极大似然法进行求解, 但其基于 Bayes 框架易产生“过学习”现象, 因此引入了高斯先验概率分布对参数进行相应的约束, 即其中 表示超参数.由于无法准确对 w 的后验概率进行求解, 因此引入 Laplace 理论对 w 的后验概率进行近似求解, 即:1) 当超参数 固定时, 可采用二阶牛顿法对最大权值 wMP进行求解16:式中, A=diag ( 0, 1, , N) , yn=y (x n;w) .2)
12、对式 (4) 进行两次求导可得式中, B=diag ( 1, 2, , N) , n=y (x n) 1-y (x n) .对式 (5) 右边取负号, 计算协方差矩阵 .3) 根据协方差矩阵 和最大权值 wMP对超参数 进行更新操作, 至收敛效果满足实际要求为止, 即式中 ij表示第 i 个对角元素, 其中相关向量机的工作步骤如下:1) 收集数据集, 设置好核函数 K (x, xi) , 将数据集映射到高维空间;2) 随机初始化超参数 ;3) 根据式 (7) , (8) 计算协方差矩阵 和最大权值 wMP;4) 根据式 (6) 重新估计超参数 ;5) 判断是否收敛到合适尺度, 如果未满足该条件
13、, 则返回 3) 继续执行;6) 对新的样本进行分类.2 模型设计2.1 相关参数对网络性能的影响在无线传感器网络工作过程中, 影响网络性能的参数主要包括:传感器节点的数量, 数据包的长度和数据包发送的速率.而无线传感器网络的性能指标主要包括:吞吐率和收包率.设数据发送速率为 50 包/s, 传感器节点的数量为 120 个, 在数据包长为 50B 的条件下, 传感器节点与无线传感器网络的吞吐率、收包率变化曲线如图 1 所示.由图 1 可见:1) 当传感器节点数量较少时, 吞吐率较高, 随着传感器节点数量的增加, 传感器节点的吞吐率随之下降, 这是由于传感器节点越少, 节点之间的通信干扰概率越小
14、, 而节点越多, 节间点之间的通信干扰越严重, 因此网络通信质量随着传感器节点数的增加而下降;2) 当传感器节点的数量较少时, 传感器节点收包率较高, 但随着传感器节点数量的不断增加, 传感器节点收包率逐渐减少, 即数据发送的成功率下降, 数据包被丢失的概率上升, 导致数据重发的次数增多, 无线传感器网络通信质量变差.图 1 节点数量和吞吐率 (A) 、收包率 (B) 之间的变化曲线 Fig.1 Change curves between number of nodes and throughput (A) , rate of packet delivery (B) 下载原图通过对不同数据发送
15、速率、不同数据包长与节点数量和吞吐率、收包率之间的关系进行分析表明, 这些参数对网络通信状态质量的影响相互独立, 数据发送速率越大, 传感器网络的节点吞吐率越大, 但收包率却越小, 这是因为发送速度越快, 数据发送冲突概率越高, 发送数据的错误率越大;而数据包长与节点吞吐率、收包率成反比关系.通过以上分析, 可以根据 3 个参数进行研究, 当网络吞吐率超过峰值时, 认为当前网络通信负载状态为过载状态, 否则为未过载状态, 因此采用网络吞吐率作为负载状态识别的标准, 采用相关向量机构建网络通信负载状态的分类器.2.2 网络通信负载状态识别模型设计基于相关向量机的网络通信负载状态识别步骤如下:1)
16、 根据实际应用要求, 构建一个具有多个传感器节点的无线传感器网络;2) 对描述网络状态的 3 个参数数据进行收集, 先去除其中一些无用的数据, 然后通过专家系统对网络通信负载状态进行标识, 过载状态为 1, 未过载状态为-1;3) 将收集网络通信负载状态识别划分为训练集和测试集, 并将数据格式转变为相关向量机能够识别的格式;4) 对相关向量机参数进行初始化, 选择 RBF 核函数作为相关向量机的核函数:5) 将 3 个参数组合在一起作为相关向量机的输入, 网络通信负载状态作为相关向量机的期望输出, 并将训练集输入相关向量机进行训练;6) 通过交叉验证确定相关向量机的最优参数, 建立基于相关向量
17、机的网络通信负载状态识别分类器;7) 采用建立的网络通信负载状态识别分类器对测试集进行识别, 输出网络通信负载状态识别结果, 并进行分析.基于相关向量机的网络通信负载状态识别流程如图 2 所示.图 2 网络通信负载状态识别流程 Fig.2 Identification process of network communication load state 下载原图3 实验结果与分析为了分析基于相关向量机的网络通信负载状态识别模型的有效性, 采用MATLAB2014 作为仿真实验平台;为了测试相关向量机的优越性, 选择支持向量机作为网络通信负载状态识别的对比模型.收集到 500 个网络通信负载状
18、态识别样本, 选 300 个样本建立网络通信负载状态识别分类器, 其余样本用于测试网络通信负载状态识别结果, 样本的格式列于表 1.表 1 网络通信负载状态识别样本的格式 Table 1 Format of identification samples for network communication load state 下载原表 采用相关向量机和支持向量机分别建立网络通信负载状态识别模型, 并对测试样本进行识别, 共进行 5 次实验, 为使实验结果更具说服力, 其中 300 个训练样本采用随机选择的方式, 统计其网络通信负载状态识别准确率和平均识别时间, 实验结果分别如图 3 和图 4
19、所示.由图 3 和图 4 可见:1) 相关向量机的网络通信负载状态识别平均值为 94.37%, 而支持向量机的网络通信负载状态识别平均值为 91.64%, 表明相关向量机可准确区分网络通信过载状态和非过载状态, 有效降低了网络通信负载状态识别的错误, 可根据网络通信负载状态识别结果对无线传感器节点通信方式进行自动控制, 保证无线传感器网络的通信质量最优;2) 相关向量机的网络通信负载状态识别平均时间远小于支持向量机的平均识别时间, 加快了网络负载状态识别的速度, 克服了支持向量机训练时间长的缺陷, 可满足无线传感器网络通信负载状态识别的实时性.图 3 网络通信负载状态的识别准确率 Fig.3
20、Identification accuracy of network communication load state 下载原图图 4 网络通信负载状态的识别时间 Fig.4 Identification time of network communication load state 下载原图综上所述, 本文针对网络通信负载状态识别模型存在的误识率高等缺陷, 提出了一种基于相关向量机的网络通信负载状态识别模型.首先采用网络通信吞吐量作为无线传感器网络的通信质量评价标准, 然后通过相关向量机对负载状态和无线传感器网络的通信性能参数之间的变化关系进行拟合.仿真测试结果表明, 相关向量机可准确描述
21、各种网络通信负载状态, 获得了较理想的网络通信负载状态识别结果, 与其他模型进行对比实验表明, 相关向量机的网络通信负载状态识别率更高, 有效降低了网络通信负载状态的误识率, 且网络通信负载状态识别速度明显加快.参考文献1雷建军, 夏英, 赵阔.能量有效的无线传感器网络数据收集协议J.重庆邮电大学学报 (自然科学版) , 2014, 26 (5) :582-586. (LEI Jianjun, XIA Ying, ZHAO Kuo.Energy Efficient Data Collection Protocol for Wireless Sensor NetworksJ.Journal of
22、 Chongqing University of Posts and Telecommunications (Natural Science Edition) , 2014, 26 (5) :582-586.) 2孙顺远, 孙丽, 陈树.三维环境下无线传感器网络的部署覆盖方法J.吉林大学学报 (理学版) , 2016, 54 (5) :1109-1116. (SUN Shunyuan, SUN Li, CHEN Shu.Method of Deployment and Coverage for Wireless Sensor Networks in Three Dimensional Envi
23、ronmentJ.Journal of Jilin University (Science Edition) , 2016, 54 (5) :1109-1116.) 3崔莉, 鞠海玲, 苗勇, 等.无线传感器网络研究进展J.计算机研究与发展, 2005, 42 (1) :163-174. (CUI Li, JU Hailing, MIAO Yong, et al.Overview of Wireless Sensor NetworksJ.Journal of Computer Research and Development, 2005, 42 (1) :163-174.) 4刘壮, 冯欣,
24、王雁龙, 等.基于双簇头聚类分簇和数据融合的无线传感器网络路由算法J.吉林大学学报 (理学版) , 2015, 53 (5) :1013-1017. (LIU Zhuang, FENG Xin, WANG Yanlong, et al.An Improved Clustering Routing Algorithm Based on Double-CH Clustering and Data Fusion in WSNJ.Journal of Jilin University (Science Edition) , 2015, 53 (5) :1013-1017.) 5Kleerekoper
25、A, Filer N P.Decor:Distributed Construction of Load Balanced Routing Trees for Many-to-One Sensor NetworksJ.Hoc Networks, 2014, 16 (5) :225-236. 6Amgoth T, Jana P K.Energy-Aware Routing Algorithm for Wireless Sensor NetworksJ.Computers and Electrical Engineering, 2015, 41 (1) :357-367. 7牛玉刚, 陈文广.一种基
26、于网格的兼顾拥塞避免与能耗均衡的 WSN 路由算法J.控制与决策, 2016, 31 (11) :1985-1990. (NIU Yugang, CHEN Wenguang.A Grid-Based Energy-Aware and Congestion-Aware Routing Algorithm in WSNJ.Control and Decision, 2016, 31 (11) :1985-1990.) 8孙乔, 邓卜侨, 王志强, 等.一种基于分布式服务器集群的可扩展负载均衡策略技术J.电信科学, 2017, 32 (9) :190-196. (SUN Qiao, DENG Buq
27、iao, WANG Zhiqiang, et al.A Scalable Load Balancing Strategy Based on Distributed Server ClusterJ.Telecommunications Science, 2017, 32 (9) :190-196.) 9Moon S, Kim B, Malik S, et al.Interference Management with Cell Selection Using Cell Range Expansion and ABS in the Heterogeneous Network Based on LT
28、E-AdvancedJ.Wireless Personal Communications, 2015, 81 (1) :151-160. 11QIU Junfei, WU Qihui, XU Yuhua, et al.Demand-Aware Resource Allocation for Ultra-Dense Small Cell Networks:An Interference-Separation Clustering-Based SolutionJ.Transactions on Emerging Telecommunications Technologies, 2016, 27 (
29、8) :1071-1086. 12赵泽, 尚鹏飞, 刘强, 等.无线传感器网络通信负载状态识别方法的研究J.计算机研究与发展, 2014, 51 (11) :2382-2392. (ZHAO Ze, SHANG Pengfei, LIU Qiang, et al.Identification of Communication State for Wireless Sensor NetworksJ.Journal of Computer Research and Development, 2014, 51 (11) :2382-2392.) 13何倩, 胡启伟, 王勇, 等.基于软件定义网络的反
30、饱和分组云负载均衡J.计算机应用, 2016, 36 (6) :1520-1525. (HE Qian, HU Qiwei, WANG Yong, et al.Software Defined Network Based Anti-saturated Grouping Cloud Load BalanceJ.Journal of Computer Applications, 2016, 36 (6) :1520-1525.) 14高明哲, 许爱强, 张伟.基于自适应核参数优化的小波核相关向量机算法J.计算机工程, 2017, 43 (9) :245-249. (GAO Mingzhe, XU
31、Aiqiang, ZHANG Wei.Wavelet Kernel Relevance Vector Machine Algorithm Based on Adaptive Kernel Parameter OptimizationJ.Computer Engineering, 2017, 43 (9) :245-249.) 15熊文真, 刘静瑞, 李红娟.基于邻域粗糙集的网络人侵分类诊断组合模型研究J.数学的实践与认识, 2017, 47 (10) :145-151. (XIONG Wenzhen, LIU Jingrui, LI Hongjuan.A Combined Model Stud
32、y of Taxonomic Diagnosis of Network Intrusion Based on Neighborhood Rough SetJ.Mathematics in Practice and Theory, 2017, 47 (10) :145-151.) 16冯鹏飞, 朱永生, 王培功, 等.基于相关向量机模型的设备运行可靠性预测J.振动与冲击, 2017, 36 (12) :146-150. (FENG Pengfei, ZHU Yongsheng, WANG Peigong, et al.Operational Reliability Prediction of Equipment Based on Relevance Vector MachineJ.Journal of Vibration and Shock, 2017, 36 (12) :146-150.)