收藏 分享(赏)

基于物联网的物流路径规划与频繁路径挖掘的研究.doc

上传人:weiwoduzun 文档编号:1886836 上传时间:2018-08-28 格式:DOC 页数:44 大小:745.50KB
下载 相关 举报
基于物联网的物流路径规划与频繁路径挖掘的研究.doc_第1页
第1页 / 共44页
基于物联网的物流路径规划与频繁路径挖掘的研究.doc_第2页
第2页 / 共44页
基于物联网的物流路径规划与频繁路径挖掘的研究.doc_第3页
第3页 / 共44页
基于物联网的物流路径规划与频繁路径挖掘的研究.doc_第4页
第4页 / 共44页
基于物联网的物流路径规划与频繁路径挖掘的研究.doc_第5页
第5页 / 共44页
点击查看更多>>
资源描述

1、 硕士 硕士学位论文杨俊瑶基于物联网的物流路径规划与频繁路径挖掘的研究基于物联网的物流路径规划与频繁路径挖掘的研究杨俊瑶2014 二一四年六月分类号 密级UDC硕士学位论文基于物联网的物流路径规划与频繁路径挖掘的研究杨俊瑶学科专业 计算机应用技术指导教师 蒙祖强教授论文答辩日期 2014-05-25 学位授予日期答辩委员会主席 陈友初教授级高级工程师广西大学学位论文原创性和使用授权声明本人声明所呈交的论文,是本人在导师的指导下独立进行研究所取得的研究成果。除已特别加以标注和致谢的地方外,论文不包含任何其他个人或集体已经发表或撰写的研究成果,也不包含本人或他人为获得广西大学或其它单位的学位而使用

2、过的材料。与我一同工作的同事对本论文的研究工作所做的贡献均已在论文中作了明确说明。本人在导师指导下所完成的学位论文及相关的职务作品,知识产权归属广西大学。本人授权广西大学拥有学位论文的部分使用权,即:学校有权保存并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或其它复制手段保存、汇编学位论文。本学位论文属于:保密,在 年解密后适用授权。不保密。(请在以上相应方框内打“” )论文作者签名: 日期:指导教师签名:作者联系电话:日期电子邮箱:基于物联网的物流路径规划与频繁路径挖掘的研究摘要随着物联

3、网的普及,物联网逐渐应用于众多领域,其中之一是物流领域。在物流领域中路径规划直接影响着物流成本与物流过程中的时间消耗。由于物流中的物品本身带有实时的时空信息,这使得实时的路径规划与从物流数据中挖掘频繁路径成为可能。本文工作主要体现在两个方面。第一,针对基于物联网的物流网络中路径代价的时变性,建立了一种时间依赖的物流网络模型,并在此基础上研究了实时的物流路径规划问题。针对现实中预测准确性随时间推移而降低,以及在预知程度较低时无法获得较好的路径规划等问题,提出了一种带弧代价预知程度参数的最小时间路径算法 SWPL以及基于 SWPL实时的逐步规划的解决方案。该算法考虑了预测的精度问题,在传统 Dij

4、kstra算法的基础上引入了一种与时间相关的弧代价计算方法。实验表明在预知程度较高与在预知程度较低但采用逐步规划的解决方案都能取得良好的路径规划效果。第二,在基于物联网的物流中,会产生海量蕴含时空信息的物品移动数据。这些数据中包含着很多有助于提高物流科学管理的知识,目前从这些数据中找出这些有用的知识采用的主要是数据挖掘技术。其中频繁路径作为反映物流特征的重要知识之一,可为优化物流的路径规划、研究物流的变化规律等提供重要的参考信息。频繁路径的获取是通过频繁序列模式挖掘算法,本文根据物流网络及物流的特征设计了一种充分考虑物流网络I拓扑信息的频繁路径序列挖掘算法PMWTI。在该算法中引入了代价容忍度

5、剪枝法,用于候选路径序列的深度剪枝,以去除部分不可能是频繁路径序列的候选路径序列,在一定程度上降低了候选路径序列规模。实验表明,相比没有采用该剪枝方法的同等算法,PMWTI的频繁路径挖掘效率更高。本文工作可为科学的物流管理提供参考,提出的方法可用于物流中实时的路径规划、物流路由的优化、物流规律的发现等。关键词:最小代价路径路径规划频繁路径频繁模式数据挖掘IIRESEARCH ON LOGISTICS PATH PLANNING AND FREQUENT PATH MINING BASED ON INTERNET OF THINGS ABSTRACT As the popularization

6、of Internet of Things (IoT), IoT is widely used in many fields,one of them is logistics. In the field of logistics, path planning influences the expense andtime cost of logistics directly. As the things in logistics containing real time information ofspatial, it makes real time path planning and min

7、ing frequent path from logistics data possible.This paper works mainly in two aspects.First, for the costs of paths of logistics networks always varying with time, this paperproposes a time-dependent networks model, and then studies the real time logistics pathplanning problem based on it. For the p

8、redict accuracy decreases with time in reality, andwhen the predict level is low it is hard to get a good path planning result, we propose aminimum-time path algorithm with arc cost predict level parameter(SWPL) and a real timesolution with step by step strategy based on SWPL. This algorithm takes p

9、redict accuracy intoconsideration, introduces an arc cost compute method based on the traditional Dijkstraalgorithm. The experimental result shows that when the predict level is high or when thepredict level is low but adapted the step by step solution, we can get a good path planningresult.Second,

10、logistics based on IoT brings out a lot of moving data which contains spatialinformation. And a lot of knowledge which contains in these data can improve the scientificmanagement of logistics. And now, data mining is the main method to get some knowledgefrom these data. Frequent path as one of the i

11、mportant knowledge can provide importantreference information for optimizing logistics path planning and studying the variation oflogistics and so on. The frequent paths are gained by frequent sequence mining, so accordingto the feature of logistics and logistics networks, this paper provides a freq

12、uent path sequencemining algorithm PMWTI, which takes the topological information of logistics networks intoIIIconsideration. A cost tolerable degree pruning method used for the deep pruning of candidatepath sequences is introduced in this algorithm. This method discards some candidate pathsequences

13、 which couldnt be frequent path sequences, so it can downscale the candidate pathsequences. The experimental result shows that compared with the same algorithm which notadopts this pruning method, PMWTI has better mining efficiency.The work of this paper can support the scientific logistics manageme

14、nt, the methodprovided can be used in real time logistics path planning, logistics routing optimizing,logistics variation discovering and so on.KEY WORDS: minimum-time path algorithm; path planning; frequent path;frequent pattern; data miningIV目 录摘要.IABSTRACT. III第一章绪论 11.1研究背景及意义. 11.2国内外研究现状. 21.2

15、.1时间依赖网络中路径规划研究现状 21.2.2物流网络中频繁路径挖掘算法研究现状 41.3本文的研究内容. 61.4论文的结构. 7第二章路径规划与频繁路径挖掘概述 82.1时间依赖网络与最小代价路径算法. 82.1.1时间依赖网络的种类 82.1.2时间依赖网络中的最小代价路径算法 82.2频繁路径挖掘与频繁模式挖掘算法. 92.1.1频繁模式挖掘的相关概念. 92.1.2基于 Apriori 的频繁模式挖掘算法 92.1.3利用 Apriori 特性的剪枝方法 102.1.3提高基于 Apriori 的频 繁模式挖掘效率的两个方法 . 112.3本章小结. 13第三章基于物流网络模型的路

16、径规划算法 143.1引言. 143.1一种应用于物流领域的时间依赖网络模型. 143.2带预知程度参数的 SWPL算法 153.3基于 SWPL算法的路径规划 173.4实验分析. 173.5本章小节. 21第四章一种基于拓扑信息的物流频繁路径挖掘算法 224.1引言 224.2一种面向高效挖掘的物流路径数据模型 234.3基于物流网络拓扑信息的频繁路径挖掘算法 PMWTI 254.4实验分析 274.5本章小节 31第五章总结与展望 335.1本文的主要研究成果 335.2后续的研究工作 33参考文献 34致谢 39攻读学位期间发表的学术论文 39攻读硕士学位期间参加的科研项目 39V广西

17、大学硕士学位论文 基于物联网的物流路径规划与频繁路径挖掘的研究第一章绪论1.1研究背景及意义物联网(the Internet of Things, IoT)意指“ 物与物相 连而成的互联网”。它是建立在互联网基础上的一种网络,是互联网的一种扩展,其客户端延伸到了物品。因此它的基础与核心部分仍然是互联网,只是通信对象由人扩展到了其他物体1。物联网利用射频识别技术(Radio Frequency Identification, RFID)、全球定位系统(Global Positioning System,GPS)、激光扫描器(Laser Scanner)、红外传感器 (IR Sensor)等信息传

18、感技术,实现物品与互联网的连接,使得物品的识别、定位、追踪、监管成为可能。物联网这一概念的提出最早是在 1999年召开于美国的移动计算和网络国际会议 2上。2005年 11月,国际电信联盟(ITU)在突尼斯举行的信息社会世界峰会(WSIS )上发布ITU 互联网报告 2005:物联网,这宣告了物联网时代的正式到来。2007年 1月,欧洲 RFID研究项目组(Cluster of European RFID Projects)成立,并于 2008年 10月更名为欧洲物联网研究项目组(CERP-IoT)。该项 目组旨在实现所有欧盟斥资的物联网与 RFID相关科研的工作的统一与协调,并致力于其中科研

19、成果的分享与推广。2009年 1月,美国政府正式认可 IBM提出的建立于物 联网基础上的智慧地球这一概念,并称其为振兴国家经济、维持国际领先优势的重要战略手段。2009年 6月,欧盟委员会向欧盟议会、欧盟理事会等部门递交了欧盟物联网行动计划(Internet of Things-An actionplan for Europe)。2009年 8月,温家宝总理考察中科院无 锡高新微纳传感网工程技术研发中心后提出“ 感知中国”这一概念,指示尽快建立中国的 传感信息中心。2009年 9月我国工信部在相关会议上正式提出要加强物联网、传感网、传感中心等的相关研究与建设工作,扩大信息技术在工业领域的应用范

20、围,从而达到提高资源利用率的目的等。目前中科院、清华大学、北京大学、北京航空航天大学、复旦大学、中国标准协会、中国物品编码中心等国内科研部门在物联网相关技术方面进行了一定研究,并取得了初步成果。目前普遍认为,从以互联网为基础的“地球村” 转变到以物联网为基础的“智慧地球”又是一次革命性的变革。在世界信息产业中,物联网继计算机、互联网之后掀起第三次浪潮。物流(logistics),即物品的流动传输,是借助现代信息技 术与设备,将物品从发送地1广西大学硕士学位论文 基于物联网的物流路径规划与频繁路径挖掘的研究向接收地及时且可靠的输送的服务模式与流程3。目前,物联网技术已经开始用于物流领域,主要应用

21、于购买、库存、销售等,其主要手段无外乎利用完善与优化过的供应链管理体系,在保证物流效率的同时降低物流成本 4 。物流成本由物流管理、储存、流通加工、装卸、运输等活动所产生人力、物力成本组成。因此,通过合理的路径规划可以降低物流过程中产生的物流成本。在物流中根据物联网本身的特点设计相应的、良好的路径规划方案就显得尤为重要。随着物联网的逐渐普及,海量的物流数据也随之产生,在这些数据中蕴藏着各种知识。目前如何从海量的数据中找出感兴趣的知识,主要借助的技术是数据挖掘。通过使用数据挖掘技术,以计算机的强大处理能力代替人们有限的人工运作,使得从海量的数据中发现知识成为可能。具有时空特性的 RFID路径数据

22、是物流数据的主要组成部分,可以从这些 RFID路径数据中挖掘出频繁路径,其挖掘结果可为优化物流路由、研究物流规律等提供参考。本文对频繁路径挖掘算法的研究中受到了路径规划的启发,在频繁路径的挖掘中充分考虑了物流网络的拓扑信息,在一定程度的提高了频繁路径的挖掘效率。1.2国内外研究现状在本小节中将围绕论文的两个中心点的研究现状展开介绍。第一点是物流网络中的路径规划,第二点是物流网络中的频繁路径挖掘。其中第二点的相关研究是建立在第一点相关研究的基础上的,无论是算法的提出还是用于实验的数据集的生成。在此分两小节分别介绍这两中心点的研究现状。1.2.1时间依赖网络中路径规划研究现状因为路径代价受各种因素

23、影响,随着时间而改变,建立在物联网的基础上的物流路网与静态路网是不同的。而由于物联网的特点,在物流路网中的物品具有跟踪定位的特性以及其目的明确的特点等,因而可以较为实时的获悉物品的当前所在地点及其未来可能出现的方位,因而对物品在某一时间流经某一路径所花代价在一定程度上是能够预测的。这种路径代价随时间而改变的网络被称作是时间依赖网络(Time-DependentNetworks,TDN)。在时间依赖网络中,由于路径代价的时变性,使用 Floyd这种建立在整体动态规划基础上的算法是无法求出路网中两点的最小代价路径的,但这种网络的特点却很适合2广西大学硕士学位论文 基于物联网的物流路径规划与频繁路径

24、挖掘的研究Dijkstra算法。Dijkstra 算法的思想是逐一从余下节点中选择距出发点代价最低的节点加入,此时在加入节点之前的路径代价已知的基础上便可以把新加入节点路径代价的时变因素实时的考虑进来,从而可以求出整条路径的实际代价。因此 TDN中代价最小路径可以通过这种修改过的类 Dijkstra算法求出来。文献5详细的介绍了时间依赖网络,并将之分为了先入先出(FIFO)网络与非先入先出网络两类。其中 FIFO 网络可以直接使用这种类 Dijkstra算法6 来求最小代价路径,而非 FIFO 网络却无法直接使用这种类Dijkstra算法来获取最小代价路径,文献6 中忽略了 这一点。针对这个问

25、题 Kaufman 等人在文献7中 给出了一种更严谨的网络定义,在网络中加入相应的约束条件,使得满足约束条件的网络可以使用这种类 Dijkstra算法获取最小代价路径,这类网络在后来被称之为 FIFO 网 络。之后,关于非 FIFO网络及其中最小代价路径算法有不少相关研究。Orda等人在文献8 、9中给出了三种非 FIFO网络模型,分别是可等待模型、不可等待模型以及仅在出发点可等待模型,并给出了可等待模型与仅在出发点可等待模型中求最小时间路径的方法。文献5在进行 FIFO网络与非 FIFO 网络的定义之后,提出了算法SPTDN,解决了不可等待模型中求最小时路径的问题。弧代价的计算与预测问题是时

26、间依赖网络中至关重要的组成部分,其准确性对路径规划的结果有着非常大的影响。文献10在容许等待的情况下,计算出通过弧的最佳时间,得出弧上消耗的最低代价,将非 FIFO网络中的非 FIFO 弧转化为 FIFO弧。文献11对10中未考 虑到的特殊情况提出了相应的解决方法。在文献12所改进的 A 算法中,将交叉口延误及交叉口转弯系数等引入代价函数进行计算。文献13在信息熵理论的基础上,计算路径的综合属性值,从而在多属性随机 TDN中选择综合最优路径。文献14在较小时间段内路况近似不变的前提下给出了一种代价计算方法,将路径分成小段,求各小段对应速度的平均值,而各小段的速度则通过相关预测模型获得。文献15

27、中为了确定时间依赖旅行中的时间数据处理的最优内存分配,在准确度与内存使用中进行折中,提出了一种可变的时间离散策略,高方差、低均值的链路有必要进行更细的时间离散。文献16 提出了一种用于联合运输的城市交通网络的最佳路径算法,把私家车、公车、地铁、步行等各种交通方式考虑进去,其中使用了一种网络模型用于计算计算这些交通方式之间的中转时间代价。文献17在 TDN中使用一种利用实时信息的启发式算法来帮助旅行者适应变化的交通环境并做出好的路由选择,并发现对实时信息的价值来说,时间上的延迟比空间上的限制更具影响。这些方法都能在一定程度或某些情况下解决相应问题,但往往是建立在代价总是能通过某种方式准确得到的基

28、础上的。而在实际3广西大学硕士学位论文 基于物联网的物流路径规划与频繁路径挖掘的研究情况中对代价预测的准确性会随着时间的推移而降低,从而难以得到较为理想的路径规划结果。对此本文提出了一种带预知程度参数的最小时间路径算法 SWPL,并在该算法的基础上研究路径规划问题。1.2.2物流网络中频繁路径挖掘算法研究现状频繁路径的挖掘使用的是频繁序列模式挖掘算法。频繁路径挖掘的相关研究都是建立在传统的频繁序列模式挖掘算法之上的,通过对这些频繁序列模式挖掘算法的修改使之适合于频繁路径的挖掘。在介绍频繁路径挖掘的相关研究之前先简单介绍下序列模式挖掘算法的研究现状。相关研究大致可分为如下几个方向:1)类 Apr

29、iori频繁序列模式挖掘算法。早期的序列模式挖掘算法大抵脱胎于文献18中给出的关联规则挖掘算法 Apriori。该算法中候选集的剪枝用到了一个重要的理论:一个模式频繁的前提是其所有子模式都是频繁的,即如果任何一个子模式是不频繁的,则该模式不可能频繁。在该理论的基础上,派生出了一系列诸如 AprioriSome、DynamicSome、AprioriAll等的类 Apriori算法。之后,文献19在 AprioriAll算法的基础上引入了时间约束、滑动窗口、概念分层等处理方法,给出了算法 GSP(GeneralizedSequential Pattern)。文献20给出了基于算法 GSP的算法

30、MFS(mining frequent sequence)。MFS的候 选集是通 过连接所有已知频繁序列获取的,而不拘泥于单单从频繁 K 序列获取候选 K+1序列,不用像 GSP那样扫描数据库的次数由最长的频繁序列决定,减少了数据库的 I/O开销。文献21给出了与 GSP 算法相似的 SPIRIT 算法,该算法引入了正则表达式来对挖掘进行约束,在一定程度上减少了不感兴趣的模式的挖掘。文献22将概念分层、时间、结构等约束条件集成起来,并给出了相关阈值设定方法功能序列模式获取方法,从而提出了一个序列模式挖掘较为通用的框架。2)基于分治思想的频繁序列模式挖掘算法。文献23提出了一种采用垂直数据库的S

31、PADE算法, 该算法利用了序列格方法 对搜索空间进行分解,使挖掘能于主存中解决。之后,一系列采用数据库投影技术的挖掘算法被提了出了。这些算法有基于模式增长的FreeSpan24、PrefixSpan25,及结合了图模式增长 用于挖掘结构化模式的算法 gSpan26 。文献27给出了一种使用哈希函数的方法检测是否存在重复的数据库伪投影的 SPMDS算法,减少了对数据库的扫描。此外,针对不能一次读入内存的较大的数据库,文献284广西大学硕士学位论文 基于物联网的物流路径规划与频繁路径挖掘的研究给出了一种基于内存索引的挖掘算法 MEMISP(Memory Indexing for Sequenti

32、alPatternmining)。3)多维度频繁序列模式挖掘算法。文献29阐述了多维频繁序列模式挖掘的思想,在序列之一维度上又引入了非序列信息维度进行约束,并提出了一些挖掘方法,以挖掘具有多维度属性的频繁序列模式。4)增量式频繁序列模式挖掘算法。一些学者针对序列数据库随着时间的推移而逐渐加入新的数据使频繁序列产生变化的情况,在原有的序列模式挖掘算法的基础上,给了相关增量式挖掘算法。比如基于 GSP30、MFS30、SPADE31等的增量式频繁模式挖掘算法。文献32 给出了一种基于投影技术的序列模式挖掘算法。文献 33中给出一种 IncSpan算法,引入了共享投影、逆向匹配、近似频繁模式等思想。

33、在序列模式挖掘算法中有的学者引入了分布式的思想 34,有的引入了模式图的概念 35。此外,在文献36、37等对增量试序列模式挖掘中有相关研究。5)周期模式挖掘算法。周期模式挖掘38-41 作为序列模式挖掘的扩展,旨在从数据库中找出再现模式。文献38提出了单周期模式与双周期模式的概念并给出了相应的挖掘算法。文献39 针对数据随着时间而变更的情况,给出增量式的周期模式挖掘算法。文献40、41介绍了在因干 扰而可能影响挖掘结果的噪声环境下的周期模式挖掘算法。文献42给出的 MOWCATL算法用于找出周期性序列的事件相关模式。序列模式挖掘在物流领域已经有不少的相关应用,相关研究工作主要集中在物流中频繁

34、路径序列的挖掘上,该方面的研究又主要集中在 RFID数据仓库模型与频繁路径挖掘算法上。在数据仓库模型方面,文献4344 中给出了 RFID-CUBOID 数据模型,该模型中,物品的属性信息与位置信息相分离,成为相对独立的两部分,同时在数据立方体中引入了路径信息。RFID-CUBOID根据物品批量流动的特点,优化了的位置记录方法与路径选取方法,同时对数据进行除错、压缩、整合等处理,在维持原有路径数据的基础上,有效的降低了 RFID数据规模。在频繁路径挖掘算法方面的研究主要集中在这些方面:传统频繁序列模式挖掘算法在频繁物流路径挖掘上的应用、分布式的频繁物流路径挖掘、多维度的频繁物流路径挖掘等。在文

35、献45中作者提出了一种 GSP 算法的改进算法 ImGSP,用于挖掘频繁物流路径5广西大学硕士学位论文 基于物联网的物流路径规划与频繁路径挖掘的研究序列,该算法主要的改进思想是通过序列的长度限制,删减一些不用搜索的序列,从而在一定的程度上降低了数据集的规模。在文献46里通过对传统关联规则改进,并提出了频繁装卸点、频繁直达(转运)路径等物流中频繁模式挖掘相关概念,在这些基础上结合物流数据的时空属性,挖掘 RFID物流数据中的非平凡模式,为科学的管理物流与优化物流线路提供可靠及时的决策依据。在 RFID物流数据挖掘中的数据储存方式及相关频繁物流路径挖掘算法的研究方面,文献47给出了一种分析处理操作

36、是基于图的联机框架,其中物品流动的路径信息以图的方式表示,文献中作者给出了频繁子图挖掘算法 RFSM,该 算法从用户给定维值的图集上挖掘 RFID频繁图,而不是在整个图集上进行挖掘。在文献48 中作者主要在多维 RFID频繁路径挖掘、单机环境下 RFID频繁路径挖掘、分布式环境下的 RFID频繁路径挖掘等几方面做了相关研究,其中还利用路径编码的方法压缩 RFID路径数据。在文献49针对 EPC网络中 RFID数据的特点设计了适用于 EPC网络 ,且利于从中进行频繁路径挖掘的 RFID路径数据模型,作者在该数据模型的基础上,给出了一种基于增长模式的 RFID频繁路径挖掘算法 FPM,并在 FPM

37、算法的基础之上根据供应链多层级的结构特点,给出了一种多级支持度的 RFID频繁路径挖掘算法 MSFPM,此外作者还给出了一个频繁路径挖掘框架。以上关于频繁路径挖掘研究都是借鉴现有频繁序列挖掘算法的思想,将 RFID数据中的位置序列转化为传统的事务序列形式再进行路径挖掘,在算法的优化与改进上虽然也会考虑物流数据的特点,但却忽略了物流网络的空间性质。除了利用传统的 Apriori特性(即频繁模式的子模式必然频繁)对候选集进行剪枝外,还可以利用物流网络的拓扑结构的特点设计相应的剪枝算法对候选集作更进一步削减,从而提高算法效率。本文在传统的 Apriori 算法的基 础上,设计了 PMWTI( Pat

38、h Mining With Topology Information)这一频繁序列模式挖掘算法,来进行频繁路径挖掘。在 PMWTI中生成候选集时借助了物流网络拓扑信息,在利用 Aprori特性进行剪枝的基础上更进一步的去掉了不可能频繁的序列,在一定程度上减小了候选集规模,从而提高了挖掘效率。1.3本文的研究内容首先,本文针对物流网络中路径代价的时变特点,建立了一种相应的时间依赖的路网模型;然后,在此模型的基础之上针对时间依赖网络中路径代价预知准确度影响路径规划效果这一问题提出 SWPL算法及与之配套的解决方案。之后利用建立在 SWPL算6广西大学硕士学位论文 基于物联网的物流路径规划与频繁路径

39、挖掘的研究法的基础上的算法获取路径代价不超过一定范围(与最小路径代价相比)的所有路径,从而模拟生成物流数据集,为之后的频繁路径挖掘算法的比较实验提供实验数据。在对物流网络的频繁路径挖掘算法的研究中,首先,针对物流数据的特点建立了一种用于高效挖掘频繁路径的物流数据模型;然后,提出了一种引入物流网络拓扑信息的频繁路径挖掘算法 PMWTI。其中,物流网络中建立在其拓扑信息上的路径规划问题为频繁路径挖掘提供了新的思路,即在物流网络的频繁路径挖掘算法中充分考虑了被传统的频繁路径挖掘算法所忽略的物流网络的拓扑信息,利用物流网络的拓扑信息对候选序列进行更进一步的剪枝,从而比没有采用该剪枝方法的传统频繁路径挖

40、掘算法拥有更好的挖掘效率。1.4论 文的结 构本文分为五章,各章大致内容如下:第一章,绪论部分。首先引出了物联网的概念,介绍了物联网在物流领域的应用,并指出了物流领域中路径规划与频繁路径挖掘意义,然后对这两个方向国内外的研究现状进行了综述性的分析,并提出了本文的主要研究内容。第二章,物流网络中路径规划与频繁路径挖掘的概述部分。第三章,本文对物流网络的路径规划问题进行研究的部分。其中首先建立了一种时间依赖的物流网络模型,然后在该模型的基础上研究了路径规划算法 SWPL。第四章,本文对物流网络中频繁路径挖掘的研究部分。其中首先建立了一种利于高效挖掘频繁路径的物流数据模型,然后提出了一种利用物流网络

41、拓扑信息的频繁路径挖掘算法。第五章,总结与展望部分。总结本文的相关研究工作,并对未来的研究工作做出相关展望。7广西大学硕士学位论文 基于物联网的物流路径规划与频繁路径挖掘的研究第二章路径规划与频繁路径挖掘概述2.1时间 依赖 网络与最小代价路径算法2.1.1时间依赖网络的种类为了从时间依赖网络中获取最小代价路径,国内外相关研究主要致力于基于时间依赖网络的两类网络模型,这两种模型在文献5中分别被归类为 FIFO网络与非 FIFO 网络。所谓 FIFO网络即是一种先 进先出(First In First Out)网络,该网络上的弧的代价变化满足条件s 0,t,Cost(i, j, t) Cost(

42、i, j, t+s) + s,其中 t 与 s表示时间,i 、j表示弧所连接的两个结点,Cost(i, j, t)表示连接结点 i、j的弧在时间 t 时的时间消耗代价。不满足这种约束条件的弧称为非 FIFO弧,存在至少一条非 FIFO 弧的网络称为非 FIFO网络。通俗点讲 FIFO网络中的任意一条路径上先出发的必定不会比后出发的晚到达目的地。2.1.2时间依赖网络中的最小代价路径算法FIFO网 络中求解最小代价路径的算法是基于 Dijkstra 算法的类 Dijkstra 算法,而非FIFO网 络虽然不能直接使用这类算法求最小低价路径,但却可以能过一些手法将非FIFO网 络转化 为 FIFO

43、 网 络,从而进行求解。因此,本文在此只 讨论 FIFO网络中求解最小代价路径的一般算法。Dijkstra算法的思想很简单,将网络中节点分为两类,其中一类为已经求解出最小代价路径的节点,在此记为 A类,另一类为未求解出最小代价路径的 节点,在此记为 B类。初始阶段 A类节点中只有一个起始节点,在此 记为点 S。B类节点为网络中其余所有节点,其中每个节点都有一个从点 S到该节点的最小代价(记为 MIN) 的初始值,初始值的赋值方法为,如果与 S直接相邻则赋以邻接弧的代价,如果不与 S 直接相邻,则赋为无穷大(或某一表示无穷大的值)。赋完初值后,如果都为无穷大则算法结束,此时 B类节点为从 S 点

44、出发所不能抵达的点,否 则逐一从 B类节点中选取值最小的节点加入 A中,并更新 B类节点的 MIN值。MIN值的更新方法为,先判断该节点是否与新加入 A中的节点是否相邻,不相邻则不更新,否则比较该节点的 MIN值与 A中新加入节点的MIN值加上邻接弧代价所得值的大小,如果前者小于后者则不更新,否则将该节点的MIN值更新为后者。如此逐一将 B类节点加入 A类中,直到 B类节点为空或 MIN值都8广西大学硕士学位论文 基于物联网的物流路径规划与频繁路径挖掘的研究为无穷大,算法结束。正因为 Dijkstra算法的这种逐一加入节点并“ 实时” 的更新从 S 点到 B类节点的最小代价的特性,使得本来只能

45、用于静态路网(即网络中各弧的代价不随时间变化)的该算法只要稍加改动就可以用于时间依赖网络中。该改动方法就是在更新某节点的 MIN值时,通过从节 S 点到新加入 A中的节点所用时间可以求出此从新加入节点到要更新 MIN值的节点的那条弧的代价,从而就可以得出从 S点经由新加入的节点到当前要 MIN值节点的代价。2.2频 繁路径挖掘与 频繁模式挖掘算法2.1.1频繁模式挖掘的相关概念为方便后文的描述,本文在此先介绍几个频繁模式挖掘的相关概念。项集:项的集合,包含 k个项集的集合称为 k项集,例如,包含 A 、B 、C三个项的集合称为 3项集,记为 ABC。序列:项集中的项按一定顺序排列形成序列,k序

46、列即 k个项的排列。例如包含 A 、B、C三个项 ,且其顺序为 B、C 、A的序列称为 3序列,记为 BCA 。其中拥有相同的项,但项的顺序不同的序列是不同的序列。例如,记 3序列 ABC与 3序列 BAC 是不同的序列。支持度:数据集中某项集(序列)出现的频度,以百分比或小数表示。比如一百条数据集中某项集(序列)出现了十次,则记其支持度为 10%或 0.1。最小支持度:即数据集中项集(序列)的支持度的最低要求。频繁模式:支持度大于等于最小支持度项集(序列),也称作频繁项集(序列)。路径序列:序列中的项表示地点的序列,例如 A、 B、C表示三个地点,从 B到 C再到 A的序列即为一条路径序列,

47、记为 BCA。频繁路径:支持度满足最小支持度的路径序列。候选集(序列):可能成为频繁模式的项集(序列)。2.1.2基于 Apriori 的频繁模式挖掘算法频繁路径挖掘是一种序列模式挖掘,序列模式挖掘算法提及最多的要数 Apriori(也有部分基于 FP-Growth,不过本文在此只介绍 Apriori)。万变不离其宗,无论是频繁项集挖掘还是频繁序列挖掘,这类算法都要用到 Apriori算法的一条重要性质,即任何频繁9广西大学硕士学位论文 基于物联网的物流路径规划与频繁路径挖掘的研究模式的子模式都是频繁模式,该性质是其中候选集生成时剪枝的重要理论依据。此外,这类基于 Apriori 的算法都走一

48、个通用的流程。首先获取候选 1项集(序列,如果是序列模式挖掘的话),然后扫描数据集找出其中的频繁 1项集(序列),然后将这些频繁 1项集(序列)按一定方式构成候选 2项集(序列),其中利用 Apriori的上述性质对候选集进行剪枝,以确保其中各项集(序列)的子集(子序列)都在已知的频繁 1项集(序列)里,然后通过扫描数据集获取频繁 2项集(序列),然后在频繁 2项集上的基础上如法炮制的获取频繁 3项集(序列),如此逐渐获取更长的频繁项集(序列),直至再也找不出新的频繁或候选模式为止。2.1.3利用 Apriori 特性的剪枝方法基于 Apriori的 频繁模式挖掘算法中 对候选项集的剪枝方法可

49、以如此描述:首先,通过频繁 K项集获取一个初级候选 K+1项集,获取方式为将两个频繁 K项集进行组合,如果存在交集,且交集为 K-1项集,则可组合为 K+1 项集。在算法的实现中,如果项集是有序的,以 3项集为例,我们称 ABC、ABD、ABE、BCD 、BCE、BDE、CDE这种是有序的,排序方式为类似串比较中的 ASCII码的大小,在这种情况下可以很快的获取初级候选集。获取方法为,从第一个项集开始,依次与其后的项集进行连接,但限制条件是两个连接项集的前缀是相同,只有末尾字符不同,如 ABC只与ABD、ABE等连接,而不与 ACD、BCD等进行连接操作。虽然也符合连接的基本要求,但连接生成的 4项集可能与之前连接生成的 4项集重复,且如果没有之前的连接,则意味着缺少子集,连接生成的 4项集不可能是频繁的,这样连接生成的初级候选集已经经过了一次基于 Apriori 特性的剪枝。如此,一旦遇到前

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 实用文档 > 解决方案

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报