收藏 分享(赏)

基于AIS信息的船舶轨迹聚类模型及应用_肖潇.pdf

上传人:精品资料 文档编号:10347144 上传时间:2019-11-02 格式:PDF 页数:5 大小:724.92KB
下载 相关 举报
基于AIS信息的船舶轨迹聚类模型及应用_肖潇.pdf_第1页
第1页 / 共5页
基于AIS信息的船舶轨迹聚类模型及应用_肖潇.pdf_第2页
第2页 / 共5页
基于AIS信息的船舶轨迹聚类模型及应用_肖潇.pdf_第3页
第3页 / 共5页
基于AIS信息的船舶轨迹聚类模型及应用_肖潇.pdf_第4页
第4页 / 共5页
基于AIS信息的船舶轨迹聚类模型及应用_肖潇.pdf_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、第 38 卷 第 2 期2015 年 6 月中 国 航 海NAVIGATION OF CHINAVol38 No2Jun 2015收稿日期 : 2015-02-21基金项目 : 福建省教育厅科技计划项目 ( JB11103) ; 浙江省交通厅科技项目 ( 2012W14)作者简介 : 肖 潇 ( 1988) , 男 , 福建三明人 , 硕士生 , 研究方向为交通信息工程及控制 。E-mail: xiaoxiaojmei163 com邵哲平 ( 1964) , 男 , 福建福州人 , 教授 , 博士 , 船长 , 研究方向为交通信息工程及控制 、航海技术 。E-mail: zpshao jmu

2、edu cn文章编号 : 1000 4653( 2015) 02 0082 05基于AIS信息的船舶轨迹聚类模型及应用肖 潇1, 邵哲平1, 潘家财1, 2, 纪贤标1, 2( 1 集美大学 航海学院 , 福建 厦门 361021; 2 厦门大学 信息科学与技术学院 , 福建 厦门 361011)摘 要 : 为获得船舶典型的运动模型 , 及时发现船舶异常轨迹并对其进行有效监控和管理 , 进而实现海上智能交通 , 基于船载 AIS 蕴藏着大量的海上交通特征的特点 , 从中获取能够反映船舶行为规律的有效的 、潜在的信息 。根据海上交通工程理论和数据挖掘技术 , 利用 AIS 信息并结合轨迹聚类算法

3、 , 完成对已有轨迹的聚类 , 从中获取船舶典型的运动轨迹 。以厦门港主航道及闽台直航船为实例 , 通过构建相应的 AIS 数据库并对船舶轨迹进行聚类结果展示 , 获得该海域船舶典型的运动轨迹 。关键词 : 水路运输 ; 船舶自动识别系统信息 ; 数据挖掘 ; 轨迹聚类中图分类号 : U6757; TP391 文献标志码 : AShip Trajectory Clustering Model Based on AIS Data and its ApplicationXIAO Xiao1, SHAO Zheping1, PAN Jiacai1, 2, JI Xianbiao1, 2( 1 Nav

4、igation College, Jimei University, Xiamen 361021, China;2 School of Information Science and Engineering, Xiamen University, Xiamen 361011, China)Abstract: To monitor the traffic and timely find abnormal ship trajectory is important for intelligent maritime traffic manage-ment In order to do this, to

5、 know the typical ship motion trajectory is the premise Huge AIS data collected from shipbroadcasts contain the information we need The typical ship trajectory from AIS information is determined by means of thetrajectory clustering algorithm according to the marine traffic engineering theory and dat

6、a mining techniques The trajecto-ries of direct navigating ships between Fujian and Taiwan on the main channel of Xiamen are processed to show the feasibili-ty of proposed methodKey words: waterway transportation; AIS information; data mining; trajectory clustering陆上交通主要利用视频实时监控车辆的位置信息 , 通过聚类方法提取运动目

7、标的典型运动模式 , 进而检测出异常的交通行为 。 1-2空中交通主要对历史航迹进行聚类 , 从中找出适应当前空中流量的飞行中心轨迹 , 进而改善终端区进离场航线的组织规划 。 3相比较而言 , 海上交通目前主要是针对飓风轨迹数据 , 利用聚类算法从看似无序的数据中发现轨迹数据之间的共性 , 进而为预测飓风轨迹提供依据 。 4-5近年来 , 随着国内水运量和国际贸易不断扩大 ,海上交通量迅猛增长 , 海上交通环境日益复杂 , 船舶在生产活动中产生的时空轨迹越来越多 , 从海量的轨迹数据中挖掘出有用信息已非人力所能及 。同时 , 巨大的交通压力对交通控制和管理提出了更高的要求 , 迫切需要提高交

8、通信息系统的智能化水平 。在该背景下 , 以海上交通工程 6为理论基础 ,利用船舶自动识别系统 7-8( Automatic IdentificationSystem, AIS) 信息中蕴含着大量海上交通特征的特性 , 结合数据挖掘技术 9, 对船舶的轨迹进行聚类 ,从中提取出船舶运动特征规律 , 进而将轨迹分成不同的 、具有相似运动规律的对象组成的子集 , 并通过典型特征轨迹表示轨迹聚类信息 。该研究是分析和预测对象运行行为 、正确规范船舶行为 、及时发现并处理船舶轨迹异常行为的前提条件 , 可为下一步实现智能船舶交通管理系统 ( Vessel Traffic Service,VTS) 监控

9、船舶行为打下坚实的基础 。1 相关方法介绍11 主要的聚类算法选用哪种聚类算法取决于数据的类型 、目的和应用 。主要的聚类算法大体上可分为 : 划分方法( Partition Method) 、层次方法 ( Hierarchical Method) 、基于密度的方法 ( Density-Based Method) 、基于网格的方法 ( Grid-Based Method) 和基于模型的方法( Model-Based Method) 等 。对应上述算法的比较有代表性的具体算法有 : K-Means 方法 、BICH 算法 、DBSCAN 算法 、STING 算法和统计学习方法 。12 度量轨迹间

10、的相似性方法度量轨迹间的相似性是实现聚类的基础 , 目前采用的方法主要有 : Euclidean 距离 、Hausdroff 距离 、最小外包矩形距离 、最长公共序列 ( LCSS) 、主成分分析 ( PCA) 、动态时间规整 ( DTW) 、隐马尔科夫模型 ( HMM) 等 。在度量轨迹间相似度时 , 要根据具体的应用对象来选择不同的度量方式 。2 基于 AIS 信息的轨迹聚类模型21 轨迹聚类总体流程基于 AIS 信息的船舶轨迹聚类算法流程见图 1。图 1 基于 AIS 信息的船舶轨迹聚类算法流程22 AIS 信息的采集与预处理221 AIS 信息的采集定时从 AIS 数据接收服务器中取出

11、所需的 AIS信息报文文件 , 运用 AIS 信息解码模块实现信息解码和数据入库 , 并在数据库中预处理 , 删除使用前的无效数据 , 以使得到的 AIS 信息基本表更加有效 。222 AIS 信息的预处理预处理的主要工作有 : 删除动态信息表中海上移动 业 务 标 识 ( Maritime Mobile Service Identity,MMSI) 为 0 的记录 ; 删除明显错误的 AIS 数据 ( 如出现负值 , 速度 100 kn, 经度 180, 纬度 90等 ) ;根据 AIS_NAME 表删除超过研究水域范围的记录等 。基于导入的原始数据建立数据库 , 围绕一些主题进行数据建模与

12、分析 。23 船舶轨迹聚类算法231 轨迹聚类方法的选取目前 , 轨迹聚类的应用对象主要有以下 2 种 。( 1) 将整条轨迹作为目标的聚类方法 , 如文献 1 和文献 2 所述 , 该方法会存在轨迹较长 、时间和空间开销较大 、丢失一些相似的轨迹子段等问题 ;( 2) 对轨迹进行划分 , 将轨迹子段作为目标的聚类方法 , 如文献 4 和文献 5 所述 , 运用该方法可能无法完全获取整条轨迹的特征 , 但能较好地把握轨迹子段的特征 , 且综合各子段的特征也能较好地对整条轨迹的特征进行描述 。因此 , 采取轨迹分段的方法对船舶轨迹进行聚类 。232 轨迹划分船舶的动态信息通常 2 180 s 广

13、播一次 , 具体时间隔取决于航速和航向变化率 。 7-8因此 , 采集到的 AIS 数据量可能比较庞大 , 做到既能有效降低船舶轨迹中 AIS 的记录点数又能保留轨迹的原始特征是轨迹划分阶段的重要工作 , 即对轨迹进行划分应保持原有轨迹的精确性与简洁性 。( 1) 精确性要求得到的子轨迹与原始轨迹之间的差别尽可能小 , 将所有的航向变化率 、航速变化率大于某一阈值的点选为特征点 ;( 2) 简洁性要求得到的子轨迹的数量应尽可能少 。图 2 中 , 假设轨迹点 P1 P8为 AIS 采集到的位置点 , 实线为原始轨迹 , 虚线为划分后的轨迹 。此时若将 P1 P8中的所有点都选为特征点 , 则轨

14、迹精确度将达到最高 , 但是开销的时间将会很大 ; 若只将P1-P5-P8部分点归为特征点 , 则轨迹将获得较好的简洁度 , 但丢失了原始轨迹的特征 。因此 , 为使轨迹划分的精确性和简洁性达到最佳的平衡状态 ( P2-P4-P6-P8) , 主要分为 2 个过程对轨迹进行划分 。图 2 轨迹划分实例38肖 潇 , 等 : 基于 AIS 信息的船舶轨迹聚类模型及应用2321 获取特征点候选集先将起点 P1和终点 P8选入候选集中 , 然后利用文献 10 中所述的方法计算 , 具体为式 ( 1) 。航向或航速变化率 =相邻时间航向或航速差值相邻时间间隔( 1)根据式 ( 1) 便可计算出上述每个

15、点的航向或航速变化率 , 利用事先设定好的阈值 , 将大于阈值的轨迹点也选入特征点的候选集中 。阈值的设定既不能太大也不能太小 。太小容易丢失轨迹的重要特征细节 , 太大则很容易只将轨迹的突变或由采样导致的异常包含进来 , 使得聚类结果不佳 。2322 确定最终特征点利用上述步骤获取的特征点还不是最简洁的 ,因为 P1 P8可能都会被选入候选集中 。为更好地平衡轨迹划分的精确性和简洁性 , 利用最小描述长度准则 3-4, 11-12( Minimum Description Length, MDL)进一步筛选上述候选集 。MDL 开销由 L ( H) 和L( D/H) 组成 , 假设给定某条轨

16、迹 Tri= p1, p2, ,pn , 划分后的特征点集为 P = pc1, pc2, , pck , 组成的轨迹为 Tri= pc1, pc2, , pck , 则具体计算公式为L( H) =k1j =1log2 len( pijpij+1) ( 2)L( D/H) =n1x =1k1y =1 log2 d( pxpx+1, pypy+1) +log2 d( pxpx+1, pypy+1) ( 3)式 ( 2) 式 ( 3) 中 : H 为假设条件 ; D 为所要描述的数据 ; L( H) 为假设条件的开销 ; L( D/H) 为在 H 这种假设条件下数据 D 的开销 ; len( ) 为

17、轨迹的总长度 ; d( ) 为线段之间的垂直距离 ; d( ) 为线段之间的角度距离 。从式 ( 2) 和式 ( 3) 中可看出 : L( H) 越大 , 表示选取的特征点越多 , 与原轨迹越接近 , 但 L( D/H) 越小 ; L( H) 越小 , 表示选取的特征点越少 , 轨迹越简洁 , 但 L( D/H) 越大 。当 L( H) 与 L( D/H) 之和最小时 , 即运用 MDL 准则找到了一个全局最优结果 。233 轨迹相似度的度量船舶接收到的 AIS 数据蕴含着丰富的信息 ( 如位置 、航向 、航速等 ) , 在轨迹相似度度量中应充分考虑 , 以提高准确度和分析效果 。此处定义的轨

18、迹子段结构主要包括位置 、航向 、航速等 3 个信息 。2331 位置与航向信息度量 3-4, 11图 3 中 : Lj和 Li为 2 段子轨迹 Lj和 Li; sj, ej和si, ei分别代表 2 个子轨迹的起点和终点 ; sj, ej为sj, ej在 Li上的投影点 , 包含位置与航向特征的轨迹子段空间距离 , 由水平距离 d, 垂直距离 d和角度距离 d等 3 部分组成 , 具体定义为d( Li, Lj) = Min( l1, l2) ( 4)d( Li, Lj) =l21+ l22l1+ l2( 5)d( Li, Lj) =min( Li, Lj) sin 0 90min( Li,

19、Lj) 90 180( 6)图 3 轨迹段之间距离2332 航速信息度量船舶在海上与他船会遇或避开障碍物等时 , 航速的控制往往是不一样的 ; 即使是在同一航道中航行 , 进港与出港船舶的航速控制也可能不一样 。因此 , 利用 dspeed( Li, Lj) 对轨迹子段的速度差异进行比较 , 具体定义为式 ( 7) 。dspeed( Li, Lj) = | VLi VLj| ( 7)2333 综合度量得到式 ( 4) 式 ( 7) 的 4 种距离后 , 定义相应的权值 W = w, w, w, wspeed , 并满足 : 所有权值取值均 0, w+ w+ w+ wspeed=1。随后分别乘以

20、各自权值并求和 , 即可得到轨迹子段包含位置 、航向 、航速信息的空间距离公式Ddist, 即Ddist( Li, Lj) = wd( Li, Lj) + wd( Li, Lj) +wd( Li, Lj) + wspeeddspeed( Li, Lj) ( 8)234 轨迹聚类基于密度的聚类方法能够发现任意形状的簇 ,该方法运用对区域密度的连通性来聚类 , 因此可发现密度相对较小的区域的噪声 。其中 , DBSCAN 13( Density Based Spatial Clustering of Applications withNoise) 为最典型的密度聚类方法 , 对象主要为点 , 通常

21、运用该方法计算核心对象时 , 搜索区域是以该对象为圆心 , 半径为 , 密度阈值为 minPts 的圆心区域( 见图 4) 。通过对比文献 4 、文献 5 、文献 11和文献 14 可发现 , 基于 DBSCAN 的轨迹段聚类方法与典型的 DBSCAN 聚类方法有类似之处 , 在计算轨迹段核心对象时 , 将距离为 , 密度阈值为 minLns的外包椭圆作为搜索区域来获取 ( 见图 5) 。48 中 国 航 海 2015 年第 2 期图 4 DBSCAN 聚类示例图 5 核心对象搜索区域对比相关定义为( 1) 给定轨迹子段 Li的数据空间 D( LiD) , Li的邻域由所有与其空间距离不超过

22、的轨迹构成 ,具体定义为N( Li) = LjD | Ddist( Li, Lj) ( 9)( 2) 给定轨迹子段 Li的数据空间 D( LiD) , Li为核心轨迹的条件为 : Li关于 和 minLns 满足式 ( 10) , 即| N( Li) |minLns ( 10)( 3) 给定轨迹子段 Li的数据空间 D( LiD) ,如果 Li在 Lj的 邻域范围内且 Lj满足式 ( 9) 和式 ( 10) , 则称轨迹 Li为 Lj直接密度可达 ;( 4) 给定轨迹子段 Li的数据空间 D( LiD) ,如果存在 L1, L2, L3, , Li, , Ln( 1in) , 使得所有 Li

23、+1从 Li出发都是关于 和 minLns 直接密度可达的 , 则称 Ln为 L1密度可达 ;( 5) 给定轨迹子段 Li和 Lj的数据空间 D( Li,LjD) , 如果存在 LkD, 使得 Li和 Lj从 Lk出发都是关于 和 minLns 密度可达的 , 则称 Li和 Lj为密度相连 。235 典型运动轨迹的获取经过上述计算后 , 将不同的轨迹段归入相应的簇中 , 并对簇中所有的轨迹段位置 ( 即经度和纬度 ) 、航向 、航速取平均值 , 此时即可获得船舶典型运动轨迹 。3 实例研究31 厦门港主航道轨迹聚类挂靠厦门港的船舶主要为 1 万 TEU 左右的集装箱船 。为方便研究 , 以最靠

24、近主航道的嵩屿港集装箱码头为研究对象对船舶轨迹进行聚类 , 选取2013 年 6 月 1 日至 4 日的数据 。根据条件并滤除错误数据 , 可从数据库中找到符合上述条件的有效船舶 AIS 数据 13 603 条 , 经轨迹划分 , 获得 222 段轨迹 子 段 。进行多次试验后发现 , 当 =0002 n mile, 密度阈值为 minLns = 4 时 , 能获得较理想的数据结果 。聚类结果见图 6, 其中 : 线条“”为船舶原始轨迹 , “”为获得的船舶典型运动轨迹 。试验结果表明 : 获取的船舶典型运动轨迹与目前厦门的航道设置相统一 , 试验结果可信 。图 6 厦门港主航道轨迹聚类结果3

25、2 闽台直航船舶轨迹聚类与厦门港不同 , 目前闽台直航船舶还未在台湾海峡设立浮标及相应航道 , 从中获取轨迹相似段对未来的研究具有重要意义 。这里将 “中远之星 ”作为主要研究对象 , 根据条件并滤除错误数据 , 可从数据库中得到符合上述条件的有效船舶 AIS 数据136 347条 , 经轨迹划分后 , 获得 2 103 段轨迹子段 。进行多次试验后发现 , 当 = 0003 n mile, 密度阈值为 minLns =3 时 , 能获得较理想的数据结果 。聚类结果见图 7, 其中 : 线条 “”为船舶原始轨迹 ,“”为获得的船舶典型运动轨迹 。图 7 中远之星轨迹聚类结果4 结束语基于 AI

26、S 数据 , 通过对船舶轨迹段进行聚类 , 获得了船舶典型的运动模型 , 并以通过厦门港主航道58肖 潇 , 等 : 基于 AIS 信息的船舶轨迹聚类模型及应用的集装箱船和闽台直航船 “中远之星 ”为实例进行了相应研究 。该研究仅获取了船舶典型运动模型 ,如何利用此结果进行船舶异常行为研究将是下一步的主要研究方向 。参 考 文 献 1 闻佳 , 崔维 实时视频中的车辆运动轨迹的提取和聚类 J 计算机工程与应用 , 2010, 46( 11) : 155-157 2 曹妍妍 , 崔志明 , 吴健 , 等 一种改进 Hausdorff 距离和谱聚类的车辆轨迹模式学习方法 J 计算机应用与软件 ,

27、2012, 29( 5) : 38-40 3 王超 , 王明明 , 王飞 基于改进的模糊 C-Means 航迹聚类方法研究 J 中国民航大学学报 , 2013, 31( 3) : 14-18 4 LEE J, HAN J, WHANG K Trajectory Clustering: APartition-and-Group Framework C ACM SIGMOD In-ternational Conference, on Management of Data, 2007 5 袁冠 , 夏士雄 , 张磊 , 等 基于结构相似度的轨迹聚类算法 J 通信学报 , 2011, 32( 9) :

28、 103-109 6 吴兆麟 , 朱军 海上交通工程 M 2 版 大连 : 大连海事大学出版社 , 2004: 10-11 7 孙文力 , 孙文强 船载自动识别系统 M 大连 : 大连海事大学出版社 , 2004: 1-10 8 国际海事组织 通用船载自动识别系统国际标准汇编 G 袁安存 , 张淑芳 , 译 大连 : 大连海事大学出版社 , 2005 9 李於洪著 数据仓库与数据挖掘导论 M 北京 : 经济科学出版社 , 2012: 181-185 10 潘家财 , 邵哲平 , 姜青山 数据挖掘在海上交通特征分析中的应用研究 J 中国航海 , 2010, 33( 2) : 60-62 11 何

29、苗 移动对象的时空轨迹聚类算法研究 D 兰州 :兰州大学 , 2013 12 GNWALD P, MYUNG I J, PITT Advances in Mini-mum Description Length: Theory and Applications M MIT Press, 2005: 16-17 13 ESTE M, KIEGEL H, SANDE J, et al A Density-Based Algorithm for Discovering Clusters in Large SpatialDatabases with Noise C Proceedings of the

30、2nd Inter-national Conference Knowledge Discovery and Data Min-ing, 1996 14 陈锦阳 , 宋加涛 , 刘良旭 , 等 基于 Hausdorff 距离的轨迹聚类算法 J 计算机工程 , 2012, 38( 17) :檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿檿157-161( 上接第 37 页 )可计算和预测该中速柴油机在实船应用中的油耗率 。在此基础上 , 根据所用船舶的设计参数 , 综合船机桨匹配情况和载货情况 、航期限制等因素 , 可进行使船舶在完成载货任务时其柴油机的

31、耗油量最少的节能航速的计算 。参 考 文 献 1 LIU Chengzhi Transport Energy-Saving Emission educ-tion Countermeasures Under the Concept of SustainableDevelopment C Proceedings of 2010 2nd InternationalConference on Modeling, Simulation, and VisualizationMethods, 2010 2 石友蓉 , 赵威 公路水路交通运输节能减排综合管理体系研究 J 武汉理工大学学报 , 2010, 32

32、( 4) : 31-37 3 KIDOGUCH Y, SANDA M, MIWA Experimental andTheoretical Optimization of Combustion Chamber and FuelDistribution for the Lower Emission Direct-InjectionDiesel Engine J Journal of Engineering for Gas Tur-bines and Power, 2003, 125( 1) : 351-357 4 张伟 , 王红 , 张澍宁 , 等 内河船舶主机动态油耗模型的研究与建立 J 交通标

33、准化 , 2013, 22: 95-97 5 OH M Determination of an Economical Shipping outeConsidering the Effects of Sea State for Lower Fuel Con-sumption J International Journal of Naval Architectureand Ocean Engineering, 2013, 5( 2) : 246-262 6 邵治家 6106 柴油机工作过程的数值模拟及优化 D 大连 : 大连理工大学 , 2008 7 刘勤安 , 段树林 , 邢辉 , 等 大型低速船用柴油机工作过程数值模拟及优化 J 大连海事大学学报 , 2011,37( 3) : 107-110 8 李斌 船舶柴油机 M 大连 : 大连海事大学出版社 ,2010: 261-265 9 张钊 船舶运行状态检测与节能航速优化系统的研究与设计 D 武汉 : 武汉理工大学 , 2012中 国 航 海中国科学引文数据库来源期刊 中国科技论文统计与分析来源期刊欢 迎 投 稿 欢 迎 订 阅68 中 国 航 海 2015 年第 2 期

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报