收藏 分享(赏)

233-117-天气因素对轨道交通客流的影响.pdf

上传人:精品资料 文档编号:9942032 上传时间:2019-09-21 格式:PDF 页数:14 大小:933.44KB
下载 相关 举报
233-117-天气因素对轨道交通客流的影响.pdf_第1页
第1页 / 共14页
233-117-天气因素对轨道交通客流的影响.pdf_第2页
第2页 / 共14页
233-117-天气因素对轨道交通客流的影响.pdf_第3页
第3页 / 共14页
233-117-天气因素对轨道交通客流的影响.pdf_第4页
第4页 / 共14页
233-117-天气因素对轨道交通客流的影响.pdf_第5页
第5页 / 共14页
点击查看更多>>
资源描述

1、交叉创新与转型重构2017年中国城市交通规划年会论文集 1 天气因素对轨道交通客流的影响 杜恒 【摘要】分析天气对轨道交通客流分布的影响,并提出基于天气因素的条件随机场客流预测模型。首 先分析天气因素和轨道交通客流分布的关联关系,作为建立模型的基础。其次,介绍基于天气因素的条件 随机场客流预测模型,并给出模型的学习过程和推断过程。最后,利用客流预测模型对乘客出行目的地进 行预测,并通过预测方法模拟路网实时客流分布的统计过程。实验结果表明,该算法相比于多种其他客流 预测算法在预测精度上有一定的提高。 【关键词】轨道交通;天气;客流分布 1 绪论 轨道交通客流预测对改善城市交通,解决城市交通问题最

2、重要的方法之一,客流预测能 给轨道交通运营管理部门提供信息支撑和为乘客选择合适的路径提供帮助。 现在交通客流的 预测算法包括线性预测算法和非线性预测算法, 其中线性客流预测算法主要包括历史平均算 法、 自回归滑动平均算法、 卡尔曼滤波算法; 非线性客流预测算法主要包括支持向量机算法, 反馈神经网络算法,灰度算法等。这些客流算法的发展已经较为完善,对交通客流的预测达 到了一定的精确度。然而现在人们的出行模式越来越复杂,影响人们出行选择的因素越来越 多,如空气质量、交通拥堵等。已有大部分算法没有考虑这些因素与客流数据之间的关系, 而只是考虑了客流数据自身的变化趋势, 因此这些算法很难分析出客流数据

3、变化的根本原因。 本文分析天气因素对轨道交通客流分布的影响, 同时建立天气因素和轨道交通客流的关 联关系, 挖掘影响客流变化的深层次原因, 提出一种基于天气因素的轨道交通客流预测算法。 2 天气因素与轨道交通客流相关性分析 现在,城市居民对环境和健康的关注力度加大,城市的天气状况如空气质量直接影响乘 客出行和目的地选择,例如城市空气质量较差时选择去公园、逛街的乘客减少。本节主要分 析天气因素(温度、空气质量、是否下雨)和轨道交通客流分布的关联关系。同时由于轨道 交通路网客流分布在每天的各个时段差异性较大,论文将其分为早高峰、中午平峰和晚高峰 三个时段进行分析。 2.1 天气因素与客流分布相关性

4、 在本节中,论文通过站点去往其他站点的客流比例向量描述该站点的客流分布,即对于中国城市规划学会城市交通规划学术委员会 中国城市规划设计研究院 编 2 每一个地铁站 o ,该站点到其他 n 个站点的客流比例向量为一个 n 维的向量 12 , ,., on Yyyy 。通过计算每个站点客流比例向量的熵的变化来描述客流比例的变化, 当熵的值越大时说明客流比例越集中,当熵的值越小时说明客流比例越均匀。站点 o 的客流 比例的熵 o E 的计算公式如 3-1 所示: 1 *ln i n y oi i Ey (2-1) 式中: i y :站点 o 到站点 i 占该站点总客流的比例 对于整个轨道交通网络,每

5、个站点 o 对应一个客流比例的熵 o E ,因此整个轨道交通网 络中所有站点的客流比例的熵的值构成一个路网的熵的向量 12 , ,., n EEEE 。路网的熵 向量描述的是整个路网所有站点的客流分布情况。针对这一路网的熵向量,论文依据天气因 素对每天路网的熵向量按天划分到不同的类别。对于空气质量因素,我们将空气质量大预测 150 即 150 aqi 的熵向量分为一组,将空气质量小于 100 即 100 aqi 的熵向量分为一组, 而对于空气质量属于两者之间即 100 150 aqi 的实验数据不进行划分,这是因为去除中 间相邻的区域可以更好的区分空气质量对客流分布的影响, 因此所有天的实验客

6、流数据的熵 向量可以依据空气质量划分为两组对比数据 | 100 low m m aqi E aqi 和 | 1 5 0 high m m aqi E aqi 。 表1 不同天气因素熵向量差异大小 因素 早高峰 午平峰 晚高峰 空气质量 0 3 2 是否下雨 3 4 4 温度 0 3 0 客流分布的熵向量在不同天气因素下的差异性如表 1 所示,表 1 中数值是论文将熵向 量的欧式距离按 0 到 5这 6 个等级进行划分,等级越大说明熵向量的欧式距离越大。在表 1 中,数值越大表示两个熵向量的差异越大,即客流比例的差异越大,这说明不同的天气因素 影响下,客流比例的变化大。在早高峰时段,空气质量和温

7、度对乘客出行分布影响较小,这 是因为在早高峰时段乘客的通勤出行需求量较大, 而是否下雨这种感官更强烈的因素对客流交叉创新与转型重构2017年中国城市交通规划年会论文集 3 分布影响较大。在午平峰时段,乘客的出行多属于非刚性需求(如逛街、游玩等) ,这些需 求受天气因素影响明显。在晚高峰时段,乘客通勤客流量较早高峰减少,因此乘客出行仍然 受空气质量和是否下雨影响较大,而在晚高峰时段隔天温度相对较为接近,因此对客流分布 的影响较小。 2.2 天气因素对站点客流分布影响 本小节主要对比不同站点客流分布受到天气因素的影响程度。 对于每个地铁站 o ,实验将该站点各天的客流分布的熵 o E 依据天气因素

8、的差异行划分 为两组,本节采用的天气因素的划分尺度和 2.1节相同,因此空气质量因素将该站点的熵划 分为 | 100 low m m aqi E aqi 和 | 1 5 0 high m m aqi E aqi 两组,计算两组熵的均值为 _ aqi low E 和 _ aqi high E ,则利用两组熵的差值表示空气质量因素对各个地铁站客流比例的影响 大小,则差值 aqi E 计算公式如 2-2 所示: _ | aqi aqi low aqi high EEE (2-2) 与空气质量相同, 是否下雨和温度因素对该站点客流分布的影响大小由 rain E 和 temp E 表示,计算公式分别如

9、2-3 和 2-4 所示: _ | rain rain no rain yes EEE (2-3) _ | temp temp low temp high EEE (2-4) 图 1 是轨道交通路网各个站点在不同天气因素下熵差值分布图, 图中依据 aqi E 、 rain E 、 temp E 分别对站点进行标记,每个站的半径是 aqi E 、 rain E 、 temp E 的相对大小,即站点 的半径越大,该站点的熵的差值越大。图 1 描述的是轨道交通路网各站点在不同天气因素状 态下各站点的客流分配比例向量的差异性大小。从图 1 中可以发现,半径较大的站点主要分 布在郊区线,包括沙河高教园、

10、良乡大学城等高校园区以及一些小型的居住区,其中高校园 区的乘客以学生为主,这类乘客的出行属于弹性需求,受到天气因素的影响明显,而一些大 型的居住区如回龙观、天通苑北等站点,这些站点的乘客多属于上班族,他们的出行属于刚 性需求,即不管天气状态如何极少会改变他们的出行方式,因此这些站点的客流比例变化很 小。天气因素对部门旅游区的站点也存在影响,如奥林匹克公园,从图中可以发现该站点半 径较大,这是因为乘客逛公园这一事件受到天气因素影响很大,同时可以发现在晚高峰时段中国城市规划学会城市交通规划学术委员会 中国城市规划设计研究院 编 4 天气因素对该站点影响相对早高峰更大, 这是因为本节考虑的是站点到其

11、他站点的客流比例, 在早高峰时段由于奥林匹克公园非居住区乘客较少因此变化很小, 而在晚高峰时段乘客需要 乘车回家,因此可以从侧面反映出天气因素极大地影响了乘客是否去往奥林匹克公园。 图 1 地铁站客流比例熵在不同天气因素下差值变化分布 从上述的分析中,可以发现天气因素对轨道交通客流分布存在一定的影响,且在不同时 段的影响程度的大小存在差异。 因此论文在此基础上建立联系天气因素和轨道交通客流分布 的客流预测模型以达到提高预测精度,预测路网客流分布的目的。 3 基于天气因素的条件随机场客流预测模型 条件随机场(Conditional Random Fields , CRF)是一种鉴别式概率模型,其

12、思想主要来 源于最大熵模型,相比于马尔科夫模型,条件随机场模型的优势在于观察变量是始终可以获 得的,在建模的过程中不需要考虑观察变量之间的条件概率关系,只需要建模输出变量与观 察变量以及输出变量之间的概率关系。同时,条件随机场模型相比于马尔科夫模型寻找模型 的全局最优解。论文本节主要介绍了基于天气因素的条件随机场客流预测模型,并给出了模 型的学习过程和预测过程的数学推导。 3.1 条件随机场客流预测模型 在分析天气因素和轨道交通客流分布相关性的基础上, 论文在本节采用条件随机场模型 来建立轨道交通 OD 对客流与天气因素的关系,来预测各 OD 对的客流量。首先,对于每天 的轨道交通客流,模型依

13、据客流特点将 OD 对客流划分为 n个时段,生成轨道交通客流序列交叉创新与转型重构2017年中国城市交通规划年会论文集 5 12 , ,., n Yyyy ,同时将每天的天气因素以及其他关联因素生成输入序列 12 , ,., n X xx x 。 条件随机场模型通过对在给定输入序列 X 下输出序列 Y 的条件概率分布即 (|) pyx 进 行建模,分析了输出序列与输入序列之间的关系以及输出序列自身之间关系。在论文提出的 条件随机场模型中,模型的输出是客流序列 12 , ,., n Yyyy ,模型的输入是关联因素 12 , ,., n X xx x ,其中关联因素由温度、空气质量、是否下雨以及

14、历史平均客流数据构成 即 , iiiii x tarf ,其中 n 表示序列长度。本章模型的图模型示意图如图 2 所示。从图中 可以发现模型建立了关联因素变量和客流序列变量之间的关联关系和相邻客流序列变量之 间的时间序列关联关系。 y 1 y 2 y n t1 a1 r1 a2 t2 r2 rn an fn x 1 x 2 x n Unobseved Y i Obseved X i f1 f2 tn图2 基于天气因素的条件随机场客流预测模型示意图 本章模型结合联合势能函数和相互势能函数, 建立客流序列关于天气因素和历史平均客 流因素的条件概率 (|) pyx ,模型的条件概率 (|) pyx

15、的计算公式如式 3-4 所示: 1 1 11 1 (|;,) (,;,) (, ,;) (;,) TT tt ttt tt pyx gyx fyy x Zx (3-4) 式中: (;,) Zx :本章模型的归一化函数 3.2 模型学习过程 本章模型学习的目的是学习模型参数使得模型的似然函数最大, 过程是指利用机器学习 的方法迭代优化模型的参数,得到最终的预测客流的模型。 本章模型的参数集为 , ,模型的似然函数 () L 为模型的条件概率取 log, 数学表达式如式 3-7 所示: 中国城市规划学会城市交通规划学术委员会 中国城市规划设计研究院 编 6 ()l o g(|) L p y x (

16、3-7) 模型采用梯度上升算法迭代计算模型参数来使得模型的目标函数最大, 模型更新参数的 计算公式如式 3-8、式 3-9、式 3-10 所示: () log log log new old old L k (3-8) () new old old L k (3-9) () new old old L k (3-10) 本章模型通过梯度上升算法不断迭代,直到模型的目标函数收敛到最大值停止,此时模 型的参数集 , 即为最优参数集,能够准确的描述天气因素和客流序列的关联关 系,给客流预测进行使用。 3.3 模型预测方法 模型的预测的目标是在输入天气因素和历史平均客流下使得模型条件概率 (|;,)

17、pyx 最大的客流时间序列y ,数学表达式如式 3-11 所示: 1 arg max ( | ; , , ) 1=argmax( ) 2TT yp y x yA yby Ab (3-11) 式中: y :客流时间序列构成的 n 维向量 12 , ,., n yyyy ; A :一个 * TT 的对角参数矩阵; b :一个列参数向量 本章模型的学习和预测过程如算法 3.1 所示。在本章模型参数的初始化方法,可以对 取(0,1)区间的随机数,对 , 取(-1,1)区间的随机数。 4 轨道交通客流预测实验结果分析 本章论文主要研究的是乘客出行目的地站点的预测工作, 因此论文在实验结果的分析过 程中主

18、要针对各站点去往其他站点概率向量进行对比。 本节使用实验指标包括平均相对误差、交叉创新与转型重构2017年中国城市交通规划年会论文集 7 均方根误差、绝对误差等指标。论文使用的数据范围是北京市轨道交通 2013 年 5月到 2013 年 8 月客流数据以及相应的天气数据,同时模型将轨道交通每天的客流序列划分为三个时 段即早高峰时段、午平峰时段、晚高峰时段进行预测。 4.1 实验评价指标 在实验预测结果的比较中,对于站点 K 在 t 时段该站点到其他各站点的人数的预测值 的向量为 12 , ,., n tttt Yyyy ,真实值的向量为 12 , ,., n tttt Yyyy ,我们使用三个

19、指 标比较预测结果 12 , ,., n tttt Yyyy 的精确度。 1)平均相对误差 6667 (RME) 平均相对误差描述的是预测客流向量 12 , ,., n tttt Yyyy 和真实客流向量 12 , ,., n tttt Yyyy 的相对误差的平均值,平均相对误差计算公式如式 4-1 所示: 1 | 1 ii n t tt k i i t yy RME ny (4-1) 其中 n 表示轨道交通站点个数;公式表明当平均相对误差越小时,算法预测结果精度越 高。 2)均方根误差(RMSE) 均方根误差描述的是预测客流向量 12 , ,., n tttt Yyyy 和真实客流向量 12

20、 , ,., n tttt Yyyy 的平方和均值的平方根,均方根误差计算公式如式 4-2 所示: 2 1 1 () n ti i kt t i RMSE y y n (4-2) 其中 n 表示轨道交通站点个数;公式表明当均方根误差越小时,算法预测结果精度越 高。 2)绝对误差(AES) 假设对于站点 K, 在 t时段到其他各站点的人数的预测客流向量为 12 , ,., n tttt Yyyy , 真实客流向量为 12 , ,., n tttt Yyyy ,则站点 K 的客流预测的绝对误差的计算公式如式 4-3 所示: 1 | n kii ttt i AES y y (4-3) 中国城市规划学

21、会城市交通规划学术委员会 中国城市规划设计研究院 编 8 其中 n 表示轨道交通网络中站点个数。 公式表明当 AES 值越小时, 模型预测精度越高。 绝对误差和 k t AES 表示站点 K在 t 时段预测错误的人数的和,则站点 K预测 错误人数占该站点 t 总进站人数 k t SUM 的比率 k t RAES 的表示绝对误差比例, 其计算公 式如式 4-4 所示: k k t t k t AES RAES SUM (4-4) 对于整个轨道交通,将所有站点的 AES 累加可以得到整个轨道交通网络客流预测的绝 对误差的总和 t sum AES ,其计算公式如式 4-5所示: 1 n tk sum

22、 t k AES AES (4-5) 4.2 实验结果 本节实验中各预测模型均以 2013 年 5 月 1 号到 2013 年 8 月 2 号中的正常工作日客流 数据作为实验数据,其中 2013 年 8 月 2 号客流数据作为预测天对比数据,其他数据作为历 史训练数据。 本节使用的对比算法包括自回归滑动平均模型算法 (arma) 、 神经网络算法 (bpn) 与本章算法进行对比。 4.2.1 整个轨道交通网络客流比较 表 3 本章算法与对比算法在2013 年8 月2号 t sum AES 数值对比 时段 本章算法(crf) 神经网络(bpn) 自回归滑动平均模(arma) 客流量总和 1 23

23、5331 316418 266651 1560509 2 358591 482897 371898 2009915 3 297671 435657 360909 2008176 交叉创新与转型重构2017年中国城市交通规划年会论文集 9 图3 本章算法与对比算法 t sum AES 比例图 这一小节主要对整个轨道交通所有站点的客流预测精度进行比较, 使用路网绝对误差的 总和 t sum AES 进行刻画。表 3 是本章算法与对比算法在 2013 年 8 月 2 号 t sum AES 数值对比。 从表 3 可以看出本章算法较其他算法的绝对误差的总和明显低于其他算法。早高峰时段的 t sum A

24、ES 低于其他时段的 t sum AES 值,这是因为该时段客流量相对于其他时段较低。图 3 是总 体 t sum AES 占当天客流量的比例,即预测错误的客流量占的比例。从图中可以发现本章在各 个时段的预测精度最高,各个时段预测精度分别达到 84.9%、82.2%、85.2%。从图中可以发 现各算法在早高峰和晚高峰时段预测精度更高,这是因为这两个时段客流以通勤客流为主, 客流序列相对稳定,而在午平峰时段弹性客流比例更大,各算法性存在一定的降级,但是本 章模型算法仍表现优于其他算法。从图 3 中可以发现本章算法与自回归滑动平均模型性能 较好,因此在下面的算法性能对比中以本章算法与自回归滑动平均

25、模型为主。 0.1 0.12 0.14 0.16 0.18 0.2 0.22 0.24 0.26 123 crf_ratio bpn_ratio arma_ratio中国城市规划学会城市交通规划学术委员会 中国城市规划设计研究院 编 10 图 4 (a) 时段 1绝对误差率频率分布图 图 4 (b) 时段 2绝对误差率频率分布图 图 4(a)、图 4(b)和图 10(c)是轨道交通网络所有站点的各个时段绝对误差率 k t RAES 的频 率分布图。 从图中可以看出本章算法站点绝对误差频率分布图相比于自回归滑动平均模型更 集中于左边, 说明本章算法对站点客流比例预测更多站点的预测结果精度高于自回

26、归滑动平 均模型预测结果。从图中发现时段 1和时段 3 本章算法性能更好,这是因为早高峰和晚高峰 时段路网客流通勤客流量较大,因此两种算法的预测精度均较高。 交叉创新与转型重构2017年中国城市交通规划年会论文集 11 图 4 (c) 时段 3绝对误差率频率分布图 4.2.2 本章算法性能与客流量关系 图 5 (a) 时段 1绝对误差率和站点客流量关系 图 5(a)、图 5(b)和图 5(c)是轨道交通网络所有站点的各个时段绝对误差率与该站点进站 客流量关系。从图中可以发现,本章算法对的预测精确度和该站点的进站客流基本成正比例 关系,这是因为站点客流较大时,该站点去往其他站点的比例更稳定,而部

27、门站点由于客流 量很小,乘客随机性出行对客流分布影响很大。 中国城市规划学会城市交通规划学术委员会 中国城市规划设计研究院 编 12 图 5 (b) 时段 2绝对误差率和站点客流量关系 图 5 (c) 时段 3绝对误差率和站点客流量关系 4.2.3 部分站点预测结果比较 论文选取多个特殊站点对各算法的预测结果进行比较, 选取的比较站点为良乡大学城站、 巩华城站、西单站。表 4 是良乡大学城站各预测算法预测性能比较,表 5 是巩华城站各预测 算法预测性能比较,表 6 是西单站各预测算法预测性能比较。 表4 良乡大学城站各预测算法预测性能比较 时段 评价指标 本章算法 bpn arma 时段 1

28、RME 0.2842 0.3694 0.4155 RMSE 1.5592 2.0402 5.1967 AES 224.59 281.36 315.94 时段 2 RME 0.3896 0.6377 0.4268 RMSE 3.4185 4.4287 7.8674 AES 424.59 609.66 538.33 时段3 RME 0.3026 0.3461 0.3811 RMSE 1.7605 2.5011 2.9468 AES 226.65 277.96 271.83 交叉创新与转型重构2017年中国城市交通规划年会论文集 13 表 5 巩华城站各预测算法预测性能比较 时段 评价指标 本章算法

29、 bpn arma 时段1 RME 0.1992 0.2057 0.2018 RMSE 1.2067 1.3115 1.3090 AES 162.54 164.06 164.56 时段2 RME 0.2017 0.2775 0.2279 RMSE 1.5148 1.7999 1.8367 AES 172.26 213.75 180.33 时段3 RME 0.1407 0.1525 0.1956 RMSE 0.7832 1.0457 1.4919 AES 91.57 110.44 132.97 从表 4 中可以发现本章算法各项评价指标均优于对比客流预测算法, 同时本章算法在时 段 1 和时段 2

30、 相比于对比客流预测算法提升更多,这是因为良乡大学城站乘客包括大量的 学生, 这一部分乘客属于弹性客流, 因此本章算法能较好地反映天气与客流分布的关联关系, 对算法的提升较高。 从表 5 中发现本章算法预测精度高于对比客流预测算法, 但是各客流预测算法性能较为 接近。巩华城站涵盖大量居住小区,该站点的客流量以通勤客流为主,因为该站点客流量相 对稳定,受到天气因素影响较小,因此各客流预测算法性能接近。 从表 6 可以发现本章算法优于对比客流预测算法。特别的,在时段 1 本章算法性能表现 优于其他算法更多,这是因为西单站不属于居住区,因此在早高峰时段该站点的出行客流弹 性客流量较大受到天气因素影响

31、明显,故本章算法性能优于对比客流预测算法更多。而在时 段 2 和时段 3,本章客流预测与对比客流预测算法性能相近,这是因为西单站属于工作区和 旅游区等综合功能区域, 在这两个时段的客流量以早高峰时段来到西单站然后现在返回的乘 客为主,这一部分客流量属于刚性客流,受到天气因素影响较小,因此各客流预测算法性能 表现较好且预测精度相近。 表 6 西单站各预测算法预测性能比较 时段 评价指标 本章算法 bpn arma 时段1 RME 0.3415 0.7101 0.7035 RMSE 5.2454 11.8331 10.6445 AES 748.38 1635.66 1390.48 时段2 RME

32、0.1930 0.2559 0.2562 RMSE 33.4312 48.3676 43.0623 AES 4349.99 6118.68 4988.26 时段3 RME 0.1392 0.1507 0.1461 RMSE 35.0436 40.6965 33.7063 AES 5095.49 5626.69 5180.75 中国城市规划学会城市交通规划学术委员会 中国城市规划设计研究院 编 14 从本节的分析中可以发现,本章算法总体预测精度高于对比客流预测算法,同时对部分 特殊站点相比于对比算法表现更加良好。 这一分析结果也验证了天气因素影响了轨道交通客 流分布, 本章提出基于天气因素的条件

33、随机场客流预测模型建模复合实际情况且预测精度较 高。 5 总结 轨道交通网络实时路网客流分布能给轨道交通管理部门提供信息支撑来更好地完成运 营工作,且能帮助乘客选择合适的路径出行,改善乘客出行体验。同时现在城市居民对健康 和空气质量的关注越来越大,乘客出行受到天气因素影响越来越大。 本文从天气因素对整个轨道交通网络客流分布影响和对站点客流分布影响两方面分析 了天气因素和轨道交通客流分布的相关性, 为建立天气因素和轨道交通客流关联的客流预测 模型提供数据支撑。其次介绍了本章提出了基于天气因素的条件随机场客流预测模型,并给 出了模型学习过程和客流预测过程的数学推导。 然后介绍了轨道交通实时客流分布统计系统, 给出了结合本章客流预测算法的计算路网实时客流分布的流程。最后,以北京市轨道交通客 流数据及相关天气数据为基础,对本章算法与对比算法的性能进行了比较,实验结果表明本 章算法预测精度更高,且对不同站点在特殊时段的预测效果更优。 作者简介 杜恒, 男, 硕士, 北京轨道交通路网管理有限公司, 主管。 电子信箱:

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报