1、MNL模型在出行方式选择中的应用研究模型在出行方式选择中的应用研究模型在出行方式选择中的应用研究模型在出行方式选择中的应用研究(西安建筑科技大学,沈乐尧,西安710055)摘要:本文采用MNL模型,利用渭南市居民出行od调查数据对模型进行标定,通过计算得出不同出行方式的选择与不同出行因子(年龄、职业、出行距离、出行速度)的相关关系,结果显示MNL模型有较高的精度。关键字:MNL模型;居民出行;交通方式中图分类号:C913.32文献标识码:A文章编号:出行者对于出行方式的选择不仅与交通方式的服务水平有关,还与出行者的个人属性及出行特性有关1。研究表明,非集计模型能较好考虑到这些因素,为交通预测提
2、供更为容易描述交通行为的解决办法2。MNL模型能通过效用函数确定项的计算就可以获得个体不同交通方式的选择概率,且较传统的集计模型在预测精度上有了显著提高。基于此,本文进行了实例研究。1.研究内容为了验证MNL模型在出行预测方面的有效性,本文选取了2011年渭南市的居民出行调查的抽样数据样本15459个,运用SPSS软件进行多项logit模型(m ultinational logit m odel)分析。此次出行调查的15469例样本使用的是PT调查法按户口本编号分12个街区随机抽取1%个对象得到的样本。为了简化试验,本文中所进行的试验都是在选定的=0.05的基础上进行的。数据经处理后运用SPS
3、S19.0统计软件进行了MNL统计分析。2.变量的设置选择那些指标作为建模的变量,对模型的预测能力及可靠性都会产生较大的影响。为了全面客观的描述居民的出行选择,参考了其他文献的相关经验,应变量和自变量标定如表1、表2。表1应变量编码处理编码出行方式1步行2包括自行车、电动自行车、摩托车3公共交通,包括公交和出租车4小汽车,包括自驾、拼车以及单位车等本文以出行方式为应变量,运用多元logistic模型,通过SPSS软件,研究以下出行方式的选择与出行者特征之间的关系。应变量是居民出行方式,在数据处理时将居民出行调查时的十余种出行方式处理为四大类如表1。受限于收集来的基础数据,最终选取自变量由2种特
4、性变量组成如表2,其中人口特征变量为职业和,年龄两个变量;出行特征变量为出行距离和出行速度两个变量。由于应变量是多分类的名义变量,所以采用MNL模型进行回归分析。表2本例自变量职业学生工人服务员职员私营个体离退休农民其他1 2 3 4 5 6 7 8年龄小于2 0岁2 0 -3 9岁4 0 -5 9岁6 0岁及以上1 2 3 4出行距离1 0 0km1 2 3 4 5出行速度3 9 km/h1 2 3 43.模型的建立模型公式为:式(1)其中,自变量为Xi(i=1,2,,k),j与j分别表示第j类的常数项与解释变量的参数。在SPSS中默认以最后一类(J)为基线,每个反应类别j与J基线类别间建立
5、回归模型。参数jk的估计值表示哎其他自变量固定不变的情况下,某一自变量Xk改变一个单位,反应类别j相对于类别J的对数优势平均改变量,即优势比。本例中,应变量y取值为1,2,3,4时,根据之前推倒过得公式,所以logistic回归模型是:式(2)式中:zin为出行者n选择方案i的效用。为截距,X1,X2,X3,X4分别代表职业、出行距离、出行速度、年龄。再根据公式:,i=1,2,m ; n=1,2,N-1式(3)Pin为出行者n选择i方案的概率。对于每个类别n,公式(5-18)的分母均相同,且等于每个类别n的预测概率Pin的分子之和。运用这个公式,就可以对应变量的发生概率进行预测。无论以哪一类别
6、为基线,基线对应的参数均为0。由于Pin仅表示个体的交通行为,预测整体交通出行行为的方式的选择时,可以将模型的结果进行求和,并用平均值法进行模型集计。综上,出行方式的选择的概率为:式(4)本例中模型的参数值依然在SPSS中选择估计采用最大似然法,用伪决定系数(PseudoR-Square)、似然比卡方检验和拟合优度检验来对回归模型的整体拟合质量进行检验。4.模型的处理结果案例处理摘要N边际百分比Y 1 7 0 7 8 4 5 .8 %2 1 8 3 7 1 1 .9 %3 4 5 7 9 2 9 .6 %4 1 9 6 5 1 2 .7 %有效1 5 4 5 9 1 0 0 .0 %缺失0总计
7、1 5 4 5 9子总体3 3 7 a由此可以看出统计样本中,4种出行方式的百分比分别为45.8%,11.9%,29.6%和12.7%。模型获得的似然比X2值为13906.632-6678.610=7228.023,自由度为12,P为0.000说明模型中至少有1个自变量有统计学意义。伪决定系数是模型中自变量解释了自变量的变异占因变量总变异的百分比分别,它们分别是0.373和0.408均大0.01,说明模型比较理想。而本例中所建模型0.190,McFadden决定系数较高,模型与实际情况的拟合度较好。模型处理结果似然比检验的P值均小于0.05说明模型有统计学意义。模型具体参数如下表所示:参考类别
8、是Y=4 . Y=1 Y=2 Y=3B P B P B Pintercept 5 .0 0 4 0 .0 0 0 0 .9 8 6 0 .0 0 0 1 .5 4 6 0 .0 0 0vocation -0 .0 1 7 0 .3 3 7 -0 .0 2 0 0 .3 0 4 -0 .1 0 8 0 .0 0 0distance -0 .3 3 4 0 .0 0 0 0 .0 1 8 0 .5 6 6 0 .0 5 2 0 .0 4 6velocity -2 .6 4 3 0 .0 0 0 -0 .4 6 0 0 .0 0 0 -0 .3 5 5 0 .0 0 0age 0 .5 1 7 0
9、.0 0 0 -0 .0 2 6 0 .5 7 8 0 .1 4 3 0 .0 0 0所以,根据sig值和公式(2)可得.004-0.334*出行距离-2.643*出行速度+0.517*年龄-0.46*出行速度-0.108*职业-0.335*出行速度+0.143*年龄通过MNL模型可知,z1(步行)方式与出行距离和出行速度成反比,与年龄成正比。即距离越近,对出行速度无过快的要求,年龄偏大者较为偏爱步行。z2(自行车、摩托车)方式的选择与出行速度这个因素具有极大的相关性。而z3代表的公共交通和准公共交通出租车,与出行者的职业、年龄和对出行速度的要求具有一定的相关性。根据公式(4)有:P1n=ez
10、1/(1+ez1+ez2+ez3),P2n=ez2/(1+ez1+ez2+ez3),P3n=ez3/(1+ez1+ez2+ez3),P4n=1/(1+ez1+ez2+ez3),而样本N=15459,再根据公式(5-19)有P1=P1n/N,P2=P2n/N,P3=P3n/N,P4=P4n/N,最终在excel中输入公式算出的预测概率如下:表5.3MNL模型预测概率将预测概率与实际统计值45.8%,11.9%,29.6%和12.7%相比较,模拟结果表明,非集计模型能较好地表达居民出行方式选择行为,有利于交通方式结构的调整和优化。参考文献1姚丽亚,孙立山,关志宏.基于分层logit模型的交通方式选择行为研究J.武汉理工大学,2010,8.2关志宏.非集计模型交通行为分析工具M.北京:人民交通出版社,2004.简介:沈乐尧(1988-),女,学历:硕士,主要研究方向:城市综合交通。手机:15929722569。MNL模型在出行方式选择中的应用研究作者: 沈乐尧作者单位: 西安建筑科技大学刊名: 城市建设理论研究(电子版)英文刊名: ChengShi Jianshe LiLun Yan Jiu年,卷(期): 2013(13)引用本文格式:沈乐尧 MNL模型在出行方式选择中的应用研究期刊论文-城市建设理论研究(电子版) 2013(13)