1、一种可供选择的对交通数据建模和仿真的方法:人工神经网络论文出处:Simulation Modelling Practice and Theory 12 (2004) 351362原文作者:S. Figen Kalyoncuoglu, Mesut Tigdemir作者单位:SDU, Civil Engineering Department, Isparta 32260, Turkey原文相关时间:Received 25 November 2002; Received in revised form 9 March 2004; Accepted 20 April 2004;Available on
2、line 15 June 2004摘要假定在驾驶员特性和交通事故之间有复杂的关系。而与交通事故有关的这些驾驶员特性的影响是很难仿真的。由于人工神经网络 (ANN)的方法是一种更有可塑性和想象空间的方法,本文提出使用该方法来训练和预报数据库。网络被组织成不同的结构体系并且为了确定最合适的那一个已经对结果进行了比较。最后,最可能的结构体系被选来作为对调查数据和事故百分比的预报的更好的表示。对于在对ANN的训练中未曾用到的那些输入的输出的预报提供了数据库中没有的驾驶员的信息。预报结果是十分令人满意的,而ANN也已经被证明是对交通数据的估计进行建模和仿真的可靠的处理系统。关键词:神经网络,交通建模问题
3、,辨识,数据挖掘,探测数据集分析,仿真1绪论:由交通事故引起的人身伤亡和物质损失是全球日益发展的科技的负面影响之一。当我们将高速公路上的交通密度考虑在内,就不会为土耳其是交通事故发生率最高的国家之一而感到惊讶。正是由于如此高的事故发生率,找到造成人身伤亡和物质损失的事故发生的主要因素并作必要的防范就显得十分必要。虽然引起交通事故的因素很多,但通过相关的统计,驾驶员的因素是造成交通事故高发生率的主要因素。因此,所有影响驾驶员行为的特性都必须进行分析。在确定这些因素时有很多方法可以使用,最有效的方法是对人们进行的面对面的调查。通过这些调查可以建立庞大的数据库并且运用不同的方法对数据进行分析。数据库
4、由每个驾驶员的信息组成,他们卷入交通事故的百分比可以用那些具有相同特性的驾驶员的数据库来进行预报。而对那些数据库中没有的驾驶员,卷入交通事故的百分比就不能仅仅利用数据库来预报。为了能作如此的预报,驾驶员特性和卷入交通事故之间的关系就必须在数据库中建立/记录。因此,该数据库肯定是典型的。目前在建模时可以使用统计等若干种方法。上世纪末使用得相当频繁的人工神经网络(ANN)就为很多信息处理程序提供了一种可选择的方法。由于ANN是一种更有可塑性和想象空间的方法并且不要求统计学上的专门技术,本文使用其来进行可靠的数据处理及随后的解释。要对该数据库建模,必须拥有一个基本数据库、ANN软件工具箱和关于建立A
5、NN体系结构的软件的足够的知识。因为这个原因,一些驾驶员特性和它们对卷入交通事故的影响被选来显示关于驾驶员的数据库是如何很容易的用ANN的方法来建立的。本文中关于涉及交通事故的驾驶员特性(包括年龄、性别、受教育程度、驾龄、每天驾驶的平均里程)以及它们的影响的那些数据来自于曾经在本文第一作者的博士论文1中使用过的一项专门研究报告。该报告通过对考虑了人口密度的30个城市(如图1所示)的5520名驾驶员进行的面对面的问卷调查获得上述的数据。由于在交通事故中有影响的驾驶员特性很多,笔者随机的选取了其中的五个来作研究。图1 30个城市的位置地图2驾驶员特性数据尽管对交通事故有影响的驾驶员特性很多,在本研
6、究中,只有那些用来建模的特性是有依据的。涉及的特性在下面给出并作了概要的解释以支持数据库的建立。2.1驾驶员的年龄年龄和发生交通事故的概率之间的关系是在各种文献中调查频率最高的课题之一。总的来说,在25岁之前发生交通事故的比率比较高,而尽管在该年龄之后事故比率有所下降,一旦超过60岁该比率又开始上升。对于年轻驾驶员的事故高发生率可以解释为他们没有经验,粗心,训练不足,过于自信和没有家庭责任感。而对于老年驾驶员,他们身体机能的下降引起了交通事故。关节组织变得不牢固,敏捷性下降,对于新情况的的反应时间随着年龄的增长而变长等诸如此类的原因引起事故发生率的增长2。与性别和年龄相对的驾驶员比率在那些快到
7、二十岁和刚超过二十岁的,尤其是男性的驾驶员中是引人注目的更高。2.2驾驶员的性别不同性别间的特性差异在交通事故的发生上是有影响的。男性驾驶员应该比女性驾驶员为更多的交通事故负责,因为在实际驾驶中他们没感觉的、竞争性的、好斗的、喜欢冒险的、不受约束的本性就会显现出来。尽管男性对于汽车和驾驶的兴趣使他们更有能力和经验,但不幸的是,这还不足以降低事故的比率。根据经验的分析揭露了男性驾驶员和女性驾驶员特性之间的重要差异,他们各自的交通事故危险度已经在Mannering的文章中提到4。由于男性驾驶员和女性驾驶员很少工作在相同的领域因此很难对他们进行比较。然而,一项对于出租车驾驶员的研究结果显示女性驾驶员
8、卷入交通事故的比率比男性驾驶员多3.5倍。2.3驾驶员的受教育程度正如在很多领域一样,受教育程度是另一项对交通安全来说是十分重要的因数。观察的重点、认知的特性、理解和说明的方式、对规则的服从度等是与受教育程度同步的。一个受过教育的人不会走由未受教育引起的两个极端畏缩和无畏并且行为更有逻辑性。2.4驾龄经验会使驾驶员对环境的观察更好从而降低危险水平。调查显示经验和交通事故的频率之间有各种各样的关系。研究结果显示年龄在16到18岁之间的拿了驾照还不到一年的人引起更多的交通事故。而由于有更多的经验,在18到24这一年龄段的人引发的事故相对于16到18岁年龄段的人来说就更少5。驾驶员的经验和能力越高,
9、发生交通事故的可能性就越少6。2.5 每天驾驶的平均里程旅行者的社会-经济参数被频繁的用来对其旅行行为作解释。一个人每天驾驶的时间越长,发生交通事故的可能性就越高。当驾驶时间变长,驾驶员由于疲劳和感觉上的困难而变得更粗心。Greenshields研究了驾驶的持续时间和驾驶员的表现之间的关系并得出结论:随着连续的长时间驾驶而引起的驾驶员表现恶化和失常是被交通和安全工程师所公认的在高速公路上引发事故和死亡的一个主要原因7。3人工神经网络(ANN)从网络展开的视角对人类行为进行的分析在过去的十年中已经获得了很多科学上的注意。网络模型将他们的分析集中在将个体的空间行为聚集成一个由节点和连接组成的有组织
10、的模式上8。有些网络模型与社会的行为基础和经济决策有关。神经网络是基于对人类大脑机能的类比,它尝试借助于人类行为基础的学习机制并用计算机化的方法来反映这些机能。ANN的方法在过去的十年中已经在各种交通运输工程学所涉及问题的通信中得到运用。Belgarovi和Blosseville研究了ANN在道路交通的自动测量中的应用9。特别的,他们还利用ANN来建立了一条道路的交通状况的样例。他们使用的网络包括18个输入层的神经元、2个隐藏层和4个不同种类的输出层的神经元。Huang和Part以ANN模型作为界面发展了一种新的仿真模型10。Chin和其他人用ANN来综合处理了一个循环的OD(初始点-目的地)
11、流11。最后,一股研究用组合模糊逻辑的ANN方法来模拟旅行行为的新潮流是值得提及的12,13。ANN在旅行行为、交通流和交通管理方面有很多的应用8。4实现方法用ANN来对数据库建模,首先要决定输入和输出部分。驾驶员特性和子群中的驾驶员数目作为输入,涉及交通事故的百分比作为输出。因此,在ANN模型中有六个输入和一个输出。依照驾驶员特性,参与问卷调查的驾驶员按详细的说明(表1)被分为487个子群。为了使驾驶员更容易的填写调查表以及能很快地将其作为结果的数据库转移到计算机中,调查表上的问题被分为小类,举个例子来说,男性(小类编号;性别:1),二十五岁以下(年龄:1),高中毕业(受教育程度:4),驾车
12、两年(驾龄:2),每天行驶里程在二十公里以下(日行驶里程:1)就是一个编号为11421的特殊子群。如果对于详细说明表中的每个子群都有驾驶员的话,一共将被分为25555=1250个子群。一个确定的子群卷入交通事故的百分比是由涉及交通事故的驾驶员的数目占该子群的驾驶员的总数目的比例来决定。为了预报各个子群在卷入交通事故的百分比上的影响和找到用最好的方式模拟数据库体系结构,不同的ANN被组织起来。这些ANN使用具有反馈传播的前馈方法进行训练。激发的传播以一种前馈的方式从输入转移到输出层,而误差的反向传播从输出返回到输入层。网络先提供了一种初步的输出,它接着与期望输出进行比较,为使其与预期输出的误差最
13、小化直到误差被限制在预先确定的容许范围之内,该误差会在反馈传播的处理中改变各连接的权值。表1 驾驶员特性的子群驾驶员特性的小类编号驾驶员特性 1 2 3 4 5性别年龄受教育程度驾龄日行驶里程男性(93%)65(1%)大学以上文化(15%)20(11%)300(7%)在该ANN的模型中(图2和图3),隐藏层的神经元数量,激发函数和隐藏层的数量均已被改变以获得对调查数据(表2)的最好的模拟。数据库被划分为两个部分,拥有400个子群的第一部分作为训练数据,而拥有87个子群的另一部分作为预报数据。图2 单隐藏层的ANN模型图3 双隐藏层的ANN模型表2 ANN模型及其详细说明ANN模型 隐藏层数量
14、隐藏层神经 激发函数 500个初项 实际值和元数目 的均方误差和 预报值间(SSE) 的相关系数ANN1ANN2ANN3ANN4ANN5ANN6ANN7ANN8ANN912248164-28-216-26-26-26-2TansigTansigTansigTansigTansigTansigTansig-tansig-PurelinLansig-purelin-PurelinTansig-tansig-Logsig0.10120.05730.05670.05560.03110.02360.03990.05090.03720.56390.65350.6544-0.60850.73550.7620
15、0.88200.92510.9122TANSIG是双曲线型正切S形传递函数 xexf)(LOGSIG是log型S形传递函数 xf1PURELIN是直线型传递函数 )(SSE为均方误差和对于只有一个隐藏层的模型来说隐藏层中神经元数量的增长使SSE从0.1012降到了0.0567,由此可知,为了降低SSE和提高相关系数,ANN结构应为双隐藏型的,在这种ANN结构中,ANN9模型给出了对于SSE和相关系数两方面都是最好的结果。建模的目标是获得最小的SSE,而上面提到的相关系数是指实际值和预报值之间的相关系数。模型使用包含在训练用数据中的那些数据来进行训练。训练的水平用实际数据和训练好的数据之间的相关
16、系数来进行评估。训练好的ANN模型用来进行预报,也就是说,将数据输入ANN模型中,它就会根据输入和输出之间的存在的逻辑关系计算出输出数据。在ANN模型输入和输出变量之间的隐藏层中包含了一个具有高度非线性的神经元泛函结构。每一个神经元或者处理元素接收到若干由前面的节点引发的输入信号 然后根据他们的连接权值 对各个信号进行处理。输入信号和处理元jxijw素的内部活性水平之间的关系由它的输入的权值总和给出,其形式如下: nijiixN)(其中 是指节点 中的网络输入信号(内部活性水平), 是指人工神经iNi ijw元 和 之间的连接权值, 是指来自于先前节点 的信号的值, 是指节点ij jxji的偏
17、差项, 使指来自先前的节点的输入信号的数目。n当输入信号的权值和超过了激发阈值 ,人工神经元输出一个通过传递函i数 得到的信号 。输出信号可以粗略的表示为输入信号 的函数:)(xfiy iN)(iiNfY其中 是一个输入范围在 之间而输出 范围在0,1xef1)( ,iy之间的的单值S形函数。在期望输出和实际输出之间的误差最小化之前,ANN需修改各层之间的连接权值而各节点也在随后的累积中偏移以容许进行对网络的一种类型的学习。对于数据来说最适合的ANN体系结构具有最低的SSE和最高的相关系数。在上面的ANN体系结构中,ANN9满足了这种要求。ANN9具有两个隐藏层,他们的激发函数分别是tansi
18、g(第一个隐藏层)-tansig(第二个隐藏层)-logsig(输出层)。对这个ANN模型的训练因为其对训练数据高达0.97的相关系数而令人满意。与卷入交通事故的百分比相对的子群数目用图表来进行评估(图4)。在该图中,X轴代表各个驾驶员子群的子群编号,Y轴为与之对应的子群卷入交通事故的百分比。用于训练的预报和实际值之间的关系为离散的,如图5所示。除此之外,在训练中累积的输入的预报值由ANN9模型给出,图6可作为对约为0.9122的相关系数的一种图解,而均方误差和大约为0.0372(如图7)。除了包括对检测数据的预报之外图6与图4的图解基本相同。图4 用ANN9模型进行训练后的训练值评估图5用于
19、训练的卷入交通事故的值的离散图图6 用ANN9模型进行预报后的预报值评估图7 训练中累积的均方误差和图8 卷入交通事故的预报值和实际值的离散图图7显示了500个初相在训练中累积的均方误差和(SSE),在前十个初相时该值是完全下降的,而在此后则逐渐只是趋于下降直到最后达到0.0372。图8显示了用于测试系统的预报和实际值的分布。从该图可看出,在用于测试的预报值和实际值之间由于其确定的达到0.9122的相关系数( )而具有很好的关系。2R本文采用Matlab神经网络工具箱来对数据库进行建模。在这个工具箱中,输入、输出和ANN体系结构已写在一个标准文件中,运行该神经网络工具箱即可进行训练和预报。5结
20、语本文的目的是对与交通事故中有关的驾驶员特性的影响进行建模以及使用人工神经网络来对那些训练中未曾使用的和数据库中不存在的输入数据的输出进行预报。由于人工神经网络是一种更有可塑性和想象空间的方法而且具有对所有的驾驶员特性进行相互评估/比较的能力,其被选来对驾驶员特性数据进行建模。无论如何,这些特性对交通事故的影响已经以0.97的相关系数建立了用于训练的模型,而对于那些训练中未曾使用的数据的输出则以0.91的相关系数进行了预报。在交通仿真方面使用此模型的可能情况是:一个包括个体的某些与其经历有关的、生理的和心理的特征并且能够在一定程度上反映可以建立和模拟的社会的数据库。模型也可以给出数据库中不曾包
21、括的人的信息。随着研究中模型的建立,人们由于他们的特性而卷入交通事故的风险度在不利用诸如花费大量时间来进行研究的心理学上的应用成果的基础上就可以被确定。随着信息的获得关于驾驶员的选择的前期方案就可以形成。在获得驾驶执照和稍后的实际行驶过程中一些控制就可以在某个特定的时间段内实施,因而该方法对相关的人和机构是有用的。目前已有的数据库还可以用本研究中已经展示了的ANN的一个应用建成一个更全面的数据库。当根据人们的可能使他们卷入交通事故的个人特性将他们分成若干个风险群体时也可以为他们准备不同的训练方案并应用于每一个群体。换句话说,个体卷入交通事故的风险度可以在事故真正发生之前确定并且其可以通过他们所
22、属的群体得到一个训练方案。这样的方法会比让所有人在交通安全方面进行相同的驾驶培训更为有效。本文通过一个交通工程方面的例子来使神经网络分析的巨大潜能得到发挥和应用。参考文献:1 S.F. Kalyoncuoglu, Analysis of driver behaviors influencing traffic safety in Turkey, I.T.U. Natural and Applied Science Institute, Ph.D. thesis, Istanbul, 1999 (in Turkish).2 I. Efil, The role of psychotechnique
23、 to minimize of work accidents, II. Seminar fur Verkehrssicherheit und Psychotechnische Anwendungen, Universitat Uludag, Bursa, 1990, pp.75100 (in Turkish).3 L. Evans, Traffic Safety and The Driver, Van Nostrand Reinhold, New York, NY, 1991.4 F.L. Mannering, Male/female driver, characteristics and a
24、ccident risk, Accident Anal. Prev. 25 (1993)7784.5 C. Labergenadeau, U. Maag, R. Bourbeau, The effects of age and experience on accidents with injuries-should the licensing age be raised?, Accident Anal. Prev. 24 (1992) 107116.6 W.E. Woodson, B. Tillman, P. Tillman, Human Factors Design Handbook, Mc
25、 Graw Hill, New York, NY, 1992, pp. 696710.7 B.D. Greenshields, Changes in driver performance with time in driving, Highway Res. Record 9(1996) 1118.8 V. Himanen, P. Nijkamp, A. Reggiani, J. Raitio, Neural Networks In Transport Applications,Ashgate, USA, 1998.9 B. Belgarovi, J.M. Blosseville, A Road
26、 Traffic Application of Neural Techniques, Recherche Tranports Sec. Eng., No. 9, Washington, DC, 1993, 5365.10 V.P. Huang, D. Prahlad Pant, A simulation neural network model for evaluating dilemma zone problems, in: 73rd Annual Meeting of Transportation Research Board, Washington, DC, 1994, pp. 913.
27、11 S.M. Chin, H.L. Huang, T. Per, Using neural networks to synthesize origindestination flows in a traffic circle, in: 73rd Annual Meeting Of Transportation Research Board, Washington, DC, 1994, pp.913.12 C.T. Lin, C.S. Lee, Neural network based fuzzy logic control and decision systems, IEEE Trans.Comp. 40 (12) (1991) 13201336.13 T. Loton, H.N. Koutsopoulos, Approximate reasoning models for route charce behaviour in the presence of information in Daganzo, in: Proceedings of 12th International Symposium on Transportation and Traffic Theory, 1993, pp. 7188.