1、书山有路勤为径,学海无涯苦作舟。旅游需求的预测预报 找文章到第1更多原创-(http:/) 摘要。旅游需求的预测预报研究一直是旅游学研究的一个重要课题。本文在对到访澳门地区中国内地游客量分析的基础上,运用人工神经网络(ann)的理论和方法,构建了ann模型分析中的3层bp模型,以澳门近10年(1996-2021)入境来访的中国内地旅游人数为例进行模型验证,模拟结果表明,bp神经网络预测的结果能够高程度的吻合原始数据,在旅游市场预测中,bp神经网络预测是一种有效的预测方法。 一、问题的提出与分析 近年来,对澳门地区的旅游业来说,中国内地旅客是旅游收入的主要来源。目前旅游业已成为澳门地区经济发展特
2、别是第二产业发展的支柱。建立科学的可操作的旅游预测模型是实现澳门地区旅游业持续健康稳定发展的理论基石和前提。由于影响某地旅游人数的因素各异,还不存在普遍适用的神经网络模型。 基于此,本文拟用3层bp神经网络模型来仿真模拟分析和预测澳门地区旅游需求,以此为旅游需求预测提供一种新的方法。 二、模型的假设与符号说明 1.基本假设 1)交通在旅游中通常不是重要的,为了研究的方便(主要是无法获得交通数据),把交通这个影响忽略。 2)假设澳门的接待能力都满足需求。 3)在本例旅游需求预测模型中,我们考虑的主要因素有。客源地的人口,客源地的总收入,客源地的消费水平,旅游目的地的生活水平。 4)为了研究的方便
3、,假定以上四因子之间相互独立,本例旅游需求即为上述四因子的函数,即y=f(gdi,pop,gde,m-gp)。就用这四个因素作为人工神经网络模型输入层的神经元。 2.符号说明 t澳门内地游客量 gdi中国内地国民总收入 pop中国内地人口总数 gde中国内地国民消费水平 m-gp澳门生产总值 三、模型的建立与求解 1.人工神经网络模型理论原理 人工神经网络(artificialneuralnetwork)是由大量的、简单元件(神经元)广泛相互联结而成的非线性的、动态的复杂网络信息处理系统,它是在现代神经学研究成果基础上提出的,能模拟人脑的若干基本功能1。它具有并行分布的信息处理结构,可以通过“
4、自学习”或“训练”的方式完成某一特定的工作。它可以从积累的工作案例中学习知识,尽可能多地把各种定性或定量的因素作为变量加以输入,从而建立各种影响因素与结论之间的高度非线性映射,采用自适应模式识别方法来完成预测工作2。人工神经网络模型尤其是对处理内部规律不甚了解、不能用一组规则或方程进行描述的复杂的、开放的非线性系统显得较为优越。 人工神经网络模型一般由处理单元、激活状态、单元输出、连接模式、激活规则、学习规则等6个部分组成。一个多层神经网络中包含有很多个信息处理单元,分布于不同的层次中。根据每项输入和相应的权重获取一个综合信号,当信号超过阈值则激活神经元而产生输出。各类影响因素和最终输出结果之
5、间可以假定存在一种映射,即输出结果f(影响因素)。为了寻求最佳的映射关系f,将训练样本集合和输入、输出转化为一种非线性关系,通过对简单非线性函数的复合,从而建立一个高度的非线性映射关系f,最终实现输出值的最优逼近3。 在人工神经网络的实际应用中,8090的人工神经网络是采用前馈反向传播网络(back-propagation-network,简称bp网络)或它的变化形式。bp神经网络(如图一)是一种单项传播的多层前向神经网络,分为输入层、隐含层和输出层,层与层之间采用全连接方式,同一层单元之间不存在相互连接。它是前向网络的核心部分,体现了人工神经网络最精华的部分4。标准的bp网络是根据w-h学习
6、规则,采用梯度下降算法,对非线性可微函数进行权值训练的多层网络。 图一: bp神经网络的每一层的权值通过学习来调节,其基本处理单元为非线性输入输出关系,选用s型作用函数: 其中:xj为该神经元第i个输入;wij为前一层第i个神经元至该神经元j的连接权值,i0时的权值为阈值。其计算步骤如下: (1)给定一组随机的权值和阈值初始值及步长系数与势态因子; (2)取学习样本数据,根据学习样本、权值及阀值计算输出,并与学习期望输出比较,当误差满足要求时结束训练,否则将误差向后逐层传播,并修正各层连接权值,调整公式为: 其中。k取j结点所在层的前一层所有结点。 5)澳门内地旅客人数神经网络模型的建立旅游需
7、求的预测预报p (一)bp网络设计 网络设计是一个综合性问题,它应满足多种不同要求,例如,希望所涉及的网络有较好的推理能力,易于硬件实现,训练速度快等,其中有较好的推理能力是最主要的。一般来说,推广能力决定于3个主要因素,即问题本身的复杂程度、网络结构以及样本量大小。在一般情况下,旅游需求预测研究中样本的数量是一定的,因此可归结为在样本量一定的情况下,如何选择网络规模的问题。 在进行bp网络预测模型设计中,我们主要考虑以下因素。网络的层数、每层中的神经元个数、初始值的选择、学习速率和期望误差。 i)网络的层数 已证明。具有偏差和至少一个s型隐含层加上一个线性输出层的网络,能够逼近任何有理函数。
8、所以,本文选择一个3层的bp网络。 ii)每层中神经元的个数 输入层和输出层神经元的个数根据解决具体问题的复杂程度而定。为了提高网络训练的精度,可以通过采用一个隐含层,再加上1到2个神经元以加快误差的下降速度即可。因此,本文输入层神经元个数选择为4个,隐含层神经元个数分别选择了9、12、15个,输出层神经元个数选择为1个。 iii)初始值的选择 由于人工神经网络是一个非线性系统,初始值的选择对于网络学习是否达到局部最小、是否能够收敛以及训练时间的长短都有较大影响。在初始值的选择上一般是使经过初始值加权后的每个神经元的输出值都接近零,这样可以保证每一个神经元的连接权值都能够在它们的s型激活函数变
9、化最大处进行调解。所以,初始值一般选择在(-1,1)之间的随机数。本文的初始值为默认值。 iv)学习速率 对于任何一个网络都对应一个合适的学习速率。学习速率决定每一次循环训练中所产生的权值的变化量。大的学习速率可以导致网络的不稳定,但是小的学习速率又会导致训练时间延长,收敛速度较慢,不能保证网络的误差能最终趋于最小。综合上述考虑,在学习速率的选择上倾向于选择较小的学习速率以保证网络的稳定性,本文选择的学习速率为0.01。 v)期望误差值 期望误差值的确定也是通过网络对不同误差值分别进行训练比较后确定的最适合值。所谓的最适合值是相对于所需要的隐含层的节点数来确定的,一个较小的误差值的获得需要增加
10、隐含层的节点以及训练时间。本文经过不断测试,选择0.0001为期望误差值。 (二)1.网络训练模式的选择 训练网络有两类模式。逐变模式和批变模式。在逐变模式中,每一个输入被作用于网络后,权重和偏置量被更新一次。在批变模式中,所有的输入被应用于网络后,权重和偏置量才被更新一次。使用批变模式不需要为每一层的权重和偏置量设定训练函数,而只需为整个网络制定一个训练函数,使用起来相对方便,因此,本文在进行网络训练时采用批变模式。 表格一: 年度 澳门的内地游 客量(t)(千人) 中国内地国民总 收入(gdi)(亿元) 中国内地人口 数(pop)(万人) 中国内地居民消 费水平(gde)(元) 澳门生产总
11、值 (m-gp)(亿美元) 1996 604.2 70142.5 122389 2789 66.3 1997 529.8 77653.1 123626 3002 66.7 1998 816.8 83024.3 124761 3159 61.9 1999 1645.2 88189.0 125786 3346 59.2 2021 2274.7 98000.5 126743 3632 61.0 2021 3005.7 108068.2 127627 3869 61.9 2021 4240.4 119095.7 128453 4106 68.2 2021 5742.0 135174.0 129227
12、4411 79.2 2021 9529.7 159586.7 129988 4925 103.3 2021 10463 183956.1 130756 5439 115.6 2.数据和模型的建立 神经网络模型要求数据具有。a、易获得性b、可靠性c、可测度性。本项研究采用很可靠的官方发表的数据作为分析的数据源(见表1),主要来自于中国统计局网。 用3层bp网络模型对本例旅游需求进行模拟,根据bp网络的映射原理,对于样本集合x和输出y,可以假设存在一映射f。为了寻求f的最佳映射值,bp网络模型将样本集合的输入、输出转化为非线性优化,通过对简单的非线性函数的复合,建立一个高度的非线性映射关系,实现f
13、值的最优逼近。对于本例旅游需求模型的模拟:其输入层结点数(4个神经元):中国内地国民总收入(gdi)、中国内地人口总数(pop)、中国内地国民消费水平(gde)、澳门生产总值(m-gp)。把澳门内地游客量(t)作为输出结点。从而得出3层前馈反向传播神经网络模型。 四、模型结果及分析 1网络训练性能的检查。 不同个数的隐层单元组成的bp网络训练曲线如图1,2,3所示。通过比较发现,中间层神经元个数为9和12时,网络的收敛速度比较快。 2网络预测性能的考查。 在数据列表中选取1996年到2021年的数据作为网络的测试数据。2021、2021年的游客量检验误差曲线如图4。 其仿真结果令人满意,达到预
14、期的效果。 图1 图2 图3 图4 五、模型的应用与评价(优缺点与改进) 从上面的分析可以看出,3层bp神经网络模型的仿真模拟效果是邻人满意的。可以看出,人工神经网络的拟合精度比较高,主要是基于人工神经网络抗干扰能力强,稳定性好,能自动准确地找出各种输入和输出之间的线性或非线性关系,具有较强的模拟适应能力等特点。在本例对于澳门的内地游客量的旅游预测中bp神经网络模型是一种有效的预测方法。 这一研究方法为旅游学的定量预测研究提供了一种新的思路,也为工程实践问题中的一些研究工作提供了一种非常好的指导方法。 虽然bp网络得到了广泛应用,但其自身也存在一些缺陷和不足,主要包括几个方面的问题。 首先,由
15、于学习速率是固定的,因此,网络的收敛速度慢,需要较强的训练时间。 再次,网络隐含层的层数和单元数的选择尚无理论上的指导,一般是根据应验或者通过反复试验确定的。因此,网络往往存在很大的冗余性,在一定上也增加了网络学习的负担。 六、原题附带问题简析 通过对本例旅游需求模型的分析,我们认为在利用数学建模的方法对旅游需求进行预测预报时,对于数据的采集和整理工作需要认真做好。对于数据的分析有助于我们寻求变量间的关系,以形成初步的想法。如何获得数据以及如何获得准确的数据对于我们研究实际问题具有相当重大的意义。收集数据并非多多益善,而是要弄清究竟需要哪些数据,剔除不必要的数据,从而减少冗余的工作。同时,需要
16、什么形式的数据也是我们应该思考的一个问题,这与建立模型的目的和所选择的模型的特点有关。 参考文献 1王士同,等.问题求解的人工智能:神经网络方法m.北京:气象出版社,1995. 2hillt,marquezoconnorm,remusw.artificialneuralnetworkmedelsfor forecastinganddecisionmakingj.internationaljournalofforecasting,1993, 10(3):5-15. 3karayiannisnb,venetsanopoulosan.artificialneuralnetwork:tearning algorithms,performanceevaluationandapplicationm.boston:kluweracademic,1993. 4丛爽,面向matlab工具箱的神经网络理论与应用m.合肥:中科学学技术大学出版社,1998.45. 旅游需求的预测预报 第 13 页 共 13 页