1、毕 业 论 文(设 计)题 目 基于神经网络的中国人口预测算法研究 姓 名 宋 波 学号 1109064036 所 在 院 (系 ) 数 学 与 计 算 机 科 学 学 院 专业班级 信息与计算科学 1102 班 指导教师 赵 晖 完成地点 陕西理工学院 2015 年 5 月 25 日陕西理工学院毕业设计基于神经网络的中国人口预测算法研究作 者:宋 波(陕理工学院数学与计算机科学学院信息与计算科学专业 1102 班,陕西 汉中 723000)指导教师:赵 晖 摘要我国现正处于全面建成小康社会时期,人口发展面临着巨大的挑战,经济社会发展与资源环境的矛盾日益尖锐。我国是个人口大国、资源小国,这对矛
2、盾将长期制约我国经济社会的发展。准确地预测未来人口的发展趋势,制定合理的人口规划和人口布局方案具有重大的理论意义和实用意义。本文介绍了人口预测的概念及发展规律等。首先,本文考虑到人口预测具有大量冗余、流动范围和数量扩大的特性,又为提高人口预测的效果,因此,使用归一化对人口数据进行了处理,该方法不需要离散化原数据,这样就保证了人口预测的准确性和原始数据的信息完整性。其次,本文提出了一种基于神经网络预测的优化算法,该算法避免了人们在预测中参数选择的主观性而带来的精度的风险,增强了人口预测的准确性。同时,为说明该算法的有效性,又设计了几种人们通常所用的人口模型和 灰色预测模型算法,并用相同的数据进行
3、实验,得到了良好的效果,即本文算法的人Logistc)1,(GM口预测最为准确,其预测性能明显优于其他算法,而这主要是参数的选择对于增强预测性方面的影响,最终导致人口预测精确度。同时,在算法的稳定性和扩展性方面,该算法也明显优于其他算法。考虑出生率、死亡率、人口增长率等因素的影响,重建神经网络模型预测人口数量。关键词 神经网络 人口模型 灰色预测模型 软件Logistc)1,(GMmatlb陕西理工学院毕业设计Population projections based on neural networksAuthor: Song Bo(Grade11,Class 2, Major in Info
4、rmation and computing science, Mathematics and computer science Dept. Shaanxi University of Technology, Hanzhong 723000,Shaanxi)Tutor:Zhao HuiAbstract:Our country is now in the period of building a moderately prosperous society, demographic development is faced with great challenges, the contradicti
5、on between economic and social development and environmental protection increasingly sharp. Our country is populous country, resources small country, this contradiction will have long hindered the development of economy and society. Accurately predict the future demographic trends, population planni
6、ng and development of rational population distribution program has great theoretical and practical significance. This paper introduces the concept of population projections and development law and so on.Firstly, taking into account the population predicted to have a lot of redundancy, to expand the
7、scope and volume of flow characteristics, but also to improve the population projections of the effect, therefore, the use of normalized data were processed on the population, which does not require discrete raw data, this ensures that the population forecast accuracy and completeness of information
8、 the original data. Secondly, this paper presents an optimization algorithm based on neural network prediction, the algorithm avoids the people in the forecast parameters and risks subjectivity accuracy, and enhance the accuracy of population projections. Meanwhile, in order to show the effectivenes
9、s of the algorithm, and designed several people population model is usually used and the gray prediction model and algorithm, and tested using the same data, obtained good results, that population is the most accurate prediction algorithm, which forecast outperforms other algorithms, which mainly af
10、fect the selection parameters for enhanced predictability, eventually leading to population forecasting accuracy. Meanwhile, in the stability and scalability algorithm, the algorithm is also significantly better than the other algorithms.Consider the impact of fertility, mortality, population growth
11、 and other factors, rebuild the neural network model to predict population.Key words:Neural network population model grey prediction model software Logistc)1,(GMmatlb陕西理工学院毕业设计目录1. 绪论 .11.1 引言 .11.2 研究的背景及意义 .11.2.1 研究背景 .11.2.2 研究意义 .21.3 人口预测发展及研究现状 .21.4 基本目标及主要内容 .21.5 组织结构 .32.三种模型基本概念和原理 .32.1
12、 阻滞增长模型( 模型) .3Logistc2.2 灰色系统 预测模型 .4)1,(GM2.2.1 研究领域及理论 .42.2.2 灰色模型发展 .62.3 神经网络预测模型研究概述 .62.3.1 神经网络模型概念 .62.3.2 研究的发展 .62.3.3 研究领域 .72.3.4 神经网络学习过程 .73.本文算法描述 .83.1 阻滞增长模型的算法: .83.2 算法 .8)1,(GM3.3 神经网络算法实验 .94.数据处理 .104.1 模型预测 .10Logistc4.2 模型的求解 .13)1,(4.3 BP 神经网络人口预测模型 .155.仿真实验及分析 .185.1 数据来
13、源说明 .185.2 实验步骤 .195.3 实验结论及分析 .19陕西理工学院毕业设计5.4 实验结论 .20致谢 .22参考文献 .23附录 .24陕西理工学院毕业设计第 0 页 共 32 页1. 绪论1.1 引言中国是一个人口大国,人口的增长影响和制约着国家各个方面的发展,有效的预测人口数量,制定合理政策,将有利于国家的综合发展。人口预测是一个重要的理论和实际问题。传统的人口预测方法主要有 生物增长模型、灰色预测、回归分析等方法,这些方法在人口预测领域起到Logistc一定的作用,但是在建立模型时都要对模型进行假设。由于真实模型往往是非线性的。如果在一些简单的模型下进行数据模拟。结果往往
14、不能达到较好的效果。文献 5-7中提出的模型,虽有预测功能,其预测精度不高,误差较大,且复相关系数作为评价指标处于失真状态。神经网络的出现,提供了解决这类问题的一种有效办法。中国自古以来是一个人口大国。新中国成立后, 我国人口进入飞速发展阶段。1949 年到 1957年 8 年时间,人口增长了 1 亿;1964 年总人口超过 7 亿,1969 年总人口超过 8 亿,1974 年总人口超过 9 亿。这一时期每增长亿人时间间隔为 5 年。中国人口净增长率波动比较剧烈。80 年代以后, 由于我国实行了计划生育,人口膨胀得到了有效的控制。实行近 30 年来,使我国少生了 4 亿多人,为中国现代化建设,
15、全面实现小康社会打下了坚实的基础,同时也为世界人口控制做出了杰出贡献。但是由于中国人口基数大,人口增长问题依然十分严峻。 在我国现代化进程中必须实现人口与经济、社会、资源、环境协调发展和可持续发展,而人口问题始终是制约我国发展的关键因素之一。要发展,必须进一步控制人口数量,提高人口质量,改善人口结构。对中国未来人口的准确预测,能够为中国经济和社会发展的重大决策提供科学依据,这对加速推进我国现代化建设有着极为重要的现实意义。因此,根据已有数据运用数学建模的方法,对中国人口做出分析和预测是一个重要问题。1.2 研究的背景及意义 1.2.1 研究背景人口问题始终是经济和社会发展的核心问题,中国作为一
16、个发展中国家,占据着世界 19%的人口比重,居于首位。所以处理好中国的人口问题对促进中国的经济社会发展至关重要。当前的计划生育人口政策是我国的一项基本国策,实施于 1976 年,它主要是针对当时我国人口大量增加、人口发展与经济社会发展水平极不相应等现象提出来的。实施 30 多年来,取得了相应的成效,在中国人口基数很大的情况下,有效地遏制了人口过快增长,提高了全民族的人口质量,同时为国家积聚了财富,优化了人均资源水平,开辟了一条具有中国特色的人口可持续发展道路,但是任何违背人口自然规律的措施都是有两面性的,在取得目标成绩的同时,当前人口政策所带来的另一方面的负面影响逐渐显现出来,进入 21 世纪
17、以来,中国的人口、社会经济、环境形势发生了很大变化。出现了诸如人口出生性别比例失调,劳动力市场供给不足,老龄化趋势愈演愈烈等现象,这些都影响着中国经济社会发展的进程,成为目前亟待解决的问题。据统计,20 世纪与 21 世纪之交,我国的人口年龄结构率先步入老年型,2000 年,我国 65 岁及以上的老年人口比例达到了 6.96%,而第六次人口普查结果显示这个比例已高达 8.87%,中国城市老年家庭空巢率也增至 49.7%,农村已达 38%。这些对经济和社会的发展都提出了新的挑战,中国的人口问题也面临着新的研究环境。人口数量、质量和年龄分布等因素直接影响一个国家或地区的经济发展、资源分配、社会保障
18、、社会稳定和城市活力。对此,单纯的人口数量控制(如已实施多年的计划生育)不能体现人口规划的科学性。政府决策部门需要更详细、更系统的人口分析技术,为人口发展策略的制定提供指导和依据。随着对人口规划精准度要求的提高,通过数学方法来定量计算各种人口指数的方法日益受到重视,这就是人口控制与人口预测。准确的人口预测为制定合理的社会经济发展规划提供了科学依据。例如,要制定生育计划,就必须知道未来妇女的生育率;要制定社会保障体系,就必须知道未来老年人口动态变化量。这些都离不开人口预测。政府可以根据这些未来人口信息状况,结合社会经济发展,在制定国民经济发展决策时,通过调控人口的方法对未来社会经济发展中的产业结
19、构进行相陕西理工学院毕业设计第 1 页 共 32 页应的调整,使劳动力资源得到充分地开发和利用,社会资源得到合理分配,并采取措施提前应对由老龄化,低生育率等人口因素而可能产生的社会经济问题,从而使社会经济协调发展。中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。我国人口发展经历了多个阶段,近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长。全面建成小康社会时期是我国社会快速转型期,人口发展面临着前所未有的复杂局面,人口安全面临的风险依然存在。1.2.2 研究意义从历史的角度看,本论文研究具有深
20、刻的历史意义(人口预测与人口控制历来是人口研究中的重要课题,实施准确的人口控制可为制定合理的社会经济发展规划提供了科学依据,而进行人口预测的研究是实施人口控制的基础)。中国人口的主要特点是人口基数大、人口增长快,由此所衍生的诸多问题都不利于更多地增加社会积累和提高人均消费水平,将导致国内劳动适龄人口的过速增长,就业压力将加大,也不利于改变现有的人口结构及提高全民族的人口素质。目前,中国的自然资源总量在世界各国排名中仍位居前列,堪称资源大国,但人口的过快增长消耗了过多的自然资源,降低了人均资源占有率,导致了社会资源的过度开发,表现在国内许多地区的生态平衡已经打破,如植被破坏、水土流失、风沙侵蚀、
21、灾害频繁和环境污染等现象。最终的后果是对国家的可持续发展造成严威胁,此与中国正致力于发展经济的宏伟目标相悖(中国政府的目标是力争在 2050 年左右达到中等发达国家水平,而基于此发展目标,必然要求控制中国人口数量,减缓中国人口的增长速度,这是今后时期中国人口政策的主要目标之一)。1.3 人口预测发展及研究现状人口是一个国家经济社会发展的重要因素,是反映国家基本情况的重要指标,也是引导国家发展的关键。人口预测是指在一定范围内,根据人口现状和对相关参数做出的假定,采用某种方法(预测模型),对未来某个时间段的人口现状、结构和趋势的预测。人口预测可以科学地把握人口发展态势,是人口研究领域中的重要课题,
22、中国是一个人口大国,准确的预测结果可以为下一步我国人口发展规划提供理论与实证依据。人口预测研究的方法始于国外,早在 1697 年,英国就幵始了进行人口预测的相关研究,社会学家、人口学家 GKing 教授利用一种比较简单的数学理论模型,基于纯手工计算,对英国的人口发展状况进行了未来 600 年的宏观预测。虽然其预算方法比较粗糖,时间跨度也太长,预算结果可参考性不大,但是这种预测人口的思想对后人研究人口预测领域有着很大的启迪作用,为以后人口预测模型的发展奠定了基础。国内的人口预测模型研究发展较晚,直到 1949 年新中国成立后,国内专家相继对国外的相关研究进行了梳理与扩展,同时取得了丰硕的研究成果
23、,有继承也有创新。在前期研究中多采用定性方法分析,之后才引入数学理论模型,比如人口总量趋势外推模型、人口增长率预测模型、灰色预测模型、BP 神经网络模型、人口发展方程、多区域人口预测模型、回归方程等。人口预测,作为经济、社会研究的一种方法,应用越来越广泛,也越来越受到人们的重视。在描绘未来小康社会的蓝图时,首先应要考虑的是未来中国的人口数量、结构、分布、劳动力、负担系数等等,而这又必须通过人口预测来一一显示。人口预测研究是国家制定未来人口发展目标和生育政策等有关人口政策的基础,对于国民经济计划的制定和社会战略目标的决策具有重要参考价值。因此,可以说人口预测的整个研究仍处于一个不断完善、不断发展
24、的过程当中。1.4 基本目标及主要内容以 1990 年、2000 年、2001 年、2002 年等为人口数据基准预测年,通过 仿真软件对中matlb国历年人口数据资料进行样本点采集,以逐次编码仿真实验对人口数据进行实测,通过多项式及傅立叶级数来动态建立及改进 和 等单种群人口预测模型,对采集的人口数据资料按年MalthusLogitc龄分组,构造 矩阵,建立相应的 模型,对人口分布结构进行预测,修正人口预测误差,优Lesliel陕西理工学院毕业设计第 2 页 共 32 页化模型的预测结果,将所构造的人口预测模型的准确度提高到实用化程度,其中由 仿真的长matlb期预测模型的曲线拟合,其可决系数
25、将不低于 0.99。本论文主要是通过数学建模和计算机仿真技术相结合的手段,来研究实用化的中国人口预测动态建模问题。人口预测模型参数的科学认定,是人口预测实践中的重要环节,采用 进行仿真计tl算,通过实测来设计高准确度的人口预测改进模型和适于相应修正的优化参数,以反演的方式建立长期预测,进而得出符合中国人口增长特点的人口预测实用化模型。中国国务院正式发布国家中长期科学和技术发展规划纲要(2006-2020) 11,其在人口与健康领域确定的发展思路之一,即是控制人口出生数量,提高出生人口质量。重点发展生育监测、生殖健康等关键技术,开发系列生殖医药、器械和保健产品,为人口数量控制在十五亿以内、出生缺
26、陷率低于百分之三提供有效科技保障。本文分析了当前人口预测系统中分类算法的不足,尝试不断不改进算法,以期望达到良好的效果。针对这些问题,本文做了如下工作:1.介绍了普通算法( 人口模型、灰色模型)的原理分析;Logistc2.通过分析相关算法来指出它们的缺点和不足,并指出引入本文所采用的神经网络算法后所达到的改善的效果;3.用 软件对数据进行仿真实验,验证改进后算法的有效性。matlb1.5 论文组织结构本论文研究内容与安排:第一章,绪论,介绍了人口预测的研究背景、意义和人口预测的主要内容,并给出了文章的结构安排。第二章,介绍 模型、 灰色模型及神经网络预测模型的基本概念和原理。Logistc)
27、1,(GM第三章,介绍 模型、 灰色模型及神经网络预测模型的算法实现。第四章,主要介绍三种预测模型在人口预测方面的数据处理。第五章,预测结果的比较和模型的最优化选择。第六章,结论,对全文做了总结,并对以后需要进行的工作进行了展望;参考文献和致谢。2.三种模型基本概念和原理2.1 阻滞增长模型( 模型)Logistc模型是种群生态学的核心理论之一。100 多年来,它几乎是描述种群 型增长的唯一数Logistc s学模型。利用它可以表征种群的数量动态;如鱼类种群的增长 ,收获与时间关系的确定。描述某一研究对象的增长过程如生态旅游区环境容量的确定,森林资源的管理以及耐用消费品社会拥有量的预测、国民生
28、产总值的预测等; 也可作为其它复杂模型的理论基础如 Lo 次 a 一 Volterra 两种群竞争模型;以上的大多数的工作都是拿逻辑斯蒂模型来用 ,但也由此可看出逻辑斯蒂方程不管在自然科学领域还是在社会科学中都具有非常广泛的用途。因此对其的产生、发展、演变及其类型给以系统的阐述显得非常有必要。方程最早是由比利时数学家 Verhu 于 1838 年推导出来, 由于其能较好地描述某些有界Logistc增长现象 ( 型曲线增长) , 现已广泛地应用于预测学、信息科学、生物学、农业学和经济学等多S个领域。 曲线模型是描述因变量随时间变动趋势的模型 , 因其计算简单, 经济含义明显,在产品市场扩展分析方
29、面也备受青睐。美国 Ed -winMansfield 关于新产品市场扩张的 模型的Logistc一微分方程为:(1)(1)dFbt其中 mty)(为 时刻市场上存在的可以使用的新产品的数量, 即市场保有量, 由第 期的保有量加上当)(ty t陕西理工学院毕业设计第 3 页 共 32 页期销售量减去当期报废量即可得到。 为市场最大容量, 即市场的最大保有量; 为某一时刻新产mF品市场保有量与最大市场保有量之比; 为常数。由分离变量法求解式 ( 1) , 得b(2)btaetF1)(其中, 为常数。则 时刻产品的保有量 ,at )(*)(tFty增长量最大的时刻 。T)ln(*2.2 灰色系统 预
30、测模型1,GM2.2.1 研究领域及理论在自然界和思维领域,不确定性问题普遍存在,大样本多数据的不确定性问题,可以用概率论和数理统计解决;认识不确定性问题,可以用模糊数学解决。然而,还有另外一类不确定性问题,即少数据、小样本、信息不完全和经验缺乏的不确定问题,少数据不确定性亦称灰性,即灰性问题,利用前述理论难以解决。按照系统与信息之间的关系,人们将系统分成三类,信息完全明确的叫做白色系统,信息完全不明确的叫做黑色系统。信息部分明确,部分不明确的系统叫做灰色系统。人体是灰色系统,因为尽管人体的部分外部参数,如身高、体重以及部分内部参数,如体温、血压是已知的,但有更多的参数是未知的。除人体之外,工
31、业、农业、社会经济等领域,由于运行机制不清晰、环境变化、条件复杂、处理手段有限等,有许多的系统呈现灰性,需要创立一种新的理论对其进行研究解决 12。灰色系统理论就是解决灰性问题的理论,它是由华中理工大学的邓聚龙教授于 1982 年创立的,目前在我国已经成为社会、经济、科教、技术等很多领域进行预测、决策、评估、规划、控制、系统分析与建模的重要方法之一,成功地解决了很多实际问题。特别是它对时间序列短、统计数据少、信息不完全系统的建模与分析,具有独特的功效,得到了广泛的应用。灰色系统提供了充分利用已知信息且尽量考虑未知信息来处理灰色问题的理论和应用的手段。灰色系统研究的是部分信息明确、部分信息未知的
32、小样本、贫信息不确定性系统,它通过对已知部分信息的生成去开发、了解、认识现实世界,着重研究外延明确,内涵不明确的对象。灰色系统理论的实质是将无规律的原始数据进行累加生成,得到规律性较强的生成数列后再重新建模,由生成模型得到的数据再通过累加生成的逆运算累减生成得到还原模型,由还原模型作为预测模型。灰色系统 4:所谓灰色系统是指既含有已知信息, 又含有未知信息的系统, 是由邓聚龙)1,(GM教授在 1986 年提出的。灰色理论自诞生以来, 发展很快 , 由于它所需因素少, 模型简单, 特别是对于因素空间难以穷尽, 运行机制尚不明确, 又缺乏建立确定关系的信息系统, 灰色系统理论及方法为解决此类问题
33、提供了新的思路和有益的尝试。灰色预测方法是根据过去及现在已知的或非确知的信息, 建立一个从过去引申到将来的 模型, 从而确定系统在未来发展变化的趋势, 为规划决策GM提供依据。在灰色预测模型中, 对时间序列进行数量大小的预测, 随机性被弱化了, 确定性增强了。此时在生成层次上求解得到生成函数, 据此建立被求序列的数列预测, 其预测模型为一阶微分方程, 即只有一个变量的灰色模型, 记为 模型。灰色 预测模型在计算过程中主要是以矩)1()1(阵为主, 它和 的结合可以有效的解决了灰色系统理论在矩阵计算中的问题, 为灰色系统理论matlb的应用提供了一种新的方法。预测模型的基本原理: 模型是灰色预测
34、的核心 , 它是一个单个变量预测的一)1,(GM),(阶微分方程模型, 其离散时间响应函数近似呈指数规律. 建立 模型的方法是:)(GM设 为原始非负时间序列, 为累加生成序列, 即),2(,000 nXX 1tX( 1)imntt1)(1 ,2陕西理工学院毕业设计第 4 页 共 32 页GM(1,1)模型的白化微分方程为:( 2) uaXdt)1()(式( 2) 中, 为待辨识参数, 亦称发展系数; 为待辨识内生变量,亦称灰作用量。设待辨识向a u量 , 按最小二乘法求得 式中ua yBT1)(1)()1(231)2()1(2)nXB)(30)(0nXy于是可得到灰色预测的离散时间响应函数为
35、:( 3) auet t)1()(0)1为所得的累加的预测值,将预测值还原即为:)1(tX(4))3,21(),1()()0 ntXtt 2.2.2 灰色模型发展基于灰色系统建立的预测模型被称为灰色模型(Grey Model),简称为 模型。发展至今,GM模型之所以被广泛应用与研究,主要基于它的五个优点:GM1)不需要大量的样本;2)样本不需要有规律性分布;3)计算工作量小;4)定量分析结果与定性分析结果不会不一致;5)可用于近期、短期和中长期预测。灰色系统模型通俗地,被表示为 ,其中 表示微分方程的阶数, 表示不微分方程的变),(inGMW量数。虽然由一般灰色模型 可以派生出很多类型的灰色模型,但是在预测中,研究人员以及m实际工作者都将目光聚焦在计算效率较高的 1 阶、1 个变量的微分方程模型 。在实际应用)1,(GM性能上,计算负担被认为是最主要的评价指标 10。简易地, 只需要仅仅四个输入数据就可以实)1,(G现一个预测 13,尤其对成指数发展的指标数据非常有效。在预测科学中,我们所研究的社会、经济、军事、气象、水文、农业、工业等统计数据,有时候并非以海量的形式出现,例如年工业生产总值、