1、2007 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): 我们的参赛报名号为(如果赛区
2、设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):2007 高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1题目:中国人口增长预测摘要当今社会是一个自由竞争的社会。在国与国的世界竞争中,综合国力起了关键性的影响,而人口问题是综合国力的主要因素,近些年来我国人口
3、发展出现很多的新问题,这对我国人口总数起了很大的影响,如何考虑这些综合因素,建立合理的人口增长模型,对我国国策的科学制定,乃至我国在国际社会中的竞争有至关重要的影响。本文从抽样调查数据和近几二三十年我国人口总数统计值出发,利用Excel, SPSS,MATLAB 等数学软件分析了某地区样本抽样数据,并预测了全国人口发展趋势。文章主体分为三个部分。第一部分,我们对全国人口总数作了短期预测。首先,利用 2001 年 2005 年的抽样调查数据,分析了人口增长的指数模型模型一;在此基础上,我们考虑了人口自让增长率与时间的变化关系,利用二次多项式拟合的办法,依据 1978 年到 2005 全国人口总数
4、的部分数据,建立了第二个全国人口增长函数模型。作为模型优劣性的检验,我们分别利用这两个模型对已知年限作了估计,我们发现估计值与我们的真实值差距在 0.02 以内。第二部分,我们借鉴 Logistic 人口模型的思想,从阻滞人口增长的角度出发,结合我们已有的全国总人口数据,拟合出了全国人口增长模型三,模型预测 2010 年和 2020 年的数据是:13.3899 亿和 14.3493 亿,峰值预测值是 14.5605 亿,峰值估计在 2039年左右达到,这与国家人口发展战略研究报告中提到的数据“2010 年和2020 年预测的值 13.6 亿和 14.5 亿,2033 年 15 亿左右”是比较接
5、近的。介于这三个模型都是从总体的角度,笼统考虑因素对全国人口总数的阻滞和促进作用,这使得估计数值与真实数值间存在差距,所以文章在第三部分,具体分析了各个因素的抽样分布情况。在此基础上,对影响人口的几个主要因素:老龄化、人口数、扶养比、生育率等,作了数据拟合和分析,由此我们可以进一步细化、优化模型。关键词样本抽样 MATLAB 数据拟合 Logistic 模型 人口预测人口自然增长率 人口老龄化 抚养比 迁移率2一、问题重述当今社会是一个自由竞争的社会。在国与国的世界竞争中,综合国力起了关键性的影响,而人口问题是综合国力的主要因素。我国是一个人口大国,而且近些年来我国人口发展出现很多的新问题,例
6、如:老龄化进程加速、出生人口性别比持续升高、乡村人口城镇化等。这对我国人口总数起了很大的影响,如何考虑这些综合因素,建立合理的人口增长模型,对我国国策的科学制定,乃至我国在国际社会中的竞争有至关重要的影响。针对上文提到的人口发展制约因素问题,2007 年初发布的国家人口发展战略研究报告(附录 1),对此作了进一步分析。此外,我们从中国人口统计年鉴上收集到的部分数据(见附录 2) 。本文首先从中国的实际情况和人口增长的上述特点出发,参考附录 2 中的相关数据(也可以搜索相关文献和补充新的数据) ,建立中国人口增长的数学模型;其次,我们对中国人口增长的中短期和长期趋势做出预测;最后分析了模型的优劣
7、,以及模型优化的方向。二、假设说明1、014 岁及 49 岁以上妇女均无生育能力;2、各年龄段人口性别比例和生育率基本稳定;3、国际间移民问题对模型影响不明显;4、仅考虑农村人口往城镇的单向转移;5、忽略考虑意外事件对人口增长的影响,如自然灾害,疾病传播等;6、各个年龄段的妇女比例不随时间变化;7、资源在人口发展与经济发展的承载范围之内。三、符号说明:时间(年) ;t:第 t 年的人口总数;()P:人口总数;p:最小承受资源量下的最大人口数;m:人口自然增长率;k:人口固有增长率;0:资源总量;K:出生率;s:死亡率;d3:第 m 年,年龄为 i,性别为 j,户口为 k 的人所占的人口比率,
8、()kijai=0,1,2,90; m=2001,2002,2003,2004;k=1,2,3, 1(城市),2(镇),3(乡);j=1(男),2(女);:年龄为 i,户口为 k 的人所占的人口比率, i=0,1,2,90; k=1,3, 1(城ki市),3(乡); :第 m 年,年龄为 i,性别为 j,户口为 k 的人的死亡率, (kijdi=0,1,2,90;m=2001,2002,2003,2004; k=1,2,3, 1(城市),2(镇),3(乡);j=1(男),2(女);:第 m 年,年龄为 i,户口为 k 的人的死亡率, ()kidi=0,1,2,90;m=2001,2002,20
9、03,2004; k=1, 3, 1(城市),3(乡);:第 m 年,户口为 k 的人口数,m=2001,2002,2003,2004;k=1,2,3, ()kc1(城市),2(镇),3(乡);:第 m 年,年龄为 i,户口为 k 的人口数,m=2001,2002,2003,2004;k=1,3, (ki1(城市), 3(乡),i=0,1,2,90;:第 m 年,年龄为 i,户口为 k 的女性生育率,k=1,3, 1(城市),3(乡);(kib:第 m 年的死亡率;()d:第 m 年的出生率;():第 m 年的自然增长率;()k:第 年 岁的城镇人数;iAni:第 年 岁的乡村人数;()a:第
10、 年年龄为 的城镇人的死亡率;nDii:第 年年龄为 的乡村人的死亡率; )(d:第 年年龄为 的城镇妇女的生育率;nBii:第 年年龄为 的乡村妇女的生育率;bQ:城镇妇女占城镇总人口的比例;q:农村妇女占农村总人口的比例;e(t):第t年的迁移率。4四、问题一模型一众所周知,在给定初值的情况下,人口总数就由人口的自然增长率 来确定。k即: ,其中 是某年全国人口总数。我们这个模型通过对()1(0)tPtk()P中国人口统计年鉴中 2001 到 2005 年的人口抽样统计数据的分析,给出了自然增长率 的一个估计值,进而估计出全国人口变化的数学模型。 具体模型如下:第 m 年某地区的自然增长率
11、: ()()()mmkbd ;第 m 年某地区的出生率: ;349()()2()15()kikkimjac第 m 年某地区的死亡率: ;3249()()215() ()1kijkkjimmkjabcd我们知道一定时期内总和生育率,就是指该时期内各年龄组妇女生育率的合计数。它反映了每名妇女按照某一年的各年龄组生育率渡过育龄期,平均可能生于的子女数。由此可见,出生率就可以由生育率来得到。具体抽样分析结果如下:年份 出生率 死亡率 自然增长率2001 0.011329 0.005934 0.0053952002 0.011292 0.006079 0.0052142003 0.001101 0.00
12、6297 -0.00522004 0.010883 0.006389 0.0044942005 0.009367 0.006184 0.003183表一 某地区抽样结果从表中,我们可以看出人口总体呈上升趋势,但 2003 年和 2005 年的数据些异常。具体地讲,一方面 2003 年该地区因 “非典”的缘故,人口总数出现了下降的趋势,但是考虑到该现象的特殊性,我们采取“小概率事件不可能发生”的办法,暂时忽略考虑改组数据;另一方面,2005 年该地区数据偏大,但是介于其间统计数值均属比例系数,不影响出生率和死亡率的判断,我们还是选择保留对该数据的讨论。5首先,我们从定量的角度,给出全国人口模型的
13、一个指数分布模型;=0.4571k12k=4(k1,k2,k4,k5 分别表示 2001,2002,2003,2004 年的自然增长率) ;.().)(tPtP首先,我们以该地区 2001 年的人口总数 为初始值,在此基础01259上分别对 2002 年,2003 年,2004 年该地区的人口总数作了估计,结果是:1233300, 1237100,1236200。这与 2002 年,2003 年,2004 年的真实值:1258951, 1260498 ,1253065 误差比较小。下面我们还从总体(全国人口数)出发,给出了 1978 年到 2005 年 的真实值与估计值的比较表格,进一步说明该
14、模型在预测短期全国总人数上面的可行性。年份 真实值(万) 估计值(万)年份 真实值(万)估计值(万)1978 96259 110400 1996 122389 1198501980 98705 111420 1997 123626 1204001985 105851 113990 1998 124761 1209501989 112704 116080 1999 125786 1215001990 114333 116610 2000 126743 1220601991 115823 117150 2001 127627 1226101992 117171 117680 2002 128453
15、 1231701993 118517 118220 2003 129227 1237401994 119850 118760 2004 129988 1243001995 121121 119300 2005 130756 124870表二 全国人口模型预测对比(人口数参考附录一)全国人口模型: ,其中()10.457)(0tPtP(0)127498( 年 人 口 数 )1980 1990 2000 2010 2020 2030 20401.11.151.21.251.31.351.41.45x 105万万万万万万万万万万万万万图一:全国人口预测6然而,我们知道自然增长率是随时间变化而变化的,
16、作为模型的优化,我们利用二次多项式拟合的方法,结合 1978 年到 2005 年全国人口的真实数据,给出了我国人口总数的另一个模型。模型二,2()0.94360.71940.56P(t+1)=k(t)kt tP其中 (1989 年的人口数)(0)1274P图二:全国人口自然增长率函数模型二对应的人口变化如下图:图三:模型二对应的人口变化从上述模型的图像和表格,我们可以看出模型二比模型一在描述人口增长率的速度上有了很大的提高,尤其是在 2050 年以前。同时,这与国家人口发展战略研究报告中所提到的, “总人口将于 2010 年、达到 13.6 亿人” ,还是比较吻合。一方面,我们可以从模型二的完
17、善中,断定如果我们能获得更多数据的话,7我们就能对模型一做进一步的完善,更好地利用局部抽样来预测我国人口的发展前景。另一方面,这两个模型在 2010 年以后的预测中,都与国家人口发展战略研究报告提到的“总人口将于 2010 年、2020 年分别达到 13.6 亿人和 14.5 亿人,2033 年前后达到峰值 15 亿人左右” ,有不小的差异。本文从该问题出发,结合我国实际数据,借鉴经典的阻滞增长模型(Logistic 模型) ,建立了第三个模型(中长期全国人口预测模型) 。问题二模型三在模型一和模型二中,我们笼统考虑了出生率对人口增长的推动作用和死亡率对它的阻滞作用,而忽略了自然资源、环境条件
18、等对人口的增长起着阻滞作用。然而随着人口的增加,这些因素的阻滞作用却又变得越来越大。下面我们主要从阻滞人口增长的角度出发,建立新的人口模型。对此,我们先做一基本假设:假设人口的增长率是关于人口数量的线性递减函数。在此基础上,我们具体模型分析如下:一方面,人口增长率跟每年人口数有关。在该人口阻滞增长模型中,我们记人口增长率为 。0()1)mpk另一方面,人口增长率与时间也有关系。记 ,则单位时()()pttkA间的增长率变为: 。()(*pttA从资源角度而言(在此,我们不妨记人均资源量为 ) ,则人均资源量越少,Kp人口增长率 k(p) 越小,其中人口增长率函数为: ()()ka令 满足微分方
19、程:0,()tktA() 0dpkKptt再由 a 和 K 的常数性质,我们可以发现模型就成为时间的一次线性模型。下面我们利用数据拟合的方法,估计出 (程序见附录二)0.9837,12.45a8图四:一次拟合函数指和实际值比较图下面我们结合国家人口调查局的人口预测状况,对高峰期问题作进一步的优化。这个问题我们主要采用了二次多项式拟合的方法。 (程序见附录三) 。图五:二次拟合函数和实际值比较图从该图中,人口总数的增长呈下降趋势,我们不难想象人口会出现负增长率的情形,由此出发,我们对模型进行了进一步的完善。模型优化在前面基本假设不变的情况下,增加新假设设人类可以承受的最小人均资源量为 ,其中 是
20、在最小承受资源量下的最大人口数。/mKp记单位时间内人口数量的增长量与当时人口数量 p 的比记为 ,()kpss0,其中 r 相当于 p=0 的增长率称为固有增长率。若将 r 表示为 p 的函数 k(p),则它应是减函数。设 t 时刻的人口数量为 p(t),则单位时间内 p(t)的增量等于 r 乘以 p(t)。考虑到 t 到 t+ 时间内人口增量,显然有:t9()()(pttkpt令得 得到微分方程:0t(1)()dpkt又(2)()(,0)s当 时,人口不再增长,即 代入(2)式得 ,则mpmkpmksp(3)()1)mk由此可见,增长率 k(p)与人口尚未实现部分的比例 成正比,比例系()
21、/mp数为 k,将(3)代入(1)得(4)(1)mdkt我们知道方程(4)右端的因子 kp 体现了人口自身的增长趋势,而因子体现了资源和环境对人口增长的阻滞作用。那么,显然 p 越大前一个(1/)mp因子越大,后一个因子越小,但是方程(4)得左端因子变化情况不确定。为此,下面我们对方程(4)用分离变量法求解,得: 0()1()mrtppte由此,我们可总结的如下结论:(i)当 t 时, ,人口总数最终将趋向于极限值 ,且与初值的()mpt mp选取无关.(ii)当 时,0m即 P(t)是时间 t 的单调递增函数。又 22()(mmdprpdpttxt则:(1)0t10当 时, 时,人口总数达到
22、其极限值一半以前的人口增长率曾2mp20dt上升状态;当 时, 时,人口进入减速增长的时期.mp2dt从数据模拟的角度,我们可以发现人口发展是呈 S 形的。(具体绘图程序见附录四),并可求得Pm= 14.5605 r=0.0532图六:人口 S 型曲线图七:人口百年预测由此,我们可以得到该问题的模型为:,0()1()mrtPtex据此,我们分析了 1994 年到 2005 年的人口数估计量(如下表) 。11年代 实际值 模拟值 年代 实际值 模拟值1994 11.9850 12.0857 2000 12.6743 12.67431995 12.1121 12.1930 2001 12.7627
23、 12.75991996 12.2389 12.2966 2002 12.8453 12.84221997 12.3626 12.3965 2003 12.9227 12.92121998 12.4761 12.4926 2004 12.9988 12.99701999 12.5786 12.5852 2005 13.0756 13.0697表三:实际值与模拟值的比较 对此模型我们还从误差平方和的角度,对该模拟结果作了一个评价。由 matlab 计算可得其平方差为 0.0215(程序见附录五),我们知道这个值实比较小的,也就是说其准确度是我们比较满意的。从上面的分析数据表格和检测结果,我们可以
24、发现模型三是前两个模型的发展和深化。 而且它在长期预测上避免了前两个模型的一致上升趋势,体现了人口增长率逐渐缓和,慢慢转变进入负增长的一种趋势。至此我们将利用这个模型来对全国人口变化作中长期的预测。下图是我们利用模型得出的人口预测情况(程序见附录六)图八:人口实际值与logistic模型模拟值比较从图形我们不难发现,此模型在初期与真实值差距相对大些,但在中期吻合性还是比较好。这个模型向我们展示的人口峰值为 =14.5605(亿) ,这与我国Pm实际统计数据“大约13亿”差距并不大。据此,我们判断它的增长符合与实际状况时比较接近的,是可以用来预测未来人口的。在此理论基础的支撑下,我们利用随机模拟
25、的方法给出了人口中长期的预测。 (程序见附录七) 。综合分析模型三的建模理念,我们可以发现,他并没有具体地将抚养比、老龄化比重等定量地放入模型中。所以我们考虑问题三,着重分析这几个因素对12人口增长的影响。问题三问题分析在吕永霞等人中国人口系统结构的灰色关联分析一文中,他们指出了影响人口增长的 17 个因素,文章着重从总量指标、结构指标、分析指标三个方面对各影响因素的主次地位作了分析,由此得出了影响人口增中最为重要的三个因素:15 到 49 岁的育龄妇女、农村人口和人口自然增长率。本文受此启发,首先分别从数量、素质、结构、分布这几个方面,对 2001 到 2005 年的数据作了一个细微的分析。
26、结果如下:第一,人口数量。年代 实际人口总数 增加值 出生率 死亡率 自然增长率2001 年 127627 884 0.0113289 0.0059340 0.00539492002 年 128453 826 0.0112922 0.0060785 0.00521372003 年 129227 774 0.0011010 0.0062970 -0.0051962004 年 129988 761 0.0108833 0.0063890 0.00449432005 年 130756 768 0.0093671 0.0061843 0.0031828表四:实际值及出生死亡率的比较第二,人口结构。年份
27、 抽样总人数0-14岁人口数15-64岁人口数65岁及以上人口数65岁以上人口比重(%)2001 1220559 276590 852257 91978 7.542002 1258951 270215 889453 99420 7.902003 1260498 260140 896287 104002 8.252004 1253065 241830 903563 107404 8.572005 16985767 3320633 12120390 1536551 9.05表五:人口结构表从以上表格,我们可以看出我国人口结构以下两个特征。第一,当前中国人口社会抚养系数比较低的,劳动年龄人口比重大,
28、劳动力资源丰富。具体的讲,中国城镇每年新增劳动力近千万,农村剩余劳动力2亿多,这为经济快速发展提供了强大的动力;第二,2001年我国65 岁以上老年人口达7以上,根据国际标准,中国已进入老龄社会。一方面,我们依据“抚养系数 p=(少年人口老年人口)/劳动适龄人口”的算法,给出了我国 2001 年到 2005 年的抚养系数。年份 2001 2002 2003 2004 2005抚养系数 43.25% 42.56% 40.63% 38.65% 40.07%表六:2001年到2005年的抚养系数比较另一方面,我们通过1975年到2005年间几年的老年比重统计数据,利用拟合的方法的除了,我国老龄化的趋
29、势,进而预测出2020年我国的老龄人口总数,证明了“我国老龄化呈现速度快、规模大、未富先老等特点的说法” 。13年份 1975 1978 1982 1987 1992 1996 2000比重(%)4.8 4.8 4.91 5.48 6.09 6.94 7.11表七:2001 年到 2005 年的抚养系数比较图九:老年化比重-时间图(绘图程序见附录八 )通过模拟图像不难看出,到2020年老年人口占总人口比重会达到b=13.9454;再利用模型三的预测,到2020 年,人口将达13.8493亿,而65 岁老年人口将达1.93亿。第三,性别结构。从 2001 年到 2005 年的统计表,我们不难发现
30、全国男性的比例均比女性要大,这对生育率有直接的影响,间接的也就影响了我国的人口增长情况。(表中女性对应的值是 100)年份 城男女比 镇男女比 乡男女比2001 109.28 116 117.592002 111.37 123.1 122.112003 112.06 111 120.92004 114.44 126.9 122.212005 113.92 117.2 121.21表八: 城镇乡男女比例表第四,人口分布。 (下图是有抽样调查得到的)年份 城镇人口 比例值 乡村人口 比例值2001 453627 37.17% 766932 62.83%2002 487336 38.71% 7716
31、15 61.29%2003 519772 41.24% 740726 58.76%2004 515999 41.18% 737066 58.82%2005 7616883 44.84 9368884 55.16%表九: 城镇乡人口分布表 从上表抽样调查得到的数据,我们可以看出可知城镇人口比例在增加,而乡村人14口比例就日渐减少。这说明我国人口总体从农村转向城镇,但是国际间的移民问题对我人口影响不大,所以我们可以认为中国人口是一个封闭的系统,这在我们下一个模型终将得到体现。首先结合中国实际人口变化,分别将符合条件的城镇和相同的年龄区间一年划分为九十一组,分别写出城市和乡村人口矩阵 (0)1.()
32、.(90)TtttttttttAAiaat则在第 t 年时 i 岁的人在 t+1 年成活的人数为:1()()*(i=0,1289)t ttAiDiAada, , ,第 t+1 年城镇新生婴儿数目为:9110()()t ttiQiB第 t+1 年乡村新生婴儿数目为:910()*()t ttiaqaib因此,可以得出第 t 年的 A(t)与 a(t)*(0)().().11.0.().0.()t ttt tQBQBiDAt Di *()(1).*.100()1()tt tttqbqbidat di (其中 A(t),a(t)均为 91 行,91 列的方阵)定义 A(t),a(t)为增长矩阵,则对农
33、村人口向城镇转移问题的分析,可得:第 t+1 年城镇各年龄人口数: X(t+1)=At*()etX()+xt第 t+1 年乡村各年龄人口数: xa-对此,我们利用 Excel 进行数据处理,得到第 t 年、年龄为 的城镇与乡村i人的死亡率(见下表) ,明显可见 2003 年数据异常,这是因 03 年遭遇非典儿引起的,属于特殊情况,在此不纳入考虑范围。即此时 t 分别表示 01,02,04,05年,记为 1,2,3,4。 15时间 出生率 死亡率 自然增长率 人口总数 城镇人口 /总人口 城镇实际人口 自然增长人口 迁移率2001 年 0.0113289 0.0059340 0.0053949
34、1.0000000 0.3717 0.3717 2002 年 0.0112922 0.0060785 0.0052137 1.0053949 0.3993 0.4014 0.3737 0.0278 2003 年 0.0011010 0.0062970 (-0.0051960) 1.0106367 0.4258 0.4304 0.4035 0.0267 2004 年 0.0108833 0.0063890 0.0044943 1.0053855 0.4228 0.4250 0.4281 (0.0031)2005 年 0.0093671 0.0061843 0.0031829 1.0099040
35、0.4484 0.4529 0.4269 0.0258 表九: 2001年到 2005年数据分析表( 注:记2001年人口总数为基数 1。 )结合已知数据,我们利用自然增长率求得全国总人口数,利用抽样数据求得实际人口数 ,在此基础上利用公式迁移率=迁移人口/该年总人口,求得三年的迁移率。再根据这三个真实数据,利用cftool进行指数拟合,所得函数如下:(程序见附录九) -0.3741te(t)0.28e图十:迁移率的指数拟合图像)利用该模型,下面我们对老龄化、人口数和抚养比做了拟合,画出了其预测函数图像。(1)、老龄化预测未来我国人口老龄化预测(65岁及以上人口比例)16图十一:未来我国人口老
36、龄化预测(程序见附录十一)国家人口发展战略研究报告中的人口老龄化预测图 通过全国人口老龄化预测图像与国家人口发展战略研究报告中人口老龄化的预测比较,可以发现在预测问题上,两者的结论比较吻合。 (2)、人口数预测图十二(figure 1):城镇村人口数与年份的关系图17(figure 2):全国人口数与年份的关系图(绘图程序见附录十二)从图十一的 figure1 可以看出,到 2008 年左右我国城乡人口总数将持平。之后城乡比将逐渐增大,这有利于我国的城乡一体化,且城镇人口比重增大有利我国国民整体素质的提高从figure2趋势可以看出,近十五年来我国人口总数将持续增长,在2020年左右达到顶峰,
37、之后人口总数急剧下降。这是因为在1960年左右,我国曾经出现出生人口高峰,在2020年之后就会有死亡高峰出现。这时,我国应调整总合生育率,以确保人口总数维持在13亿左右。(3)、扶养比预测图十三:国家与城镇乡的扶养比(程序见附录十三)18国家人口发展战略研究报告中人口抚养比预测图 从上两图可以看出:我国人口抚养预测比与国家人口发展战略研究报告中人口抚养比的预测基本吻合,且在2010年左右将达到极小值,此时将有利于国民生产。在相当长的时间内,中国不会缺少劳动力,但在2025年左右,农村抚养比降急剧减少,将导致农村劳动人口急剧增多,将会出现劳动剩余,国家应出台相应政策进行及时调整。模型评价总体而言
38、,一方面,本文具体分析了抽样的到的各组数据,并将该数据的分析结果注入了模型的分析当中;另一方面,文章本着从实际出发的原则,抱着突破、创新的态度利用一切有关全国人口的资源,对建模数据做了很多的补充。具体地讲,本文,首先争对抽样调查数据给出了人口增长的一个指数模型,该模型在短期人口预测问题上得出的数据与真实数据吻合性比较合理,但是在10年以后与实际差距明显拉大。这与样本调查数据较少有很大的关联,所以做为对模型作了优化,我们利用1978年到2005的全国人口总数的部分数据,拟和人口自然增长率与时间的函数关系,进而通过两年间的迭代关系,得出第二个全国人口增长模型。从模型分析的图像和数据表格我们可以发现
39、,模型二对全国人口数的预测能力较之于模型一有了很大的提高。但是这两个模型都在中长期预测上,与真实分析结果全国人口增长在达到顶峰后会进入下降状态,有不小的差异。对此,我们从阻滞人口增长的角度出发,借鉴Logistic模型的办法,对上述模型进行了优化,利用matlable拟合的办法,给出了全国总人口数的中长期预测模型模型三,并对该模型结合已有数据进行了优化。但是,这三个模型在因素处理上都是笼统地考虑阻滞和刺激作用,并没有具体将各因素加入到模型结构中,所以,在问题三中,我们分析了影响全国人口增长的部分重要因素人口结构、老龄化、抚养率等,我们有理由相信,在抽样调查中注入这些因素的具体分析,还有增加调查
40、年限,有助于我们的到更为完善的人口增长模型,对预测我国人口总量,制定国家计划有积极的引导作用。介于建模有限,我们将在以后的研究中,进一步完善这个全国人口预测模型 19参考文献1 傅鹂,何中士等, 科学出版社 。2 姜启源等, 数学模型 (第三版) ,高等教育出版社。3 郭志刚, 关于生育政策调整的人口模拟方法讨论 ,中国科学,第二期。4 宋健、于景元、李广元, 人口发展过程的预测 ,中国科学,第九期。5 中国人口信息网, 人口数及构成 ,http:/ 。附录一:年底人口数 按 性 别 分 按 城 乡 分年 份 单位:万人 男 女 城 镇 乡 村人口数 比重 (%) 人口数 比重 (%) 人口数
41、 比重 (%) 人口数 比重 (%)1978 96259 49567 51.49 46692 48.51 17245 17.92 79014 82.081980 98705 50785 51.45 47920 48.55 19140 19.39 79565 80.611985 105851 54725 51.7 51126 48.3 25094 23.71 80757 76.291989 112704 58099 51.55 54605 48.45 29540 26.21 83164 73.791990 114333 58904 51.52 55429 48.48 30195 26.41 84
42、138 73.591991 115823 59466 51.34 56357 48.66 31203 26.94 84620 73.061992 117171 59811 51.05 57360 48.95 32175 27.46 84996 72.541993 118517 60472 51.02 58045 48.98 33173 27.99 85344 72.011994 119850 61246 51.1 58604 48.9 34169 28.51 85681 71.491995 121121 61808 51.03 59313 48.97 35174 29.04 85947 70.
43、961996 122389 62200 50.82 60189 49.18 37304 30.48 85085 69.521997 123626 63131 51.07 60495 48.93 39449 31.91 84177 68.091998 124761 63940 51.25 60821 48.75 41608 33.35 83153 66.651999 125786 64692 51.43 61094 48.57 43748 34.78 82038 65.222000 126743 65437 51.63 61306 48.37 45906 36.22 80837 63.78202
44、001 127627 65672 51.4562 61955 48.5438 48064 37.66 79563 62.342002 128453 66115 51.47019 62338 48.52981 50212 39.08978 78241 60.910222003 129227 66556 51.50317 62671 48.49683 52376 40.53023 76851 59.469772004 129988 66976 51.52476 63012 48.47524 54283 41.76001 75705 58.239992005 130756 67375 51.5272
45、7 63381 48.47273 56212 42.99 74544 57.01注:1. 本表各年人口未包括香港、澳门特别行政区和台湾省的人口数据。2 . 1982 年以前数据为户籍统计数;19821989 年数据根据 1990 年人口普查数据有所调整;1990-2000 年数据根据 2000 年人口普查数据进行了调整 ;2001-2004年数据为人口变动情况抽样调查推算数;2005 年数据根据全国 1%人口抽样调查数据推算( 下表同 )。3. 年底人口数和按性别分人口中包括中国人民解放军现役军人,按城乡分人口中现役军人计入城镇人口。附录二:先建立函数文件(renkou1.m): %t,ti
46、表示时间,x 表示 1994 到 2005 年全国人口总数,p 表示拟合得的系数t=0:1:11;x= 11.9850 12.1121 12.2389 12.3626 12.4761 12.5786 12.6743 12.7627 12.8453 12.9227 12.9988 13.0756;p=polyfit(t,x,1)ti=0:1:11;xi=polyval(p,ti);ti=1994:1:2005;plot(ti,x,o,ti,xi)然后再命令窗口运行该文件 renkou1.m p =0.0984 12.0450附录三:先建立函数文件(renkou2.m)%t,ti 表示时间,x 表
47、示 1994 到 2005 年全国人口总数,p 表示拟合得的人口数t=0:1:11;x= 11.9850 12.1121 12.2389 12.3626 12.4761 12.5786 12.6743 12.7627 12.8453 12.9227 12.9988 13.0756;p=polyfit(t,x,2)ti=0:1:11;xi=p(1)*ti.2+p(2)*ti+p(3);21ti=1994:1:2005;plot(ti,x,o,ti,xi)然后再命令窗口运行该文件 renkou2.mp =-0.0033 0.1342 11.9853附录四:先建立 M-文件(curvefun.m):
48、function f=curvefun(p,t)f=p(1)+(1/12.6743)-p(1)*exp(-(p(2)*t);再建立函数文件(s-quanxian.m)t=0:5;x= 1/12.6743 1/12.7627 1/12.8453 1/12.9227 1/12.9988 1/13.0756;p=lsqcurvefit(curvefun,1/15 0.05,t,x);for t1=1900:2060y=p(1)+(1/12.6743-p(1)*exp(-(p(2).*(t1-2000);y=1/y;plot(t1,y)hold onendfigure(2)for t2=2000:1:2100y=p(1)+(1/12.6743-p(1)*exp(-(p(2).*(t2-2000);y=1/y;plot(t2,y)hold onendp(1)=1/p(1);p然后再命令窗口运行该文件s-quanxian.mp =14.5605 0.0532附录五:在Matlab命令窗口中输入Q=0;p=14.5605 0.0532x= 11.9850 12.1121 12.2389 1