1、12011 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): A 我们的参赛报名号为(如
2、果赛区设置报名号的话): 10338 所属学校(请填写完整的全名): 西安交通大学 参赛队员 (打印并签名) :1. 马博 2. 杨橹 3. 许婷 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 5 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):22011 高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):3深圳人口与医疗需求预测目 录1 摘要 .12 问题的重述 .22.1 背景 23
3、符号说明 .24 模型假设 .25 问题分析 .26 模型建立与分析 .4 6.1 预测未来 10 年深圳人口数量发展趋势 46.2 预测未来 10 年深圳户籍人口与非户籍人口的发展趋势 106.3 预测未来 10 年深圳床位需求量的发展趋势 116.4 预测几种疾病在不同类型的医疗机构就医的床位需求 137 模型评价 .168 参考文献 .179 附录 .1811 摘要深圳时我国发展最快的城市之一,现有人口结构中年轻人占绝对优势,总体发病较少,故虽然目前深圳人均医疗设施低于全国类似城市平均水平,但仍能满足现有人口的就医需求,但是随着时间政策的调整,深圳老年人口比例会逐渐增加,此外,产业结构的
4、变化也会影响外来务工人员的数量,这些都可能导致深圳市未来的医疗设施难以满足人口哦的就医需求,因此,本文就此问题产生讨论,分析和建立数学模型,利用数学知识联系实际问题,做出相应的解答。对于问题一:分析深圳近十年来常住人口,非常主人口变化特征,预测未来十年深圳市人口数量和结构的发展趋势,并以此为基础预测未来全市和各区医疗床位需求。我们采用线性回归模型、灰色系统GM (1,1)模型,logistic模型分别对深圳人口进行分析,然后将这三种模型的分析结果进行线性拟合,由多元线性回归模型得最优组合模型,利用此模型我们可以预测未来十年深圳市人口数量的变化。根据以往数据,我们可以对非户籍人口与户籍人口的比值
5、随时间的变化趋势进行直线拟合,从而可以预测到未来十年深圳市非户籍人口与户籍人口的比值的发展趋势。首先,我们对人口结构进行划分,求得不同人口结构的增长率、所占总人口的比例以及不同人口结构的患病率,然后根据上述所得深圳市未来人口的预测值,即可对深圳市未来的床位需求进行预测。对于问题二:根据深圳市人口的年龄结构和患病情况及所收集的数据,我们选择风分娩进行建模,预测分娩在不同类型的医疗机构就医的床位需求,分娩的过程即对应于新生儿的诞生,因此,在模型建立过程中,可用深圳每年的出生率来近似代替妇女分娩数量的增长率。有了分娩率之后,我们就可以根据女性人数对分娩人群数也即分娩所需床位进行预测。关键字:线性回归
6、模型,灰色系统 GM(1,1)模型, logistic 模型,直线拟合22 问题的重述2.1 背景深圳市自从改革开放之后,一直迅猛发展,成为我国经济发展最快的城市之一,随着经济和人口的增长,深圳市卫生医疗事业也在长足发展。随着时代的发展,人们生活水平不断提高,对健康的要求也随之提高,所以医疗水平也必须不断提高。如果能够对人口结构,变化趋势及常见疾病发病率有较准确的预测,将有利于制定更合理的人口计划,更合理的人口布局,同时对于制定更适当的医疗发展计划有着重大意义。3 符号说明具体见各预测方法。4 模型假设1.不考虑战争,瘟疫,大规模流行病对人口的影响。2.假设同一年龄段的人死亡率相同,同一年龄段
7、的育龄女性生育率相同。3.假设当地人们的生育观念不发生太大变化。4.假设各年龄段的育龄女性生育率成正态分布。5.假设本问题中采用的数据均真实有效。6.假设深圳市的产业结构不发生巨大变化。7.在短期内,人口的生育率、死亡率的总体水平不变。5 问题分析这是一个关于人口数量和结构以及医疗机构的医疗床位需求量的预测问题,本问题的研究和分析需要根据中国特殊的国情进行,通过对问题的分析并结合实际情况我们认为对人口数量和结构产生主要影响的因素有以下四个:生3育率、死亡率、年龄结构、男女比例。对医疗机构床位需求量产生影响的因素有:年龄结构,人口增长,生育率,男女比例,患病率。在这里需要说明的是对于人口或医疗机
8、构床位需求量产生影响的一些其它因素,如经济发展状况,生态环境情况、已婚夫妇对生育所持的态度、医疗技术的发展、当地的医疗保险制度等,我们认为它们是通过作用于以上指标而间接发挥作用的。而对于诸如战争爆发、疾病流行等突发因素,由于其不可预测性,我们不考虑。我们队以上要素做如下诠释:1生育率生育率代表育龄妇女生育人口的能力,从一定意义上讲生育率的高低控制着人口增长率高低,通常来说生育率越高人口增长率越高,所以说生育率是人口增长的源头。生育率的影响因素很多,首先是年龄因素,不同年龄段的育龄妇女的生育率不同,通常20岁至30岁的育龄妇女的生育率最强;此外是地域因素,受政策因素、观念认识、周边环境等影响乡村
9、育龄妇女的生育率高于城市育龄妇女的生育率;还有其它因素的影响,比如大规模疾病会降低育龄妇女的生育率。2死亡率死亡率表示一定时期内一个人口群体中死亡的人数占该人口群体的比值,和生育率一样死亡率的高低同样控制着人口增长率高低,如果说生育率是人口增长的源头,则死亡率是人口增长的汇点。同样影响死亡率的因素很多,首先不同年龄段的死亡率不同,通常老年人和刚出生的婴儿的死亡率较高;从长远来看,随着医疗水平的提高,整个人口群体的死亡率将会成下降趋势;此外一些突发事件,如战争、疾病等,将会使使那一段的人口死亡率大幅度提高。3年龄结构年龄结构反映了总体人口在各年龄段分布情况,年龄结构蕴涵的信息量很大,从其中我们可
10、以实现对很多问题的分析,比如从年龄结构我们可以分析出社会的老年化程度,此外从年龄结构我们可以判断出不同时间段人口出生的情况,比如年龄结构不仅反映了总体人口在各年龄段分布情况,而且考虑到不同年龄段人口生育率、死亡率不同等情况,我们可以在年龄结构中有效反映这些差异44男女比例男女比例反映了总体人口中男性与女性人数的比较关系,男女比例值能反映出体人口中男性与女性人数是否协调,男女比例主要受男女出生比和男女死亡率的影 响,男女出生比正常范围在103107,也就是说出生100个女儿的同时会有103 107个男儿出生,但是在现实社会中,女性死亡率低于男性,所以男性与女性人数大致相等,社会维持在一个稳定状态
11、。但目前我国男女出生比超过110,这不仅将导致男女比例失调,还会对人口的预测产生影响,所以在人口预测时必须将男女比例问题考虑进去。5人口增长人口增长的变化率叫做人口自然增长率,是指一定时间内人口出生率和死亡率相间的得数,结合我国实际情况而言,人口增长率受到社会经济、国家制度以及计划生育等因素的影响。我国现阶段处于人口增长的“低模式”阶段,即人口出生率开始明显下降,死亡率继续下降并达到低水平。考虑到人口预测分为中短期预测和长期预测,两类预测因为涉及的时间长短不同,所以考虑的因素不同,采用的方法不同。对于中短期预测,我们假设生育率、死亡率、年龄结构、男女比例均维持在同一稳定水平,这样我们采用方法有
12、很多,。 对于长期预测,我们需要考虑生育率、死亡率、年龄结构、男女比例等因素随时间变化,此外城乡人口迁移对城乡人口结构产生影响,尽管以上因素短期内积累效应较小,但在长期中必须考虑。6 模型建立与求解6.1 预测未来 10 年深圳市人口数量发展趋势人口预测是指以规划区域或单位人口现状为基础,并对未来人口的发展趋势提出合理的控制要求和假定条件即参数条件,来获得对未来人口数据预报的技术或方法。6.1.1 人口预测模型目前,人口预测模型有很多,主要有一般预测方法(如线性回归模型,指5数模型,自然回归模型),灰色系统GM(1,1)模型,logistic模型等,各个模型的特点以及适用范围如下:(1)一般预
13、测方法一般预测方法包括线性回归模型、指数模型和自然回归模型。线性回归模型是将各个时期的人口发展速度看成是不变的,即在人口发展过程曲线上每一点斜率基本是一个定量。如果人口数量在后期的变化受到前期人口数据的影响,且后期的人口数量与前期的人口数量呈一定的线性关系,可以用自然回归模型来预测后期的人口数量。如果人口数量的发展先是缓慢增长,随着时间的推移,增长的速度越来越快,在这种情况下,可以用指数模型来预测。有些人口发展曲线开始时斜率较大,后期增长比较缓慢,此时应该选择幂指数模型。当然,一般预测方法必须进行F检验。(2)灰色系统GM(1,1)模型在现实世界中,并不是所有的人口发展都是以简单的线性或非线性
14、曲线来显示,无规律可循或资料不是很全的情况下可以用灰色系统GM(1,1)模型来进行预测。灰色系统GM(1,1)模型克服了最小二乘法对资料的随机波动完全盲目的被动局势,对于预测对象不全和资料波动太大不平稳的人口发展趋势效果较好。但是灰色模型预测的几何曲线往往呈单调递增或递减趋势,对人口总量变化的随机波动则反映较弱。(3)logistic模型Logistic模型体现了自然生态的平衡,克服了用其他模型预测表现出来的人口无限增长趋势,其缺点在于短期内人口增长可能呈现上升趋势。6.1.2 最优组合模型(1)说明以上所述的各种单一模型都有其自身的优点和缺陷,现实世界受各种因素影响,人口发展过程也不是呈现单
15、一的变化,而呈现出一个复杂的过程,用单一的模型并不能完全反映这种变化,因此,为了避免单一模型预测所带来的局6限性,充分利用原始数据中的信息,提高模型的预测精度,减少预测误差,避免单一模型的局限性,可以对同一预测对象运用几种不同预测模型进行预测,然后将几种不同预测模型的结果进行一定的组合,形成最优组合模型,能够大幅度提高预测的精度,尽量避免误差,从而实现预测模型的优化。为此,本文在对现有模型分析的基础上,针对现有模型的不足,试图寻找预测人口的最佳模型组合,为深圳市总人口预测提供一种理想的人口预测模型。(2)最优组合模型的建立:设原始数据为 ,t=1,2,3,N, 为组合模型的预测值, 为组合模型
16、的预测误差。 为第 i种方法的预测值, 为第i种方法的预测误差, 表示第i 种预测方法的预测值 在组中模型中的权系数,并且有: ,式中,n为参加组合模型的个数。则预测组合模型为: 如果找到一组 ,使得组合模型的误差平 , , 方和最小,则称为最优组合模型。 误差平方和为: 显然,通过对单个模型的优化组合,最优组合模型能够克服单个模型预测的不足,能够反映出人口数量变化的复杂性,预测精度有大的提高。由于该模型对优化组合的系数有一定的限制,且没有常数项对模型进行修正,所以该模型不能实现真正意义上的优化。(3)最优组合模型的改进:由于最优组合模型存在一定局限性,故对最优组合模型进行改进,即将单个模型预
17、测的结果进行多元线性组合,以获得最优组合模型的改进模型。为此7利用多元线性回归中最小二乘法求得,得到如下的改进模型: 其中, 为组合模型的预测值, 为第i种方法的预测值, 表示第 i种预测方法的预测值在组中模型中的权系数, n为参加组合模型的个数。同理利用最小二乘法来求出其参数 , , (4)线性回归模型根据数据,首先建立线性回归模型,选择1996年2010年共15年的数据,用SPSS软件进行线性拟合:左图所示为残差直方图,残差分布大致均匀,右图为学生化残差散点图,由图各学生残差的绝对值都不大于2,未发现有极端值,符合线性回归的前提。模型相关系数R=0.994 ,决定系数统计意义。2=0.98
18、8, 检验 =0.000 x0=482.89,527.75,580.33,632.56,701.24,724.57,746.62,778.27,800.80,827.75,871.1,912.37,954.28,995.01,1037.2; s=0; for i=1:15s=s+x0(i);x1(i)=sendx1 =1.0e+004 *Columns 1 through 12 0.0483 0.1011 0.1591 0.2224 0.2925 0.3649 0.4396 0.5174 0.5975 0.6803 0.7674 0.8586Columns 13 through 15 0.95
19、41 1.0536 1.1573 for j=1:14G(j,1)=-(x1(j+1)+x1(j)/2G(j,2)=1endG =191.0e+004 *-0.0747 0.0001-0.1301 0.0001-0.1907 0.0001-0.2574 0.0001-0.3287 0.0001-0.4023 0.0001-0.4785 0.0001-0.5575 0.0001-0.6389 0.0001-0.7238 0.0001-0.8130 0.0001-0.9063 0.0001-1.0038 0.0001-1.1054 0.0001 for k=1:14Y(k,1)=x0(k+1)en
20、dY =1.0e+003 *0.52780.58030.63260.70120.72460.74660.77830.80080.82770.87110.91240.95430.99501.0372 a1=inv(G*G)*G*Ya1 =-0.0455544.7460 a=a1(1)a =-0.0455 u=a1(2)u =20544.7460 for k=1:14x2(k+1)=(x0(1)-u/a)*exp(-a*k)+u/aendx2 =1.0e+004 *Columns 1 through 12 0 0.1063 0.1670 0.2305 0.2969 0.3665 0.4393 0.
21、5155 0.5952 0.6786 0.7660 0.8573Columns 13 through 15 0.9530 1.0531 1.1579 x3(1)=x0(1)x3 =482.8900 for k=1:14x3(k+1)=(1-exp(a)*(x0(1)-u/a)*exp(-a*k)endx3 =1.0e+003 *Columns 1 through 12 0.4829 0.5798 0.6068 0.6351 0.6646 0.6956 0.7279 0.7618 0.7973 0.8344 0.8733 0.9139Columns 13 through 15 0.9565 1.
22、0010 1.0476程序 2: x=1:15;y= 482.89 527.75 580.33 632.56 701.24 724.57 746.62 778.27 800.8 827.75 871.1 912.37 954.28 995.01 1037.2;x=x;y=y;st_ = 500 20 0.2;ft_ = fittype(a/(1+b*exp(-k*(x-1) ,.dependent,y,independent,x,.coefficients,a, b, k);cf_ = fit(x,y,ft_ ,Startpoint,st_)cf_ =General model:cf_(x) = a/(1+b*exp(-k*(x-1)Coefficients (with 95% confidence bounds):a = 1333 (1029, 1637)b = 1.638 (1.118, 2.158)k = 0.1187 (0.07814, 0.1593)