1、数学建模论文题目:新止痛剂生效时间预测模型班级:计算机科学与技术 1401班学号:201409824 姓名:马元凯学号:201409822 姓名:李炳毅日期:2016 年 12月 15日目录摘要 1一、 问题描述 .1二、 问题分析 .2三、 模型假设 .3四、 模型建立 .3五、 模型求解 .6六、 模型分析 .6七、 模型改进 .9八、 模型评注与推广 11九、 参考文献 12十、 附录 12摘要某医药公司的新药研究部门为了掌握一种新止痛剂的疗效,进行了相应的研究,根据医药公司给出的相关实验数据,通过 MATLAB软件进行数据处理工作,根据拟合曲线和散点图建立基本模型(模型(1).用 MA
2、TLAB软件解出该基本模型,再利用残差图两次剔除数据并且回归,得到最佳模型(模型(2),该模型的拟合度为 85.14%.拟合度不是很高,针对不同的性别,引入独立变量的交互作用,对模型进行改进,得到两个拟合度较高的模型(4)和(5),针对男性建立的模型,拟合度为 90.87%,针对女性建立的模型,拟合度为 97.72%.本文给出的模型较为科学,若实验数据真实可信,则可以进行药物的推广.关键字:MATLAB 软件,残差图,拟合度,统计回归模型1、问题描述 一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物试验,给患有同种疾病的病人使用这种新止痛剂的以下 4个剂量中的某一个:2 g
3、,5 g,7 g 和 10 g,并记录每个病人病痛明显减轻的时间(以分钟计). 为了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按性别及血压的低、中、高三档平均分配来进行测试. 通过比较每个病人血压的历史数据,从低到高分成 3组,分别记作 0.25,0.50 和 0.75. 实验结束后,公司的记录结果见下表 1(性别以 0表示女,1 表示男).请你为该公司建立一个数学模型,根据病人用药的剂量、性别和血压组别,预测出服药后病痛明显减轻的时间.病人序号病痛减轻时间min用药剂量g 性别 血压组别1 35 2 0 0.252 43 2 0 0.503 55 2 0 0.754 4
4、7 2 1 0.255 43 2 1 0.506 57 2 1 0.757 26 5 0 0.258 27 5 0 0.509 28 5 0 0.7510 29 5 1 0.2511 22 5 1 0.5012 29 5 1 0.7513 19 7 0 0.2514 11 7 0 0.5015 14 7 0 0.7516 23 7 1 0.2517 20 7 1 0.5018 22 7 1 0.7519 13 10 0 0.2520 8 10 0 0.5021 3 10 0 0.7522 27 10 1 0.2523 26 10 1 0.5024 5 10 1 0.75表 12、问题分析 一般
5、来说,药物的疗效可以直观的用服药后病痛明显减轻的时间来衡量.在新药推广中,医药公司的新药研究部门设计了一种药物给患有同种疾病的病人使用后,根据病人的用药剂量、性别和血压组别,预测病痛减轻时间的多少来预测止痛药的疗效,这是一个统计回归问题,针对这个问题,我们需要给出合理的假设,尤其是变量的选取,进而预测出药物的疗效.先将因变量分别与变量进行单独分析,得出两者间的大致函数关系,进一步整合这些关系,得出一个因变量与各个变量间的关系函数模型并进行求解,得出最终结论。 3、模型假设1、假设病人只服用了新型止痛药,未服用其它药物.2、假设题中给出的实验数据真实可信,误差很小.3、假设 24名病人都是在服用
6、新型止痛药的人群中随机选取的.4、假设病人在实验阶段吃的食物对新型止痛药无影响.5、假设模型中出现的符号含义如下表 2所示.表 24、模型建立为了大致地分析 y与 , , 之间的关系,首先利用表 1-1的数据分别1x23作出 y对 , 和 的散点图(见图 4-1,图 4-2和图 4-3的圆点).1x23如图 1为 y对 的散点图,图 2为 y对 的散点图,图 3为 y对 的散点1 2x3x符号 含义 单位1x用药剂量 g2性别 女-0,男-13x血压组别 低-0.25,中-0.5,高-0.75y病痛减轻时间 minp 概率值随机误差ia回归系数置信水平图.2 3 4 5 6 7 8 9 100
7、102030405060图 10 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10102030405060图 20.25 0.3 0.35 0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.750102030405060图 3由上图可知:y 对 可用二次函数拟合,拟合后如图 4所示.1x2 3 4 5 6 7 8 9 100102030405060图 4根据对散点图图 1和图 4的分析可得出 y对 的二次函数模型 1x;根据图 2可得出 y对 的线型模型 ;根201yax201yax据图 3可得出 y对 的线型模型 013yax;结合上述的 3个模型
8、可建立3x如下(1)的多元线性回归模型: 2012341a(1)上式右端的 , , 称为回归变量(自变量),给定 , , 时,病x3 1x23痛减轻时间 y的平均值为 2012341yaxa;由表 1的数据估计,影响 y的其他因素作用都包含在随机误差 中,如果模型选的合适, 应大致服从均值为 0的正态分布.5、模型求解直接利用 MATLAB统计工具箱中的 regress求解,进一步求出回归系数估计值及其置信区间(置信水平 =0.05)、检验统计量 R2,F,p,s 2,详细数据见表 3所示.参数 参数估计值 置信区间0a63.1291 48.7173,77.54091-10.2706 -14.
9、9243,-5.616925.6667 -0.0213,11.35463a-1.5000 -15.4325,12.432540.5111 0.1319,0.8903R2=0.8275 F=22.7903 p=0.0000 s2=44.3109表 3由表 3 得出的模型为: 12346.1290.765.71.0.51yxx6、模型分析表 3显示,R 2=0.8275 指因变量 y(病痛减轻时间)的 82.75%可由模型确定,F 值远远超过 F检验的临界值,p 远小于 ,因而模型(1)从整体来看是可用的. 表 3的回归系数给出了模型(1)中参数的估计值, , 的置信2a3区间包含零点,因而对这两
10、个系数的解释是不可靠的,所以需要残差分析.首次回归所得残差图如下图 5所示,可以看出,第 3个和第 24个数据存在异常,剔除,进行第二次回归.5 10 15 20Case Number-20-15-10-505101520ResidualsResidual Case Order Plot图 5第二次回归所得残差图如下图 6所示,可以看出,第 5个数据存在异常,剔除,进行第三次回归.2 4 6 8 10 12 14 16 18 20 22Case Number-15-10-5051015ResidualsResidual Case Order Plot图 6第三次回归所得残差图如下图 7所示.2
11、 4 6 8 10 12 14 16 18 20Case Number-15-10-5051015ResidualsResidual Case Order Plot图 7第三次回归的结果如表 4所示.参数 参数估计值 参数置信区间0a55.8121 44.3918 67.23241-8.0962 -12.0605 -4.132027.1311 2.5539 11.70833a-6.3868 -18.5348 5.761240.4025 0.0869 0.7181R2= 0.8514 F= 22.9153 p= 0.0000 s2= 24.1056表 4由图 7可知数据没有异常项,因此模型基本可
12、用,此时得出的最佳模型应为: 212315.812.0967.36.80.45yxx (2)易知因变量 y(病痛减轻时间)的 85.14%可由模型确定.7、模型改进从以上的分析可以看出,模型的拟合度最大为 85.14%,拟合度不是很高,需要进行模型的改进;因为服药期间要考虑生理反应,而性别对生理反应有直观的影响,故改进的模型需要对男女分开进行讨论;模型(2)中回归变量 和1x对因变量 y的影响是相互独立的.根据直觉和经验可以猜想 和 之间的相3x 1x3互作用会对 y有影响,不妨简单地用 和 的乘积代表它们的交互作用,于是1x3在模型(1)中增加一项,得到(3)201231341axa1、针对
13、男性,利用表 1的数据估计模型(3)的系数,利用 MATLAB得到如下表 5的结果.参数 参数估计值 参数置信区间0a49.8088 24.4805 75.13721-7.8431 -14.4259 -1.2604239.0294 -1.0850 79.14383a-7.5882 -13.6016 -1.574840.6667 0.1895 1.1438R2= 0.9087 F= 17.4206 p= 0.0010 s2= 27.4856 表 5根据表 5,可得出此时的最佳模型为:(4)21313149.807.439.0247.820.67yxxxx对表 5的数据进行残差分析,得到如下图 8
14、的结果.2 4 6 8 10 12Case Number-15-10-5051015ResidualsResidual Case Order Plot图 8从图 8可以看出数据无异常项,则由此得出的模型(4)基本可信,病痛减轻时间的 90.87%可由模型确定.2、针对女性,利用表 1的数据估计模型(3)的系数,利用 MATLAB得到如下表 6的结果.参数 参数估计值 参数置信区间0a36.9395 22.9221,50.95701-5.1686 -8.8117,-1.5255248.3235 26.1230,70.52403a-7.4706 -10.7986,-4.142640.3556 0.
15、0915,0.6196R2=0.9772 F=74.8974 p=0.0000 s2= 8.4184 表 6对表 6的数据进行残差分析,得到如图 9所示的结果,2 4 6 8 10 12Case Number-10-8-6-4-202468ResidualsResidual Case Order Plot图 9从图 9可以看出,第 8项数据存在异常,但影响不大,所以不用剔除数据,模型基本可信.根据表 5得出此时的最佳模型为:(5)2131313664.27.406.5yxxx病痛减轻时间的 97.72%可由模型确定.通过以上分析可以确定,经过对模型的改进,针对不同的性别,得出的两种模型(4)和
16、(5)的拟合程度都达到了百分之九十以上,达到了模型改进的目的.8、模型评注与推广评注 从这个实例我们可以看出,建立回归模型要根据已知的数据,从常识和经验进行分析,辅以作图,决定最终的函数模型.用 MATLAB软件求解后,作统计分析 R2的值是对模型的直观评价,决定模型的拟合程度.本次建立的模型,优点在于,由简到繁,先单独考虑变量对结果的影响,再综合考虑,最后引入交互项对模型进行改进,为病痛减轻时间的预测提供了简洁方便的工具,用简单的形式表示出了事物之间复杂的关系;缺点在于,该模型不能实际的去观测数据,而是使用实验给出的数据,存在一定的误差,还有改进模型中针对不同性别得出的模型拟合程度差别较大,
17、不是很理想;其实在模型建立时,还可以引进其他的数据,如心率等因素,使模型更加真实可信.推广 我们建立的这个预测模型还可以用于软件开发人员的薪金预测或其它的薪资预测模型.9、参考文献1 姜启源, 谢金星, 叶俊. 数学模型.第 4版M. 高等教育出版社, 2011.2 宋来忠,王志明,数学建模与实验,北京:科学出版社,20053 姜启源 , 谢金星, 叶俊. 数学模型 (第四版) 习题参考解答M. 高等教育出版社, 2011.(第十章习题参考答案)10、附录1、图 1,图 2,图 3,图 4的 MATLAB程序:y对 的散点图x x1=2 2 2 2 2 2 5 5 5 5 5 5 7 7 7
18、7 7 7 10 10 10 10 10 10; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5; scatter(x1,y,r);y对 的散点图2x x2=0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5; scatter(x2,y,r);y对 的散点图3x x3=0.25 0.50 0.75 0.25 0.50
19、 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5; scatter(x3,y,r);y对 的拟合曲线1x x1=2 2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10 10; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14
20、 23 20 22 13 8 3 27 26 5; p=polyfit(x1,y,2); x1x1=linspace(min(x1),max(x1); yy=polyval(p,x1x1); plot(x1,y,o,x1x1,yy);2、表 3的 MATLAB程序: x1=2 2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10 10; x2=0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1; x3=0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.5
21、0 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5; x=ones(24,1),x1,x2,x3,(x1.2); b,bint,r,rint,stats=regress(y,x)3、图 5,图 6,图 7的 MATLAB程序:首次回归分析 x1=2 2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10 10; x2=0 0 0
22、1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1; x3=0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75; y=35 43 55 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26 5; x=ones(24,1),x1,x2,x3,(x1.2); b,bint,r,rint,stats=regress(y,x
23、,0.05) rcoplot(r,rint)第二次回归分析 x1=2 2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10; x2=0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1; x3=0.25 0.50 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50; y=35 43 47 43 57 26 27 28 29 22 29 19 11 14 23 20 22 13
24、 8 3 27 26; x=ones(22,1),x1,x2,x3,(x1.2); b,bint,r,rint,stats=regress(y,x,0.05) rcoplot(r,rint) 第三次回归 x1=2 2 2 2 5 5 5 5 5 5 7 7 7 7 7 7 10 10 10 10 10; x2=0 0 1 1 0 0 0 1 1 1 0 0 0 1 1 1 0 0 0 1 1; x3=0.25 0.50 0.25 0.50 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.2
25、5 0.50; y=35 43 47 43 26 27 28 29 22 29 19 11 14 23 20 22 13 8 3 27 26; x=ones(21,1),x1,x2,x3,(x1.2); b,bint,r,rint,stats=regress(y,x,0.05) rcoplot(r,rint) 4、模型改进后,相关的 MATLAB程序表 5,图 8的 MATLAB程序 x1=2 2 2 5 5 5 7 7 7 10 10 10 ; x3=0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75; y=47 43 57
26、 29 22 29 23 20 22 27 26 5; x=ones(12,1),x1,x3,(x1.*x3),(x1.2); b,bint,r,rint,stats=regress(y,x) rcoplot(r,rint)表 6,图 9的 MATLAB程序 x1=2 2 2 5 5 5 7 7 7 10 10 10; x3=0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 0.25 0.50 0.75 ; y=35 43 55 26 27 28 19 11 14 13 8 3; x=ones(12,1),x1,x3,(x1.*x3),(x1.2); b,bint,r,rint,stats=regress(y,x) rcoplot(r,rint)