1、2014 高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了全国大学生数学建模竞赛章程和全国大学生数学建模竞赛参赛规则(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参
2、赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): B 题 我们的参赛报名号为(如果赛区设置报名号的话): 79 所属学校(请填写完整的全名): 河南理工大学 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。)日期: 20
3、14 年 9 月 3 日赛区评阅编号(由赛区组委会评阅前进行编号):2014 高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):0摘要本文针对戒烟和各种相关因素关系,解决影响戒烟成功的因素有哪些的问题,我们利用 Excel,spss,Matlab 软件对相关数据进行分析,利用主成分分析法、层次分析法建立模型,并进行可靠性检验,得到影响戒烟成功的重要因素,对有志于戒烟的人士提供戒烟对策和建议。针对问题一,首先观察数据发
4、现数据残缺,运用 spss 中缺失值替换的线性插值法将缺失数据补充完整。然后求出在不同年龄段、不同性别、不同调整 CO 浓度下、不同每日抽烟数的条件下的发病累加率,并运用 Excel,Matlab,Spss 的等软件做出图像,结合图像对发病累加率的分布进行分析,得到累加发病率的基本趋势为随着每日抽烟数和调整 CO 浓度的增加而提高,男性比女性的累加发病率略低。针对问题二,首先用spss做其它各变量与戒烟天数的相关性分析,得到显著性(双侧)值,CO浓度和戒烟天数0.01水平显著相关,距离最后一支烟的分钟数和调整的CO浓度与戒烟天数0.05水平显著相关;然后,根据题意,CO浓度和距离最后一支烟的分
5、钟数共同影响调整的CO浓度;可以得到每日抽烟数和调整的CO浓度会影响戒烟时间(天数)长短。最后,对相关变量的数据进行分组,在不同区间对戒烟天数求平均值,然后用spss回归分析中曲线估计对数据进行拟合,再用MATLAB拟合求回归方程中系数的置信区间来分析拟合效果。得到每日抽烟和戒烟天数的回归方程为, =0.948,F=12.038,Sig=0.078,可得332308.76.1.26.78xxy 2R拟合效果较好;调整的CO浓度和戒烟天数的回归方程为, =0.785,F=12.799,Sig=0.005,拟合441.0.30.1的较好。针对问题三,我们认为 CO 浓度和距抽最后一支烟的分钟数是来
6、控制调整 CO 浓度的,这两个因素可以用调整 CO 浓度说明,因此在考虑戒烟成功主要因素时没有针对这两个因素讨论,那么可以假定戒烟成功受年龄,性别,每日抽烟数以及调整 CO 浓度影响。就这四个因素建立层次分析,探究每个因素对戒烟成功的影响。先用主成分分析法对影响因素探究,再运用层次分析法,根据主成分分析得到的累计贡献率来建立判断矩阵,并算出各成分的权向量。结果显示影响戒烟成功的因素主要为每天抽烟数,调整 CO 浓度和年龄。其比重分别为 37.15%,25.00%,23.22%。通过一致性检验,判断矩阵具有满意一致性,可以为模型提供可靠分析。针对问题四,我们根据前三问所得结果向有志于戒烟的人士提
7、供相应的戒烟对策及建议,撰写的报告具体见 5.4 问题四的求解。关键字:线性插值法 相关性分析 回归分析 主成分分析 层次分析法 1一、问题的重述众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因。为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。本文研究数据涉及 234人,他们都自愿表示戒烟但还未戒烟。在他们戒烟的这一天,测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO测定时间.。 CO的水平提供了一个他们先前抽烟数量的客观指标,但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO的水平。记录下研究对象的
8、性别、年龄及自述每日抽烟支数。这个调查跟踪1年, 考察他们一直保持戒烟的天数, 由此估计这些人中再次吸烟的累加发病率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例. 其中假设原烟民戒烟的可信度是很低的(更恰当地说多数是再犯者)戒烟天数是从0到他(她)退出戒烟或研究截止时间(1年)的天数。假定他们全部没有人中途退出研究。请回答下列问题:1)试分析上述234人中再次吸烟的累加发病率分布情况(如不同年龄段、不同性别等因素下的累加发病率分布情况)。2)你认为年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间(天数)长短吗?如果影响请利用附录中的数据,分别给出戒烟时间与上述你认为有影响的因素之
9、间的定量分析结果。3)请利用附录中的数据建立适当的数学模型,讨论影响戒烟成功的主要因素有哪些,并对你的模型进行可靠性分析。4)请根据你的模型,撰写一篇 500 字左右的短文,向有志于戒烟的人士提供戒烟对策和建议。二、模型的假设1、原烟民戒烟天数不足 365 天的数据都是可靠的;2、原烟民戒烟的可信度很低,可以说他们多数是再犯者;3、自愿者中全部没有人中途退出研究。三、符号说明符号 符号说明1x年龄2性别3每日抽烟数4调整的 CO 浓度y戒烟天数w权向量CI一致性指标R随机一致性指标一致性比率max最大特征根四、问题的分析4.1问题一的分析针对问题一,首先对缺失数据进行补充,然后求出在不同因素下
10、,不同年龄段、2不同性别、不同每日抽烟数、不同调整 CO 浓度条件下的累加发病率的分布情况,并作出图表,进行分析。4.2问题二的分析针对问题二,首先对其它各变量与戒烟天数的相关性分析,得到和戒烟天数相关的变量,然后根据题意,得到会对戒烟天数长短的变量。对相关变量的数据进行分组处理,求不同区间内戒烟天数的平均值,把组距中间值作为那一组的数值,用 spss 和MATLAB 对数据进行处理得到相关变量和戒烟天数的定量分析结果。4.3问题三的分析我们认为 CO 浓度和距抽最后一支烟的分钟数是来控制调整 CO 浓度的,这两个因素可以用调整 CO 浓度说明,因此在考虑戒烟成功主要因素时没有针对这两个因素讨
11、论,那么可以假定戒烟成功受年龄,性别,每日抽烟数以及调整 CO 浓度影响。就这四个因素建立层次分析,探究每个因素对戒烟成功的影响。五、模型的建立与求解5.1问题一的求解5.1.1问题一模型的建立观察附录可以发现,附录中所给数据缺失,为了更加全面的进行分析,首先我们使用中缺失值分析命令对于数据进行分析,结果如下。表5.1.1列表均值案例数目 Min_last LogCOadj CO224 177.31 1397.48 257.37列表协方差Min_last LogCOadj COMin_last 91053.229LogCOadj -27.307 41300.914CO -20993.635 2
12、2198.708 18998.861回归均值 aMin_last LogCOadj CO179.58 1399.76 258.04a. 将随机选中的案例的残差添加到各个估计。列表相关性Min_last LogCOadj COMin_last 1LogCOadj .000 1CO -.505 .792 13所给数据缺失率为 0.0446,缺失率较小,可以利用 spss 进行补充,然后使用缺失值替换命令进行数据的补充,经过对已有数据的分析,决定使用线性差值法进行补充,补充后数据见附表。为了直观得了解所有 234 人的总体戒烟情况,作出如下散点图:图 5.1.1Day_abs050100150200
13、2503003504000 100 200 300 400IdDay_abs Day_abs由图 5.1.1 看出,被调查的 234 人中大多数经过很短时间后又再次抽烟,只有少数人戒烟天数达到 365 天,只占总人数的 14.10,本文假设在研究截止时间内没有再抽烟的烟民戒烟成功,所以累加发病率的具体定义为戒烟天数小于 365 的烟民数量占研究样本总人数的比例,本文据此对在不同性别、年龄、每日抽烟数、调整后 CO 浓度的情况下对累加发病率进行比较和分析。首先运用 spss 做出男性与女性吸烟者的戒烟天数频率分布图,并求出男性与女性的累加发病率,做出图像,图表如下。图 5.1.2回归协方差 aM
14、in_last LogCOadj COMin_last 94546.889LogCOadj -957.708 40165.315CO -20909.166 21649.540 18918.215a. 将随机选中的案例的残差添加到各个估计。回归相关性 aMin_last LogCOadj COMin_last 1LogCOadj -.016 1CO -.494 .785 1a. 将随机选中的案例的残差添加到各个估计。4表 5.1.2性别 成功戒烟人数 总人数 累加发病率男 17 110 0.845女 16 124 0.871图 5.1.30.8450.8710.8300.8350.8400.84
15、50.8500.8550.8600.8650.8700.875累加发病率系 列 1系 列 1 0.845 0.871 男 女由图 5.1.2 看出男性与女性再次吸烟的累加发病率分布情况相差不大,而由表 5.1.1 可以发现男性累加发病率为 0.845,略低于女性的 0.871。年龄:通过对所给数据进行分析可以得到参与研究人员的年龄跨度为 2272,所以本文将所有参与研究人员的年龄分为 6 段,分别为 2029、3039、4049、5059、6069、7079,经过统计可以得到不同年龄段的累加发病率的分布,如图所示。表 5.1.3年龄段 成功戒烟人数 总人数 累加发病率20-29 4 44 0.
16、91 30-39 11 64 0.83 40-49 8 57 0.86 50-59 7 47 0.85 60-69 1 17 0.94 70-79 1 5 0.80 图 5.1.45累 加 发 病 率0.910.830.860.850.940.800.700.750.800.850.900.951.0020-2930-3940-4950-5960-6970-79年 龄 段累加发病率累 加 发 病 率通过表 5.1.3 和图 5.1.1 可以看出 30-59 年龄段的累加发病率较低,70 岁以上的被研究者累加发病率最低,60-69 年龄段的被研究者的累加发病率最高。每日抽烟数:首先用 Matla
17、b 做出每日抽烟数跟戒烟天数的散点图图 5.1.5通过对数据的分析可发现每日抽烟数的跨度为 290,所以将每日抽烟数分为 7 个档次,分别为 110、1120、3140、4150、5160、60 以上,求出其累加发病率,并做成图表,如下。表 5.1.4每日抽烟数 戒烟人数 总人数 累加发病率110 4 17 0.7651120 10 81 0.8772130 12 72 0.8333140 4 37 0.8924150 1 8 0.8755160 0 7 1.00060 以上 2 2 0.000图 5.1.660.765 0.877 0.8330.892 0.875 1.0000.0000.0
18、000.2000.4000.6000.8001.0001.200110 1120213031404150516060以 上每 日 抽 烟 数 /根累加发病率系 列 1通过观察图表可得,每日抽烟数 60 以上的样本数过少具有偶然性,所以在分析时,可适当忽略,由图表可以看出,基本趋势为每日抽烟数越多则累加发病率越高。调整 CO 浓度:首先用 Excel 做出调整 CO 浓度跟戒烟天数的散点图,如下图。图 5.1.70501001502002503003504000 500 1000 1500 2000 2500调 整 后 的 CO浓 度戒烟天数系 列 1通过对数据的分析可以得到调整 CO 浓度的跨
19、度为 6821951,所以将调整 CO 浓度分为 7 个区段,分别为 600-799、800-999、1000-1199、1200-1399、1400-1599、1600-1799、1800-2000,求出其累加发病率,并做成统计图,图表如下。表 5.1.5调整的 CO 浓度 成功戒烟人数 总人数 累加发病率600-799 1 1 0.000 800-999 2 10 0.800 1000-1199 2 19 0.895 1200-1399 10 73 0.863 1400-1599 15 98 0.847 1600-1799 3 31 0.903 1800-2000 0 2 1.000 7图
20、 5.1.8通过图表可以发现累加发病率的趋势是随着调整后 CO 浓度的增加而提高。5.2问题二模型的建立与求解5.2.1问题二模型的建立由图 5.1.2 可以看出戒烟天数的长短与性别的关系不明显,由 spss 软件得到它们的相关系数为 0.006,所以可以认为戒烟天数和性别无关。由spss 中双变量相关系分析得到的每个变量之间的相关性数据(见附表),得到变量Age、Gender、Cig_Day 、CO 、Min_last、 LogCOadj和戒烟天数的显著性(双侧)值分别为0.458、0.925、0.686、0.002、0.019、0.037。表5.2.1相关变量与戒烟天数的相关性变量 显著性
21、(双侧)值 相关性Age 0.458 不相关Gender 0.925 不相关Cig_Day 0.686 不相关CO 0.002 0.01水平显著相关Min_last 0.019 0.05水平显著相关LogCOadj 0.037 0.05水平显著相关根据题意变量CO和Min_last可得到LogCOadj。LogCOadj水平提供了一个自愿者们先前抽烟数量的客观标准,在一定程度上,LogCOadj和Cig_Day有一定的关系。由此,我们可以主观的认为每日抽烟数和调整的CO浓度能影响戒烟时间的长短。戒烟天数为365的虽然不能确定其以后会抽烟,但是,他们已经坚持了365天,我们要研究影响因素与戒烟时
22、间的定量分析,就不能忽略365天的数据。我们分别对每日抽烟数和调整的CO浓度和戒烟天数的数据进行处理。由上表可得每日抽烟数的范围为2,90,我们对每日抽烟数以10为组距在1,90内分组,处理后的数据为表5.2.2每日戒烟数和戒烟天数统计表每日抽烟数 组距中间值 戒烟总 总人数 戒烟天8天数 数均值1-10 5.5 3043 17 179.011-20 15.5 5395 81 66.621-30 25.5 6004 72 83.431-40 35.5 2651 37 71.641-50 45.5 689 8 86.151-60 55.5 200 7 28.661-70 65.5 365 1 3
23、65.071-80 75.5 0 0 0.081-90 85.5 365 1 365.0用Excel可以得到下图图5.2.1每日抽烟数和戒烟天数折线图每 日 抽 烟 数 和 戒 烟 天 数0.050.0100.0150.0200.0250.0300.0350.0400.0110120213031404150516061-7071-8081-90每 日 抽 烟 数戒烟天数 戒 烟 天 数由图 5.2.1 可以看出61,90内的两个点均为戒烟天数为 365 天的,偏离了图形正常的趋势,这两个点只能说明个别情况,不能代表整体趋势,所以把这两个点删除后再处理数据。表 5.2.3 删除后每日戒烟数和戒烟
24、天统计表每日抽烟数 组距中间值 戒烟天数均值110 5.5 179.01120 15.5 66.62130 25.5 83.43140 35.5 71.64150 45.5 86.15160 55.5 28.6用 spss 中曲线估计进行拟合,分析后得到立方拟合效果最好。此时=0.948,F=12.038,Sig=0.078。2R用 spss 得到拟合的图形,如下:图 5.2.29表 5.2.4 每日抽烟数和戒烟天数相关分析表模型汇总和参数估计值因变量:戒烟天数模型汇总 参数估计值方程 R 方 F df1 df2 Sig. 常数 b1 b2 b3三次 .948 12.038 3 2 .078
25、278.633 -22.711 .760 -.008自变量为 每日抽烟数。由表5.2.4得到每日抽烟数和戒烟天数的回归分析方程式:(5-1)332308.76.1.26.78xxy用 Matlab 求出参数的置信区间表 5.2.5参数 参数估计值 参数置信区间常数 278.633 (115.2, 442.1) b1 -22.711 (-46.27, 0.8484) b2 0.760 (-0.1359, 1.656)b3 -0.008 (-0.01748,0.001903)R2=0.761314 F=25.9115 P=0.000653633可以看出每日抽烟数和戒烟天数在整体上呈负相关,调整的
26、CO 浓度与戒烟天数的定量分析图 5.2.3 调整的 CO 浓度值从小到大散点图调 整 的 CO浓 度050010001500200025000 50 100 150 200 250调 整 的 CO浓 度由上图和调整的 CO 浓度频率表可得其在682,1951内分布均匀。我们在600,1999内按组距为 200表 5.2.6调整的 CO 浓度 组距中间值 戒烟总天数 总人数 平均值10600-799 699.5 365 1 365.0 800-999 899.5 889 10 88.9 1000-1199 1099.5 1300 19 68.4 1200-1399 1299.5 6757 73
27、 92.6 1400-1599 1499.5 7815 98 79.7 1600-1799 1699.5 1575 31 50.8 1800-1999 1899.5 11 2 5.5 我们用spss曲线估计拟合得到二次的R方为0.771且为最大值。此时F值为5.044较小,Sig值为0.110较大,拟合的不好。模型汇总和参数估计值因变量:戒烟天数模型汇总 参数估计值方程 R 方 F df1 df2 Sig. 常数 b1 b2二次 .771 5.044 2 3 .110 1141.496 -1.581 .001自变量为 调整的CO浓度。图 5.2.4所以我们绝定取组距为 100,在681,198
28、0内分 13 组进行处理。表 5.2.7调整 CO 浓度 组距中间值 戒烟天数均值681780 730.5 365781880 830.5 124.67881980 930.5 33.259811080 1030.5 104.6310811180 1130.5 58.1811811280 1230.5 115.3412811380 1330.5 81.941113811480 1430.5 89.7414811580 1530.5 73.2815811680 1630.5 52.916811780 1730.5 2.1317811880 1830.5 3518811980 1930.5 7图
29、5.2.5此时 R 方为 0.530,F 值为 5.646,Sig 值为 0.023,R 方较小,我们考虑到可能是戒烟天数为 365 天数据的存在造成的影响比较大,因为题目中假设原烟民戒烟的可信度是很低的,在 234 个数据中戒烟天数为 365 天的数据为 33,其频率为 0.141,所以戒烟天数为 365 天的只是一少部分人,不能代表整体,我们将681,780区间内戒烟天数平均值为 365 的数据删除,再把偏离总趋势较大的点删除后进行处理。图 5.2.6此时用spss曲线估计拟合得到三次的R方为0.785且为最大值。此时F值为12.799,Sig值为0.005较大,拟合的较好。12由spss
30、得到的参数估计值,可以得到调整的CO浓度和戒烟天数的回归分析方程式:(5-2)348246107.103.06.17xxy 由 Matlab 得到参数的置信区间见下表:表 5.2.8参数 参数估计值 参数置信区间常数 117.306 (-504.3, 1693) b2 6.43610-6 (-0.001076, 0.002752)b3 -1.78410-8 (-6.782e-7, 2.446e-7)R2= 0.785 F=12.799 P=0.005可以看出调整的 CO 浓度和戒烟天数呈负相关。5.3问题三模型的建立与求解我们认为戒烟天数达到 365 天的为戒烟成功,抽取出所有戒烟达到 365
31、 天的数据,根据成功戒烟的数据分析影响因素。根据一、二问结论,我们假定戒烟成功受年龄,性别,每日抽烟数以及调整 CO 浓度影响为消除不同变量的量纲的影响,且不改变变量的相关系数,首先需要对变量进行标准化处理,标准化处理可通过 spss 实现。我们忽略其他因素对戒烟成功的影响,认为年龄,性别,每日抽烟数以及调整 CO浓度为影响戒烟成功的主成分,相应的主成分特征值和累计贡献利率如下表:表5.3.1解释的总方差初始特征值 提取平方和载入 旋转平方和载入成份 合计 方差的 % 累积 % 合计 方差的 % 累积 % 合计 方差的 % 累积 %1 1.486 37.155 37.155 1.486 37.
32、155 37.155 1.001 25.013 25.0132 1.000 25.002 62.156 1.000 25.002 62.156 1.000 25.010 50.0233 .929 23.221 85.377 .929 23.221 85.377 1.000 24.996 75.0194 .585 14.623 100.000 .585 14.623 100.000 .999 24.981 100.000提取方法:主成份分析。考虑到每一种成分对戒烟成功的影响不一样,为确定各指标对戒烟成功影响的权重,本文采用层次分析法进行影响程度评判。模型的层次结构如下:目标层 A 为“戒烟成功因
33、素分析”;准则层 B 包括年龄 x1、性别 x2、每天吸烟支数 x3 和调整的 CO 浓度 x4;方案层 C 为“戒烟成功”和“戒烟失败”。对于层次分析法中的判断矩阵,根据每个成分的累计贡献率来确定各个指标之间相对重要程度,判断矩阵表如下:表 5.3.2年龄 性别每日抽烟数调整 CO 浓度年龄 1.000 1.588 0.625 0.929性别 0.630 1.000 0.394 0.585每日抽烟 1.600 2.541 1.000 1.48613数调整 CO 浓度 1.076 1.709 0.673 1.000 得到判断矩阵后,求其最大特征向量,将该特征向量归一化处理后即可得到个影响成分的
34、权向量: 249.0,3715.,46.0,23.w为了能用成对比较阵的对应于特征根 的特征向量作为被比较因素的权向量,我们需要对成对比较阵进行一致性检验。检验过程中,我们需要借助 Satty 提出的一致性指标理论:1-nCI其中,CI=0 时,矩阵为一致阵;CI 越大,矩阵的不一致程度越严重。为了衡量一致性指标 CI 的标准,我们还需要引入随机一致性指标 RI,计算公式为:RI其中,RI 数值可以查表得知(见下表)。满足 CR 0.1 时就能通过一致性检验。查阅相关资料,查找随机一致性指标 RI 的数值如下:n 1 2 3 4 5 6 7 8 9 10 11RI 0 00.580.891.1
35、21.241.321.411.451.491.51接下来借助 Matlab 运算易得,03.4max,1-nCI代入 RI=0.89,得:。1.0.RICR0.1,表明成对比较阵的不一致程度在允许范围内,判断矩阵具有满意一致性,可以作为评判的权向量。根据各因素权重向量可知戒烟成功主要因素有每天抽烟数,调整 CO 浓度和年龄。其比重分别为 37.15%,25.00%,23.22%。5.4问题四的求解众所周知,抽烟可能诱发多种疾病,如尼古丁对心、脑血管的影响,还可致癌,对个体健康危害极大;同时被动吸烟者所吸入的有害物质浓度并不比吸烟者为低,受到的伤害甚至高于吸烟者,所以现如今戒烟未尝不是一个良好的
36、选择。结合上面所建模型对问题一到问题三的求解,我们可以为戒烟人士做出如下的建议与指导。14第 1、通过对问题一的探究发现,戒烟天数与性别显著性并不明显,所以对于戒烟人士来说性别并不是阻碍,无论男士或是女士只要心智坚定,是可以戒烟成功的。第 2、通过对年龄的分析得出,年龄越小者的累加发病率越高,且年龄对戒烟天数贡献的权重达到 0.2322,可能与年轻人自制力不强有关,对于年青的人士来说戒烟可能会更困难些,所以更应注重体育锻炼和户外运动,坚定信念、早日戒烟成功。第 3、通过对问题二和三的分析不难发现,每日抽烟数少、调整 CO 浓度低的被研究人员戒烟成功率较高,可能与烟草的成瘾性有关,而每日抽烟数和
37、调整的 CO 浓度对戒烟天数贡献的权重分别为 0.3715 和 0.2499,所以建议戒烟人士戒烟时采取逐步减量法,并换抽 CO 含量低的烟草。总体来说,戒烟不是一朝一夕的事情,在戒烟期间要加强体育锻炼,多进行户外运动、呼吸新鲜空气,同时可辅助药疗和针灸,以达到更好的效果。戒烟期间最重要的因素是戒烟者本人,只有本人坚定信念才能最终戒烟成功。六、模型的评价及改进模型优点:1、分区段对数据对相关性不是很明显的数据进行在不同区段内取平均值处理,可以是数据之间的关系更加清晰。2、运用层次分析法时建立的判断矩阵利用主成分分析中的贡献度来赋值,有效地避免了主观感受对两指标间影响程度进行赋值的人为因素。模型
38、缺点:1、只考虑了不同因素和戒烟天数的影响,忽略了各因素之间的数据在处理时都具有相关的影响。2、认为戒烟天数达到 365 天的为戒烟成功,只考虑了各因素对成功戒烟的影响。模型改进:1、在对不同因素的数据进行处理时,可以以戒烟天数为定值,对其它因素的值取平均值,建立不同因素之间和戒烟天数有联系的方程,对方程进行相关性检验。2、可以设置一个戒烟成功程度,分析各因素对戒烟程度的影响,使分析更全面科学。七、参考文献1姜启源,谢金星,叶俊,数学模型(第四版),北京,高等教育出版社,2011 年 2邓维斌,唐兴艳,胡大权,spss 统计分析教程,北京,电子工业出版社,2012 年3周品,赵新芬,MATLA
39、B 数学建模与仿真,北京,国防工业出版社,2011 年 15八、附录问题二(1)beta0=ones(4,1);beta,R,J=nlinfit(x,y,myfun1,beta0)myfun1function f=myfun1(beta0,x)x=5.5000 15.5000 25.5000 35.5000 45.5000 55.5000;x1=x;x2=x1.*x1;x3=x1.*x1.x1;a=beta0(1);b=beta0(2);c=beta0(3);d=beta0(4);f=a+b.*x1+c.*x2+d.*x3(2)beta0=ones(4,1);beta,R,J=nlinfit(
40、x,y,myfun1,beta0)myfun1function f=myfun1(beta0,x)x=1.0e+003 *0.8305 1.0305 1.1305 1.2305 1.3305 1.4305 1.5305 1.6305 1.8305 1.9305;16y=124.67 104.63 58.18 115.34 81.94 89.74 73.28 52.9 35 7;x1=x;x2=x1.*x1;x3=x1.*x1.x1;a=beta0(1);b=beta0(2);c=beta0(3);d=beta0(4);f=a+b.*x1+c.*x2+d.*x3问题三A = 1.0000 1.5
41、880 0.6250 0.92900.6300 1.0000 0.3940 0.58501.6000 2.5410 1.0000 1.48601.0760 1.7090 0.6730 1.0000x,y=eig(A)x =-0.4422 0.0824 - 0.4639i 0.0824 + 0.4639i 0.3616 -0.2785 -0.2746 + 0.1759i -0.2746 - 0.1759i -0.5297 -0.7074 -0.4012 + 0.2952i -0.4012 - 0.2952i 0.7673 -0.4759 0.6508 0.6508 -0.0001 y =4.00
42、03 0 0 0 0 0.0002 + 0.0002i 0 0 0 0 0.0002 - 0.0002i 0 0 0 0 -0.0006 得 x 为特征向量矩阵 y 为特征值矩阵 %找到 y 中对应最大的特征值所在列 m w=x(:,m)/sum(x(:,m) w 就是权重! w=x(:,1)/sum(x(:,1)处理过的数据Id 年龄 性别每日抽烟数 CO 浓度距离抽最后一支烟的分钟数调整的 CO浓度 戒烟天数118 22 1 14 140 60 1133 2285 23 1 40 240 10 1336 7141 24 1 20 270 60 1419 14168 24 1 14 260
43、70 1409 3322 26 1 20 175 32 1212 2539 27 1 20 310 489 1334 1233 27 1 29 80 945 1455 365277 27 1 8 180 90 1262 3305 27 1 20 140 105 1162 72132 28 1 15 390 65 1581 14166 28 1 20 345 65 1528 2117307 29 1 35 435 10 1594 4330 29 1 16 430 60 1621 15128 30 1 22 340 50 1512 16340 30 1 23 270 60 1419 13262 3
44、1 1 14 95 330 1137 3541 32 1 25 580 60 1751 184 32 1 18 195 90 1296 794 32 1 40 280 90 1454 45252 32 1 33 340 10 1487 3293 32 1 20 275 240 1541 20328 32 1 25 450 70 1647 2044 33 1 20 315 15 1457 3264 33 1 6 50 1440 1567 365238 33 1 28 480 55 1665 13344 33 1 10 190 110 1298 6134 34 1 13 250 157 1447
45、7151 35 1 20 270 62 1420 90253 35 1 20 200 60 1288 8266 35 1 60 350 1 1494 121207 36 1 13 250 33 1368 14229 36 1 40 500 10 1654 124273 36 1 34 390 75 1588 2276 36 1 30 410 60 1600 1445 37 1 40 540 180 1796 5146 37 1 30 450 5 1605 2185 37 1 25 355 5 1486 30313 37 1 20 260 5 1367 365321 37 1 23 85 144
46、0 1797 96334 37 1 20 400 45 1580 7345 37 1 20 85 700 1325 19659 39 1 35 420 90 1630 365160 39 1 3 40 205 682 365224 39 1 30 320 10 1460 3239 39 1 18 190 95 1288 2311 39 1 30 190 438 1507 45325 39 1 15 190 780 1725 2249 40 1 11 265 413 1583 21304 41 1 30 290 45 1440 365339 41 1 17 210 70 1316 11101 4
47、2 1 40 415 65 1608 2127 42 1 50 275 60 1427 718329 42 1 60 160 15 1163 253 43 1 60 450 28 1315 3149 43 1 25 310 40 1466 0170 43 1 20 240 55 1364 6136 44 1 34 330 45 1496 6274 44 1 10 85 240 1031 155 45 1 40 300 60 1464 365215 46 1 20 200 10 1256 365245 46 1 23 65 1020 1413 302247 46 1 23 255 120 143
48、2 11251 46 1 40 370 1 1518 13178 47 1 23 270 60 1419 583 48 1 50 415 45 1596 11295 48 1 40 210 40 1297 3300 48 1 23 260 90 1421 1308 48 1 20 100 70 994 1186 49 1 9 170 82 1232 60284 50 1 40 70 90 851 36517 51 1 20 520 120 1742 2177 51 1 28 500 70 1693 3291 51 1 30 170 45 1208 36514 52 1 20 160 105 1220 47121 52 1 40 260 99 1392 30222 52 1 25 360 92 1564 7214 53 1 2 45 980 1227 4225 53 1 90 190 5 1231 365264 53 1 60 240 210 1463 14267 53 1 20 435 95 1648 1