1、统计学实践作业参数估计练习题1. 某大学为了解学生每天上网的时间,在全校 7500 名学生中采取不重复抽样方法随机抽取 36 人,调查他们每天上网的时间(单位:小时), 得到的数据见 book3.1 表。求该校大学生平均上网时间的置信区间,置信水平分别为 90%、95%和 99%。平均 3.316666667标准误差 0.268224616中位数 3.25众数 5.4标准差 1.609347694方差 2.59峰度 -0.887704917偏度 0.211008874区域 5.9最小值 0.5最大值 6.4求和 119.4观测数 36最大(1) 6.4平均 3.316666667标准误差 0.
2、268224616中位数 3.25众数 5.4标准差 1.609347694方差 2.59峰度 -0.887704917偏度 0.211008874区域 5.9最小值 0.5最大值 6.4求和 119.4观测数 36最大(1) 6.4最小(1) 0.5置信度(90.0%) 0.453184918置信区间 2.8634817483.769851585最小(1) 0.5置信度(95.0%) 0.544524915置信区间 2.7721417513.861191582平均 3.316666667标准误差 0.268224616中位数 3.25众数 5.4标准差 1.609347694方差 2.59峰
3、度 -0.887704917偏度 0.211008874区域 5.9最小值 0.5最大值 6.4求和 119.4观测数 36最大(1) 6.4最小(1) 0.5置信度(99.0%) 0.730591706置信区间 2.586074964.0472583732. 某机器生产的袋茶重量(g)的数据见 book3.2。构造其平均重量的置信水平为 90%、95% 和 99%的置信区间。 平均 3.32952381标准误差 0.05272334中位数 3.25众数 3.2标准差 0.241608696方差 0.058374762峰度 0.413855703偏度 0.776971476区域 0.95最小值
4、 2.95最大值 3.9求和 69.92观测数 21最大(1) 3.9最小(1) 2.95置信度(90.0%) 0.090932905置信区间 3.2385909053.420456714平均 3.32952381标准误差 0.05272334中位数 3.25众数 3.2标准差 0.241608696方差 0.058374762峰度 0.413855703偏度 0.776971476区域 0.95最小值 2.95最大值 3.9求和 69.92观测数 21最大(1) 3.9最小(1) 2.95置信度(95.0%) 0.109978959置信区间 3.219544853.439502769平均 3
5、.32952381标准误差 0.05272334中位数 3.25众数 3.2标准差 0.241608696方差 0.058374762峰度 0.413855703偏度 0.776971476区域 0.95最小值 2.95最大值 3.9求和 69.92观测数 21最大(1) 3.9最小(1) 2.95置信度(99.0%) 0.150015812置信区间 3.1795079973.4795396223. 某机器生产的袋茶重量(g)的数据见 book3.3。构造其平均重量的置信水平为 90%、 95%和 99%的置信区间。 平均 3.29标准误差 0.014798365中位数 3.29众数 3.3标
6、准差 0.087548306方差 0.007664706峰度 1.781851265偏度 0.003904912区域 0.47最小值 3.05最大值 3.52求和 115.15观测数 35最大(1) 3.52最小(1) 3.05置信度(90.0%) 0.025022913置信区间 3.2649770873.315022913平均 3.29标准误差 0.014798365中位数 3.29众数 3.3标准差 0.087548306方差 0.007664706峰度 1.781851265偏度 0.003904912区域 0.47最小值 3.05最大值 3.52求和 115.15观测数 35最大(1)
7、 3.52最小(1) 3.05置信度(95.0%) 0.030073895置信区间 3.2599261053.320073895平均 3.29标准误差 0.014798365中位数 3.29众数 3.3标准差 0.087548306方差 0.007664706峰度 1.781851265偏度 0.003904912区域 0.47最小值 3.05最大值 3.52求和 115.15观测数 35最大(1) 3.52最小(1) 3.05置信度(99.0%) 0.040375775置信区间 3.2496242253.330375775资料整理练习题1. 为评价家电行业售后服务的质量,随机抽取了由 100
8、 家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果见表 book1.1。要求:(1)制作一张频数分布表;(2)绘制统计图,反映评价等级的分布。 计数项:xtxt 汇总A 14B 21C 32D 18E 15(空白)总计 1002. 某行业管理局所属 40 个企业 2002 年的产品销售收入数据(单位:万元)见 book1.2。要求:(1)根据销售收入在 125 万元以上为先进企业,115125 万元为良好企业,105115 万元为一般企业,105 万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算出累
9、积频数和累积频率;(2)绘制统计图,反映分布情况。累 计 频 数024681012落 后 一 般 良 好 先 进累 计 频 数3. 北方某城市 1 月2 月份各天气温的记录数据见 book1.3。(1)对上面的数据进行适当的分组。(2)绘制统计图,说明该城市气温分布的特点.接收 频率 累积 %-10 26 40.00%-5 15 63.08%0 15 86.15%5 5 93.85%10 4 100.00%其他 0 100.00%累计频数 累计频率-104 9 22.50%105-114 9 45.00%115-124 11 72.50%125+ 11 100.00%说明:该城市气温在逐步回暖
10、,整体偏冷。多变量资料整理练习题下面是有关“北京地区大学生掌上阅读状况调查”的部分题目,(1)性别:1 男 2 女(2)学级:1 大专 2 大一 3 大二 4 大三 5 大四 6 研一 7 研二 8 博士生(3)月生活费:1 600 元以下 2 6001000 元 3 10001500 元 4 15002000 元 5 2000 元以上(4)手机类型:1 低端机 2 中端机 3 高端机 4 智能机 5 其他(5)运营商:1 中国移动 2 中国联通 3 中国电信 4 中国网通被调查者对这 5 个题目的回答如数据表 book1.8。1.分析不同性别学生选择手机类型的情况,要求结合交叉分析表和相应统
11、计图进行分析。2.分析不同学级的学生选择手机类型的情况,要求结合交叉分析表和相应统计图进行分析。3. 分析不同性别学生选择运营商的情况,要求结合交叉分析表和相应统计图进行分析。4.分析不同学级的学生选择运营商的情况,要求结合交叉分析表和相应统计图进行分析。求和项:手机类型q4手机类型q4性别q1 1 2 3 4 5 总计1 22 66 156 240 10 4942 11 92 213 236 15 567总计 33 158 369 476 25 10611由题可知,男生选择智能机的比较多,而女生选择高端机的比较多。0501001502002503001 2 3 4 512求和项:手机类型q4
12、手机类型q4学级 1 2 3 4 5 总计1 3 10 3 44 5 652 3 16 54 80 1533 10 52 102 88 5 2574 6 40 63 88 5 2025 3 14 114 68 10 2096 6 18 21 60 1057 1 8 12 48 698 1 1总计 33 158 369 476 25 10612专的孩子偏爱智能机大一孩子偏爱智能机大二孩子偏爱高端机大三孩子偏爱智能机大四孩子偏爱高端机研一孩子偏爱智能机研二孩子偏爱智能机博士生只有一人使用低端机求和项:运营商q5运营商q5性别q1 1 2 3 4 总计1 135 66 4 2052 150 76 6
13、 232总计 285 142 6 4 4373男生偏爱中国移动女生偏爱中国移动0204060801001201401601 2 3 412020406080101201 2 3 4 5 6 7 812345求和项:运营商q5运营商q5学级 1 2 3 4 总计1 16 10 262 35 28 633 76 32 3 1114 54 32 865 48 34 3 4 896 35 4 397 20 2 228 1 1总计 285 142 6 4 4374专到博都是选择中国移动的人最多,其次是中国联通,选择电信和网通的用户较少010203040506070801 2 3 4 5 6 7 8123
14、4多元线性回归练习题1. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。近 8 个月的销售额与广告费用数据见book7.1 表。(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。检验回归方程的线性关系是否显著( =0.05);检验各回归系数是否显著( =0.05) 。SUMMARY OUTPUT回归统计Multiple R 0.958663444R Square 0.9190356Adjusted R Square 0.88664984标准误差
15、 0.642587303观测值 8方差分析df SS MS FSignificance F回归分析 2 23.4354077911.7177039 28.377768390.001865242残差 5 2.0645922080.412918442总计 7 25.5Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%Intercept 83.23009169 1.57386895252.882478944.57175E-0879.18433275 87.27585063电视广告费用 /万元 2.290183621 0.3040645567.53
16、18993130.0006532321.508560797 3.071806445报纸广告费用 /万元 1.300989098 0.3207015974.0566966620.0097607980.476599399 2.125378798SUMMARY OUTPUT回归统计Multiple R 0.807807408R Square 0.652552809Adjusted R Square 0.594644943标准误差 1.215175116观测值 8方差分析df SS MS FSignificance F回归分析 1 16.6400966216.6400966211.268811340.
17、015288079残差 6 8.8599033821.476650564总计 7 25.5Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%Intercept 88.63768116 1.58236713156.015876092.174E-09 84.76576828 92.50959404电视广告费用 /万元 1.603864734 0.47778079 3.3569050240.0152880790.434777259 2.7729522091回归方程为:y=1.60x+88.642回归方程:y=2.29x1+1.30x2+83.23
18、F 值0.001865小于0.05,回归方程的线性关系显著2. 一家房地产评估公司想对某城市的房地产销售价格 y1 与地产的评估价值 x1、房产的评估价值 x2 和使用面积 x3 建立一个模型,以便对销售价格作出合理预测。为此,收集了 20 栋住宅的房地产评估数据见 book7.2 表。(1)写出估计的多元回归方程。(2)检验回归方程的线性关系是否显著( =0.05)。(3)检验各回归系数是否显著( =0.05) 。SUMMARY OUTPUT回归统计Multiple R0.947362461R Square 0.897495632Adjusted R Square 0.878276063标准
19、误差 791.6823283观测值 20方差分析df SS MS FSignificance F回归分析 3 87803505.4629267835.1546.696969663.87913E-08残差 16 10028174.54626760.909总计 19 97831680Coefficients 标准误差 t Stat P-value Lower 95%Intercept 148.700454 574.421324 0.25887001 0.799036421-1069.0183470.814738183 0.5119885071.5913212360.13109905 -0.2706
20、289580.820979542 0.2111765023.8876462720.0013073610.3733053580.135041012 0.0658633122.0503222040.057088036-0.004582972回归方程:y=0.81x1+0.82x2+0.135x3+148.7对于回归方程:F 值远远小于0.05,所以回归方程式显著对于 x1:0.13大于0.05,不显著对于 x2:0.001小于0.05,显著对于 x3:0.057大于0.05,不显著所以回归方程为:y+=0.82x2+148.73. 某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据见对于 x
21、1的系数:p 值0.00065小于0.05,显著对于 x2的系数:p 值0.009761小于0.05,显著book7.3 表。(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。解释回归系数的实际意义。(2)检验回归方程的线性关系是否显著( =0.05)。(3)检验各回归系数是否显著( =0.05) 。方差分析练习题1.从 3 个总体中各抽取容量不同的样本数据,得到的数据见 book5.1 表。检验 3 个总体的均值之间是否有显著差异?( =0.01)方差分析:单因素方差分析SUMMARY OUTPUT回归统计Multiple R 0.995651103R Square 0.991
22、321119Adjusted R Square 0.986981679标准误差 261.4310342观测值 7方差分析df SS MS FSignificance F回归分析 2 31226615.2615613307.63228.44446237.5323E-05残差 4 273384.742568346.18563总计 6 31500000Coefficients 标准误差 t Stat P-value Lower 95% 上限 95.0%Intercept -0.590996232505.0042289-0.001170280.99912229 -1402.707516 1401.52
23、5523x1 22.38646129 9.6005435312.3317910310.080094808-4.268920799 49.04184339x2 327.6717128 98.797924623.31658498 0.02947241353.36469864 601.978727回归方程为:y=22.39x1+327.67x2-0.59对于回归方程:F 值远远小于0.05,所以回归方程显著对于回归系数 x1:0.08大于0.05,不显著对于回归系数 x2:0.029小于0.05,显著SUMMARY组 观测数 求和 平均 方差列 1 5 790 158 61.5列 2 4 600 1
24、5036.66666667列 3 3 507 169 121方差分析差异源 SS df MS F P-value F crit组间 618.9166667 2 309.45833334.6573996660.040877239 4.256494729组内 598 9 66.44444444总计 1216.916667 114.657399665551844.256494729142560.0408772387618210.01,不能拒绝原假设2. 某家电制造公司准备购进一批 5#电池,现有 A、B、C 三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取 5 只电池,经试验
25、得其寿命(小时)数据见 book5.2 表。试分析三个企业生产的电池的平均寿命之间有无显著差异? ( =0.05)方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差列 1 5 15 3 2.5列 2 5 222 44.4 28.3列 3 5 150 30 10列 4 5 213 42.6 15.8方差分析差异源 SS df MS F P-value F crit组间 5475.6 31825.2 128.9893993 2.02553E-11 3.238871522组内 226.4 16 14.15总计 5702 19128.9893992932863.238871522361
26、092.02552624576458E-113.466800111594280.0007973045991419313.238871522361090.001644272361008310.01不能拒绝原假设,没有足够证据证明验各地区平均每天交通事故的次数相等分布特征分析第一部分1. 某百货公司 6 月份各天的销售额数据(单位:万元) 见 book2.1。(1)计算该百货公司日销售额的均值、中位数、众数;(2)计算日销售额的标准差。 某百货公司平均 274.1标准误差 3.86595812中位数 272.5众数 #N/A标准差 21.17472469方差 448.3689655峰度 -0.21
27、1917734偏度 0.195086998区域 86最小值 236最大值 322求和 8223观测数 30最大(1) 322最小(1) 236置信度(95.0%)7.9067720222. 将某地区 120 家企业按利润额进行分组,结果如表 book2.2,计算 120 家企业利润额的均值、标准差和离散系数。平均 426.6666667标准误差 10.63352695中位数 450众数 450标准差 116.4844515方差 13568.62745峰度 -0.624699913偏度 0.208442033区域 400最小值 250最大值 650求和 51200观测数 120最大(1) 650
28、最小(1) 250置信度(95.0%)21.05544515离散系数 0.2730104333. 25 个网络用户的年龄(单位:周岁)数据如表 book2.3,计算网民年龄的众数、中位数、均值和标准差。平均 24标准误差 1.33041347中位数 23众数 19标准差 6.652067348方差 44.25峰度 0.772705131偏度 1.080110357区域 26最小值 15最大值 41求和 600观测数 25最大(1) 41最小(1) 15置信度(95.0%) 2.745838427第二部分1. 某地区粮食生产情况如表 book2.4 所示,计算该地区粮食平均亩产量、亩产量的标准差
29、。平均 286标准误差 8.027100562中位数 325众数 325标准差 80.27100562方差 6443.434343峰度 -0.393495826偏度 -0.128212443区域 300最小值 125最大值 425求和 28600观测数 100最大(1) 425最小(1) 125置信度(95.0%)15.92750862. 某公司下属的三个企业计划完成情况如表 book2.5,计算该公司的平均计划完成程度。实际产量/件 计划产值1.2 450 3751.05 315 3000.95 361 3801126 1055平均计划完成程度1.0672985783. 某工业企业某车间工人
30、加工零件情况如表 book2.6,要求确定该车间工人加工零件数的众数、中位数、均值和标准差。平均 44.3标准误差 1.208179196中位数 45众数 45标准差 12.08179196方差 145.969697峰度 1.049323481偏度 0.452252788区域 60最小值 15最大值 75求和 4430观测数 100最大(1) 75最小(1) 15置信度(95.0%)2.3972895794.两个生产车间工人按某产品日产量(件)分组资料如表 book2.7,分析两个车间日产量的平均水平,并说明其代表性的优劣。车间总产量 340 356车间日产量平均值 8.5 11.866666
31、67第二车间的产量平均值高,因此第二车间生产好于第一车间。假设检验练习题1.经验表明,一个矩形的宽与长之比等于 0.618 的时候会给人们比较良好的感觉。某工艺品工厂生产的矩形工艺品框架的宽与长要求也按这一比例设计,假定其总体服从正态分布,现随机抽取了 20 个框架测得比值数据见 book4.1 表。在显著性水平 =0.05 时能否认为该厂生产的工艺品框架宽与长的平均比例为 0.618? 列1平均 0.6583标准误差 0.020855783中位数 0.6215众数 0.606标准差 0.093269897方差 0.008699274峰度 3.362449574偏度 1.777452646区域
32、 0.38最小值 0.553最大值 0.933求和 13.166观测数 20最大(1) 0.933最小(1) 0.553置信度(95.0%) 0.043651655H0:u=0.618,H1:u0.6180.0403 0.0208557831.9323177662.0930240542.09302404985486 1.932317766不能拒绝原假设2.为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者在面积相等、土壤等条件相同的 20 块田地,分别施用新旧两种肥料,得到新肥料所生产的产量数据见 book4.2。通过计算得出对应旧肥料所生产的平均产量为100 公斤,检验新肥料的产
33、量是否显著高于旧肥料。 (显著性水平 =0.05)平均 100.7标准误差 1.098084457中位数 101众数 98标准差 4.91078298方差 24.11578947峰度 1.126259505偏度 -0.610870917区域 21最小值 88最大值 109求和 2014观测数 20最大(1) 109最小(1) 88置信度(95.0%) 2.298317176H0:u100,H11000.7 1.0980844571.7291328121.7291330.637474不能拒绝原假设3.某种电子元件的寿命服从正态分布,现测得 16 只元件的寿命见book4.3,问是否有理由认为元件
34、的平均寿命显著地低于 240 小时?(显著性水平为 0.05)平均 235.4736842标准误差 21.02273462中位数 222众数 #N/A标准差 91.63597572方差 8397.152047峰度 1.974300177偏度 1.300917624区域 384最小值 101最大值 485求和 4474观测数 19最大(1) 485最小(1) 101置信度(95.0%) 44.16712644H0:u240,H1:u7515 9.006820028 1.665404655ZZa不能拒绝原假设时间序列分析练习题1. 1981 年2000 年我国财政用于文教、科技、卫生事业费支出额数
35、据见book8.1 表。(1)用绘制时间序列图描述其趋势。(2)选择一条适合的趋势线拟合数据,并根据趋势线预测 2001 年的支出额。 (3)用 5 期移动平均法预测 2001 年用于该项的支出额.年份与费用支出额呈正相关234.35276.06317.22369.73427.76 104.1116523487.88 113.2792545553.49 124.2932618631.54 138.5540035725.87 165.0585911870.84 239.32415071040.79 300.44500331240.04 358.59478711462.17 402.9255552
36、1701.49 438.87924211927.47 453.45732782181.43 480.61159342001年的预测值为2181.43SUMMARY OUTPUT回归统计Multiple R 0.942823394R Square 0.888915952Adjusted R Square 0.882744616标准误差 276.2009589观测值 20方差分析df SS MS FSignificance F回归分析 1 10988334.4710988334.47 144.03946715.03539E-10残差 18 1373165.45576286.96972总计 19 1
37、2361499.92Coefficients 标准误差 t Stat P-value Lower 95% Upper 95%Intercept-363.6092632 128.3040336-2.8339659550.011004682-633.1660348 -94.0524915年份 t 128.5449774 10.7106137912.00164435 5.03539E-10106.0428129 151.047142回归方程:y=128.54t-363.61当 t=21时,y=2335.732. 1981 年2000 年我国油菜籽单位面积产量数据(单位: kg/hm)见 book8.
38、2表。(1)根据绘制时间序列图描述其形态。(2)用 5 期移动平均法预测 2001 年的单位面积产量。(3)建立一个趋势方程预测各年的单位面积产量年份增长,单位面积产量基本保持持平1293.61243.412211191.41164 89.336980031167 96.117136871170 96.264178181174.2 106.03697471232 80.957075051272.2 75.59851851303.4 80.75325381333.8 79.602361771373.4 79.28152371366 82.867122551400.6 87.68913274142
39、1.2 84.063071562001年估计值时1421.2SUMMARY OUTPUT回归统计Multiple R 0.45173525R Square 0.204064736Adjusted R Square 0.15984611标准误差 119.2106022观测值 20方差分析df SS MS FSignificance F回归分析 165583.1819565583.181954.6149045230.045555718残差 18255801.01814211.16767总计 19 321384.2Coefficients 标准误差 t Stat P-valueLower 95%Up
40、per 95%Intercept 1192.02631655.377074621.525628152.6977E-141075.6833991308.369232年份 9.9308270684.6227888712.1482328840.0455557180.21870805719.64294608回归方程:y=9.93x1+1192.026315789473. 一家旅馆过去 18 个月的营业额数据见 book8.3 表。(1)根据绘制时间序列图描述其形态。(2)用 3 期移动平均法预测第 19 个月的营业额。(3)建立一个趋势方程预测各月的营业额营业额与月份正相关300320321 31.2
41、7299154340 36.38223009348.6666667 35.5501732397 35.22520142412 27.96095161442.6666667 27.20362176455.6666667 20.57146531474.6666667 19.71181259466.6666667 13.63410756491.3333333 32.28002478531.3333333 51.4436045577.3333333 50.73022329610.6666667 44.93699293630.3333333 26.36074523第19个月的预测值为630.33万元SU
42、MMARY OUTPUT回归统计Multiple R 0.967257104R Square 0.935586306Adjusted R Square 0.93156045标准误差 31.66276183观测值 18方差分析df SS MS FSignificance F回归分析 1232982.4567232982.4567232.39438575.99425E-11残差 1616040.487791002.530487总计 17249022.9444Coefficients 标准误差 t Stat P-valueLower 95%Upper 95%Intercept 239.7320261
43、15.5705495515.396503865.16349E-11206.7239359272.7401164月份 21.928792571.43847362515.244487065.99425E-1118.8793647324.97822041回归方程:y=21.9287925696594x1+239.732026143791统计指数练习题1.某商店三种商品的销售情况如下表,销售量 销售价格(元)商品名称 计量单位基期 报告期 基期 报告期甲 件 40000 60000 10 8乙 米 80000 88000 8 8丙 千克 60000 30000 3 4.5(1)分析该商店三种商品的销售
44、量总指数及由于销售量变动引起的销售额的增加额;(2)分析该商店三种商品的价格总指数及由于价格变动引起的销售额的增加额;(3)分析该商店三种商品的销售额总指数及报告期较基期的销售额的增加额;销售量 销售价格(元)商品名称计量单位 基期 q0 报告期q1基期 p0 报告期p1 p0q1 p0q0p1q1甲 件 40000 60000 10 8 600000 400000 480000乙 米 80000 88000 8 8 704000 640000 704000丙 千克 60000 30000 3 4.5 90000 180000 1350001394000 1220000 13190001 销售
45、量指数 1.142622951销售额的增加额 1740002 价格总指数 0.946197991销售额的增加额 -750003 销售额总指数 1.081147541报告期较基期的销售额的增加额 990002.某企业三种商品的成本情况如下表,产量 产品单位成本(元)商品名称 计量单位基期 报告期 基期 报告期甲 件 90 110 10 9乙 箱 48 60 5 4.2丙 千克 160 240 8 6.4(1)分析三种商品的产量总指数及由于产量变动引起的总成本的增加额;(2)分析三种商品的产品单位成本总指数及由于产品单位成本变动引起的总成本的增加额;(3)分析三种商品的总成本指数及报告期较基期的总成本的增加额。