1、 3 1 为评价家电行业售后服务的质量,随机抽取了由 100 个家庭构成的一个样本。服务质量的等级分别表示为: A好; B较好; C 一般; D较差; E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的
2、数据属于什么类型。 顺序数据 (2)用 Excel 制作一张频数分布表。 用数据分析 直方图制作: (3)绘制一张条形图,反映评价等级的分布。 用数据分析 直方图制作: 直方图02040E D C B A接收频率频率(4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表: 接收 频数 频率 (%) 累计频率 (%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 100 接收 频率 E 16 D 17 C 32 B 21 A 14 05101520253035C D B A E020406080100120频数累计频率( % )3
3、 2 某行业管理局所属 40 个企业 2002 年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求: (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数: l g 4 0l g ( ) 1 . 6 0 2 0 61 1 1 6 . 3 2l g ( 2 ) l g
4、 2 0 . 3 0 1 0 3nK ,取 k=6 2、确定组距: 组距 ( 最大值 - 最小值 ) 组数 =( 152-87) 6=10.83,取 10 3、分组频数表 销售收入 频数 频率 % 累计频数 累计频率 % 80.00 - 89.00 2 5.0 2 5.0 90.00 - 99.00 3 7.5 5 12.5 100.00 - 109.00 9 22.5 14 35.0 110.00 - 119.00 12 30.0 26 65.0 120.00 - 129.00 7 17.5 33 82.5 130.00 - 139.00 4 10.0 37 92.5 140.00 - 14
5、9.00 2 5.0 39 97.5 150.00+ 1 2.5 40 100.0 总和 40 100.0 (2)按规定,销售收入在 125 万元以上为先进企业, 115 125 万元为良好企业, 105 115 万 元为一般企业, 105 万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 频数 频率 % 累计频数 累计频率 % 先进企业 10 25.0 10 25.0 良好企业 12 30.0 22 55.0 一般企业 9 22.5 31 77.5 落后企业 9 22.5 40 100.0 总和 40 100.0 3 3 某百货公司连续 40 天的商品销售额如下: 单位
6、:万元 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 1、确定组数: l g 4 0l g ( ) 1 . 6 0 2 0 61 1 1 6 . 3 2l g ( 2 ) l g 2 0 . 3 0 1 0 3nK ,取 k=6 2、确定组距: 组距 ( 最大值 - 最小值 ) 组数 =( 49-25) 6=4,取 5 3、分组频数表
7、销售收入(万元) 频数 频率 % 累计频数 累计频率 % = 25 1 2.5 1 2.5 26 - 30 5 12.5 6 15.0 31 - 35 6 15.0 12 30.0 36 - 40 14 35.0 26 65.0 41 - 45 10 25.0 36 90.0 46+ 4 10.0 40 100.0 总和 40 100.0 频数0246810121416= 25 26 - 30 31 - 35 36 - 40 41 - 45 46+销售收入频数频数3 4 利用下面的数据构建茎叶图和箱线图。 57 29 29 36 31 23 47 23 28 28 35 51 39 18 46
8、 18 26 50 29 33 21 46 41 52 28 21 43 19 42 20 data605040302010data Stem-and-Leaf Plot Frequency Stem & Leaf 3.00 1 . 889 5.00 2 . 01133 7.00 2 . 6888999 2.00 3 . 13 3.00 3 . 569 3.00 4 . 123 3.00 4 . 667 3.00 5 . 012 1.00 5 . 7 Stem width: 10 Each leaf: 1 case(s) 3 6一种 袋装 食 品用 生产 线自 动装 填 ,每 袋重 量大 约为
9、 50g,但 由 于某 些原 因,每 袋重 量 不 会 恰好 是 50g。 下 面 是随 机 抽 取 的 100袋 食 品 , 测得 的 重 量 数据 如下: 单 位: g 57 46 49 54 55 58 49 61 51 49 51 60 52 54 51 55 60 56 47 47 53 51 48 53 50 52 40 45 57 53 52 51 46 48 47 53 47 53 44 47 50 52 53 47 45 48 54 52 48 46 49 52 59 53 50 43 53 46 57 49 49 44 57 52 42 49 43 47 46 48 51
10、59 45 45 46 52 55 47 49 50 54 47 48 44 57 47 53 58 52 48 55 53 57 49 56 56 57 53 41 48 要求: (1)构建这些数据的频数分布表。 (2)绘制频数分布的直方图。 (3)说明数据分布的特征。 解: (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数: l g 1 0 0l g ( ) 21 1 1 6 . 6 4l g ( 2 ) l g 2 0 . 3 0 1 0 3nK ,取 k=6 或 7 2、确定组距: 组距 ( 最大值 - 最小值 ) 组数 =( 61-40)
11、 6=3.5,取 3 或者 4、 5 组距 ( 最大值 - 最小值 ) 组数 =( 61-40) 7=3, 3、分组频数表 组距 3, 上限为 小于 频数 百分比 累计频数 累积百分比 有效 40.00 - 42.00 3 3.0 3 3.0 43.00 - 45.00 9 9.0 12 12.0 46.00 - 48.00 24 24.0 36 36.0 49.00 - 51.00 19 19.0 55 55.0 52.00 - 54.00 24 24.0 79 79.0 55.00 - 57.00 14 14.0 93 93.0 58.00+ 7 7.0 100 100.0 合计 100
12、100.0 直方图: 组距3,小于1086420Frequency3020100组距3 ,小于Mean =5.22 Std. Dev. =1.508 N =100组距 4, 上限为 小于等于 频数 百分比 累计频数 累积百分比 有效 = 40.00 1 1.0 1 1.0 41.00 - 44.00 7 7.0 8 8.0 45.00 - 48.00 28 28.0 36 36.0 49.00 - 52.00 28 28.0 64 64.0 53.00 - 56.00 22 22.0 86 86.0 57.00 - 60.00 13 13.0 99 99.0 61.00+ 1 1.0 100
13、100.0 合计 100 100.0 直方图: 组距4,小于等于86420Frequency403020100组距4 ,小于等于Mean =4.06 Std. Dev. =1.221 N =100组距 5, 上限为 小于等于 频数 百分比 累计频数 累积百分比 有效 = 45.00 12 12.0 12.0 12.0 46.00 - 50.00 37 37.0 49.0 49.0 51.00 - 55.00 34 34.0 83.0 83.0 56.00 - 60.00 16 16.0 99.0 99.0 61.00+ 1 1.0 100.0 100.0 合计 100 100.0 直方图: 组
14、距5,小于等于6543210Frequency50403020100组距5 ,小于等于Mean =2.57 Std. Dev. =0.935 N =100分布特征:左偏钟型。 3.8 下面是北方某城市 1 2月份各天 气温的记录数据 : -3 2 -4 -7 -11 -1 7 8 9 -6 14 -18 -15 -9 -6 -1 0 5 -4 -9 6 -8 -12 -16 -19 -15 -22 -25 -24 -19 -8 -6 -15 -11 -12 -19 -25 -24 -18 -17 -14 -22 -13 -9 -6 0 -1 5 -4 -9 -3 2 -4 -4 -16 -1
15、7 5 -6 -5 要求: (1)指出上面的数 据属于什么类型 。 数值型数 据 (2)对上面的数据 进行适当的分组 。 1、确定组数: l g 6 0l g ( ) 1 . 7 7 8 1 5 11 1 1 6 . 9 0 9 8 9l g ( 2 ) l g 2 0 . 3 0 1 0 3nK ,取 k=7 2、确定组距: 组距 ( 最大值 - 最小值 ) 组数 =( 14-( -25)) 7=5.57,取 5 3、分组频数表 温度 频数 频率 % 累计频数 累计频率 % -25 - -21 6 10.0 6 10.0 -20 - -16 8 13.3 14 23.3 -15 - -11
16、9 15.0 23 38.3 -10 - -6 12 20.0 35 58.3 -5 - -1 12 20.0 47 78.3 0 - 4 4 6.7 51 85.0 5 - 9 8 13.3 59 98.3 10+ 1 1.7 60 100.0 合计 60 100.0 (3)绘制直方图, 说明该城市气温 分布的特点 。 频数68912 1248102468101214-25 - -21 -20 - -16 -15 - -11 -10 - -6 -5 - -1 0 - 4 5 - 9 10+频数3.11 对于下面的数据绘制散点图。 x 2 3 4 1 8 7 y 25 25 20 30 16
17、18 解: 051015202530350 2 4 6 8 10xy3 12 甲乙两个班各有 40名学生,期末统计学考试成绩的分布如下: 考试成绩 人数 甲班 乙班 优 良 中 及格 不及格 3 6 18 9 4 6 15 9 8 2 要求: (1)根据上 面的数据 ,画出两 个班考 试成绩的 对比条形 图和环 形图。 36189461598202468101214161820优 良 中 及格 不及格人数 甲班人数 乙班361894615982优良中及格不及格(2)比较两 个班考试 成绩分布 的特点 。 甲班成绩中 的人数较 多,高 分和低 分人数比 乙班多 ,乙班 学习成绩 较甲班好 ,高分
18、较多, 而低分较 少。 (3)画出雷 达图,比 较两个班 考试成 绩的分布 是否相似 。 05101520优良中及格不及格人数 甲班人数 乙班分布不相似。 3.14 已知 1995 2004年 我国 的国 内生产 总值 数据如 下 (按 当年 价格计 算 ): 单位: 亿元 年份 国内生产总值 第一产业 第二产业 第三产业 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 58478.1 67884 6 74462 6 78345 2 82067 5 89468 1 97314 8 105172.3 117390 2 136875 9 1199
19、3 13844.2 14211 2 14552 4 14471 96 14628 2 15411 8 16117 3 16928 1 20768 07 28538 33613 37223 38619 40558 44935 48750 52980 61274 72387 17947 20428 23029 25174 27038 29905 33153 36075 39188 43721 要求: (1)用 Excel绘制国内生产总值的线图。 国内生产总值0200004000060000800001000001200001400001600001995 1996 1997 1998 1999 2
20、000 2001 2002 2003 2004国内生产总值(2)绘制第一、二、三产业国内生产总值的线图。 010000200003000040000500006000070000800001995199619971998199920002001200220032004第一产业第二产业第三产业(3)根据 2004年的国内生产总值及其构成数据绘制饼图。 国内生产总值20768.07,15%72387, 53%43721, 32%第一产业第二产业第三产业第四章 统计数据的 概括性描述 4 1 一家汽车零售店的 10 名销售人员 5 月份销售的汽车数量 (单位:台 )排序后如下: 2 4 7 10 1
21、0 10 12 12 14 15 要求: ( 1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。 解: Statistics 汽车销售数量 N Valid 10 Missing 0 Mean 9.60 Median 10.00 Mode 10 Std. Deviation 4.169 Percentiles 25 6.25 50 10.00 75 12.50 汽车销售数量1512.5107.552.5Frequency3210HistogramMean =9.6 Std. Dev. =4.169 N =10
22、4 2 随机抽取 25 个网络用户,得到他们的年龄数据如下: 单位:周岁 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求; (1)计算众数、中位数: 1、排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄 Frequency Percent Cumulative Frequency Cumulative Percent Valid 15 1 4.0 1 4.0 16 1 4.0 2 8.0 17 1 4.0 3 12.0 18 1 4.0 4 16.0 19 3 12.0 7
23、28.0 20 2 8.0 9 36.0 21 1 4.0 10 40.0 22 2 8.0 12 48.0 23 3 12.0 15 60.0 24 2 8.0 17 68.0 25 1 4.0 18 72.0 27 1 4.0 19 76.0 29 1 4.0 20 80.0 30 1 4.0 21 84.0 31 1 4.0 22 88.0 34 1 4.0 23 92.0 38 1 4.0 24 96.0 41 1 4.0 25 100.0 Total 25 100.0 从频数看出,众数 Mo 有两个: 19、 23;从累计频数看,中位数 Me=23。 (2)根据定义公式计算四分位数。
24、 Q1 位置 =25/4=6.25,因此 Q1=19, Q3 位置 =3 25/4=18.75,因此 Q3=27,或者,由于25 和 27 都只有一个,因此 Q3 也可等于 25+0.75 2=26.5。 (3)计算平均数和标准差; Mean=24.00; Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080; Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析: 分布,均值 =24、标准差 =6.652、呈右偏分布。如需看清楚分布形态,需要 进行分组。 为分组情况下的直方图: 网络用户的年龄41383431302927252
25、4232221201918171615Count3210为分组情况下的概率密度曲线: 网络用户的年龄413834313029272524232221201918171615Count3.02.52.01.51.0分组: 1、确定组数: l g 2 5l g ( ) 1 . 3 9 81 1 1 5 . 6 4l g ( 2 ) l g 2 0 . 3 0 1 0 3nK ,取 k=6 2、确定组距: 组距 ( 最大值 - 最小值 ) 组数 =( 41-15) 6=4.3,取 5 3、分组频数表 网络用户的年龄 (Binned) Frequency Percent Cumulative Freq
26、uency Cumulative Percent Valid = 15 1 4.0 1 4.0 16 - 20 8 32.0 9 36.0 21 - 25 9 36.0 18 72.0 26 - 30 3 12.0 21 84.0 31 - 35 2 8.0 23 92.0 36 - 40 1 4.0 24 96.0 41+ 1 4.0 25 100.0 Total 25 100.0 分组后的均值与方差: Mean 23.3000 Std. Deviation 7.02377 Variance 49.333 Skewness 1.163 Kurtosis 1.302 分组后的直方图: 组中值5
27、0.0045.0040.0035.0030.0025.0020.0015.0010.00Frequency1086420Mean =23.30 Std. Dev. =7.024 N =254 3 某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另 种是顾客在三千业务窗口处列队 3 排等待。为比较哪种排队方式使顾客等待的时间更短两种排队方式各随机抽取 9 名顾客。得到第一种排队方式的平均等待时间为 7 2 分钟,标准差为 1 97 分钟。第二种排队方式的等待时间 (单位:分钟 )如下: 5 5 6 6 6 7 6 8 7 1 7 3 7
28、4 7 8 7 8 要求: (1)画出第二种排队方式等待时间的茎叶 图。 第二种排队方式的等待时间 (单位 : 分钟 ) Stem-and-Leaf Plot Frequency Stem & Leaf 1.00 Extremes (=5.5) 3.00 6 . 678 3.00 7 . 134 2.00 7 . 88 Stem width: 1.00 Each leaf: 1 case(s) (2)计算 第二种排队时间的平均数和标准差。 Mean 7 Std. Deviation 0.714143 Variance 0.51 (3)比较两种排队方式等待时间的离散程度。 第二种排队方式的离散程
29、度小。 (4)如果让你选择一种排队方式,你会选择哪 种?试说明理由。 选择第二种,均值小,离散程度小。 4 4 某百货公司 6 月份各天的销售额数据如下: 单位:万元 257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 要求: (1)计算该百货公司日销售额的平均数和中位数。 (2)按定义公式计算四分位数。 (3)计算日销售额的标准差。 解: Statistics 百货公司每天的销售额(万元) N Valid
30、30 Missing 0 Mean 274.1000 Median 272.5000 Std. Deviation 21.17472 Percentiles 25 260.2500 50 272.5000 75 291.2500 4 5 甲乙两个企业生产三种产品的单位成本和总成本资料如下: 产品 单位成本 总成本 (元 ) 名称 (元 ) 甲企业 乙企业 A B C 15 20 30 2 100 3 000 1 500 3 255 1 500 1 500 要求:比较两个企业的总平均成本,哪个高,并分析其原因。 产品名称 单位成本 (元 ) 甲企业 乙企业 总成本 (元 ) 产品数 总成本 (元
31、 ) 产品数 A 15 2100 140 3255 217 B 20 3000 150 1500 75 C 30 1500 50 1500 50 平均成本(元) 19.41176471 18.28947368 调和平均数计算,得到甲的平均成本为 19.41;乙的平均成本为 18.29。甲的中间成本的产品多,乙的低成本的产品多。 4 6 在某地区抽取 120 家企业,按利润额进行分组,结果如下: 按利润额分组 (万元 ) 企业数 (个 ) 200300 300400 400500 500600 600 以上 19 30 42 18 11 合 计 120 要求: (1)计算 120 家企 业利润额
32、的平均数和标准差。 (2)计算分布的偏态系数和峰态系数。 解: Statistics 企业利润组中值 Mi(万元) N Valid 120 Missing 0 Mean 426.6667 Std. Deviation 116.48445 Skewness 0.208 Std. Error of Skewness 0.221 Kurtosis -0.625 Std. Error of Kurtosis 0.438 企业利润组中值Mi(万元)700.00600.00500.00400.00300.00200.00Frequency50403020100HistogramCases weighted
33、 by 企 业个数Mean =426.67 Std. Dev. =116.484 N =1204 7 为研究少年儿童的成长发育状况,某研究所的一位调查 人员在某城市抽取 100 名 717 岁的少年儿童作为样本,另一位调查人员则抽取了 1 000 名 7 17 岁的少年儿童作为样本。请回答下面的问题,并解释其原因。 (1)两位调查人员所得到的样本的平均身高是否相同 ?如果不同,哪组样本的平均身高较大 ? (2)两位调查人员所得到的样本的标准差是否相同 ?如果不同,哪组样本的标准差较大 ? (3)两位调查人员得到这 l 100 名少年儿童身高的最高者或最低者的机会是否相同 ?如果不同,哪位调查研
34、究人员的机会较大 ? 解:( 1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于 总体平均身高。 ( 2)不一定相同,样本量少的标准差大的可能性大。 ( 3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。 4 8 一项关于大学生体重状况的研究发现男生的平均体重为 60kg,标准差为 5kg;女生的平均体重为 50kg,标准差为 5kg。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大 ?为什么 ? 女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。 (2)以磅为单位 (1ks 2 2lb),求体重的平均数和标准差。 都是
35、各乘以 2.21,男生的平均体重为 60kg 2.21=132.6磅,标准差为 5kg 2.21=11.05磅;女生的平均体重为 50kg 2.21=110.5 磅,标准差为 5kg 2.21=11.05 磅。 (3)粗略地估计一下,男生中有百分之几的人体重在 55kg 一 65kg 之间 ? 计算标准分数: Z1=xxs = 55605 =-1; Z2= xxs = 65 605 =1,根据经验规则,男生大约有 68%的人体重在 55kg 一 65kg 之间。 (4)粗略地估计一下,女生中有百分之几的人体重在 40kg 60kg 之间 ? 计算标准分数: Z1=xxs = 40 505 =-
36、2; Z2= xxs =60 505 =2,根据经验规则,女生大约有 95%的人体重在 40kg 一 60kg 之间。 4 9 一家公司在招收职员时,首先要通过两项能力测试。在 A 项测试中,其平均分数是100 分,标准差是 15 分;在 B 项测试中,其平均分数是 400 分,标准差是 50 分。一位应试者在 A 项测试中得了 115 分,在 B 项测试中得了 425 分。与平均分数相比,该应试者哪一项测试更为理想 ? 解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。 ZA= xxs = 115 10015 =1; ZB= xxs = 425 40050 =0.5 因此, A 项测
37、试结果理想。 4 10 一条产品生产线平均每天的产量为 3 700 件,标准差为 50 件。如果某一天的产量低于或高于平均产量,并落人士 2 个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天的产量,该生产线哪几天失去了控制 ? 时间 周一 周二 周三 周四 周五 周六 周日 产量 (件 ) 3 850 3 670 3 690 3 720 3 610 3 590 3 700 时间 周一 周二 周三 周四 周五 周六 周日 产量 (件 ) 3850 3670 3690 3720 3610 3590 3700 日平均产量 3700 日产量标准差 50 标准分数 Z 3 -0.6 -0.
38、2 0.4 -1.8 -2.2 0 标准分数界限 -2 -2 -2 -2 -2 -2 -2 2 2 2 2 2 2 2 周六超出界限,失去控制。 4 11 对 10 名成年人和 10 名幼儿的身高进行抽样调查,结果如下: 成年组 166 169 l72 177 180 170 172 174 168 173 幼儿组 68 69 68 70 7l 73 72 73 74 75 要求: (1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量 ?为什么 ? 均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大 ? 成年组 幼儿组 平均 172.1 平均 71.3 标准差 4
39、.201851 标准差 2.496664 离散系数 0.024415 离散系数 0.035016 幼儿组的身高差异大。 4 12 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取 15 个工人,让他们分别用三种方法组装。下面是 15 个工人分别用三种方法在相同的时间内组装的产品数量: 单位:个 方法 A 方法 B 方法 C 164 167 168 165 170 165 164 168 164 162 163 166 167 166 165 129 130 129 130 131 30 129 127 128 128 127 128 128 125 132 125
40、 126 126 127 126 128 127 126 127 127 125 126 116 126 125 要求: (1)你准备采用什么方法来评价组装方法的优劣 ? (2)如果让你选择一种方法,你会作出怎样的选择 ?试说明理由。 解:对比均值和离散系数的方法,选择均值大,离散程度小的。 方法 A 方法 B 方 法 C 平均 165.6 平均 128.7333333 平均 125.5333333 标准差 2.131397932 标准差 1.751190072 标准差 2.774029217 离散系数: VA=0.01287076, VB= 0.013603237, VC= 0.022097
41、949 均值 A 方法最大,同时 A 的离散系数也最小,因此选择 A 方法。 4 13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投 资风险就越高。下面的两个直方图,分别反映了 200 种商业类股票和 200 种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。 (1)你认为该用什么样的统计量来反映投资的风险 ? 标准差或者离散系数。 (2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票 ? 选择离散系数小的股票,则选择商业股票
42、。 (3)如果进行股票投资,你会选择商业类股票还是高科技类股票 ? 考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。 6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为 盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0 盎司的正态分布。随机抽取由这台机器灌装的 9 个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过 0.3 盎司的概率。 解:总体方差知道的情况下,均值的抽样分布服从 2,N n 的正态分布,由正态分布,标准化得到标准正态分布: z= xn 0,1N ,因此,样本均值不超过总体均值的概率 P为: 0.3Px = 0 .3xP nn =
43、 0 .3 0 .31 9 1 9xP n = 0.9 0.9Pz =2 0.9 -1,查标准正态分布表得 0.9 =0.8159 因此, 0.3Px =0.6318 6.3 1Z , 2Z , 6Z 表示从标准正态总体中随机抽取的容量, n=6 的一个样本,试确定常数 b,使得 6 21 0.95iiP Z b 解:由于卡方分布是由标准正态分布的平方和构成的: 设 Z1, Z2, , Zn 是来自总体 N(0,1)的样本,则统计量 2 2 2 212 nZ Z Z 服从自由度为 n 的 2 分布,记为 2 2( n) 因此,令 6221 ii Z ,则 62 2 21 6ii Z,那么由概率
44、 6 21 0.95iiP Z b ,可知: b= 21 0.95 6 ,查概率表得: b=12.59 6.4 在习题 6.1 中,假定装瓶机对瓶子的灌装量服从方差 2 1 的标准正态分 布。假定我们计划随机抽取 10 个瓶子组成样本,观测每个瓶子的灌装量,得到 10 个观测值,用这10 个观测值我们可以求出样本方差 2 2 211( ( ) )1 n iiS S Y Yn ,确定一个合适的范围使得有较大的概率保证 S2 落入其中是有用的,试求 b1, b2, 使得 212( ) 0.90p b S b 解:更加样本方差的抽样分布知识可知,样本统计量: 2 22( 1) ( 1)ns n 此处
45、, n=10, 2 1 ,所以统计量 22 222( 1 ) (1 0 1 ) 9 ( 1 )1n s s sn 根据卡方分布的可知: 221 2 1 29 9 9 0 . 9 0P b S b P b S b 又因为: 2 2 21 2 21 9 1 1P n S n 因此: 2 2 2 21 2 1 2 29 9 9 1 9 1 1 0 . 9 0P b S b P n S n 2 2 2 21 2 1 2 29 9 9 1 9 1P b S b P n S n 2 2 20 .9 5 0 .0 59 9 9 0 . 9 0PS 则: 221 0 .9 5 2 0 .0 59 9 , 9
46、9bb 220 .9 5 0 .0 51299,bb 查概率表: 20.95 9 =3.325, 20.05 9 =19.919,则 20.951 99b =0.369, 20.052 99b =1.88 第四章 抽样分布与参数估计 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期 3 周的时间里选取 49 名顾客组成了一个简单随机样本。 (1)假定总体标准差为 15 元,求样本均值的抽样标准误差。 x n 1549=2.143 (2)在 95的置信水平下,求边际误差。 xxt ,由于是大样本抽样,因此样本均值服从正态分布,因此概率度 t= 2z 因此, xxt 2 xz 0.025
47、 xz =1.96 2.143=4.2 (3)如果 样本均值为 120 元,求总体均值 的 95的置信区间。 置信区间为: ,xxxx = 1 2 0 4 .2,1 2 0 4 .2=( 115.8, 124.2) 7.4 从总体中抽取一个 n=100 的简单随机样本 ,得到 x =81, s=12。 要求: 大样本,样本均值服从正态分布: 2,xNn或 2, sxNn置信区间为:22,ssx z x znn , sn= 12100=1.2 (1)构建 的 90的置信区间。 2z = 0.05z =1.645,置信区间为: 8 1 1 . 6 4 5 1 . 2 , 8 1 1 . 6 4 5 1 . 2 =( 79.03, 82.97) (2)构建 的 95的置信区间。 2z = 0.025z =1.96,置信区间为: 8 1 1 .9 6 1 .2 , 8 1 1 .9 6 1 .2 =( 78.65, 83.35) (3)构建 的 99的置