收藏 分享(赏)

统计学计算题复习.ppt

上传人:weiwoduzun 文档编号:3876220 上传时间:2018-11-24 格式:PPT 页数:82 大小:2.28MB
下载 相关 举报
统计学计算题复习.ppt_第1页
第1页 / 共82页
统计学计算题复习.ppt_第2页
第2页 / 共82页
统计学计算题复习.ppt_第3页
第3页 / 共82页
统计学计算题复习.ppt_第4页
第4页 / 共82页
统计学计算题复习.ppt_第5页
第5页 / 共82页
点击查看更多>>
资源描述

1、众数的确定 (分组数据),众数=25,众数的确定 (分组数据),众数的确定 (分组数据),L众数组的真实下限值 d1众数组频数-众数组前一组频数 d2众数组频数-众数组后一组频数 i 每组数据的组距个数,中位数 (位置的确定),奇数个数的数据:,偶数个数的数据:,中位数的确定(分组数据),根据位置公式确定中位数所在的组 采用下列近似公式计算:L 中位数组的真实组下限的值 N 整组数据的总数量 Sm-1 中位数组为止以上的累积频数 fm 中位数组的频数 i 组距的个数,某车间50名工人月产量的资料如下:,简单平均数 (Simple Mean),设一组数据为:X1 ,X2 , ,Xn适用于总体资料

2、未经分组整理、尚为原始资料的情况总体均值 样本均值式中: ,为均值; N(n)为总体(样本)单位总数;Xi为第i个单位的变量值。,算术平均数的计算方法 案例分析 4.10,某售货小组5个人,某天的销售额分别为520元、600元、480元、750元、440元,则平均每人日销售额为:,加权平均数 (Weighted Mean),设一组数据为: x1 ,x2 , ,xn 相应的频数为: f1 ,f2 , ,fk适用于总体资料经过分组整理形成变量数列的情况总体均值 样本均值(未分组)公式中: 为均值; f为相应频数;Xi为第i个单位的变量值。,加权平均数的计算方法 案例分析 4.11,某企业某日工人的

3、日产量资料如下:,计算该企业该日全部工人的平均日产量。,加权平均数的计算方法 案例分析 4.11,若上述资料为分组数列,则应取各组的组中值作为该组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。,简单平均数与加权平均数 (Simple Mean / Weighted Mean),设一组数据为: x1 ,x2 , ,xn 各组的组中值为: M1 ,M2 , ,Mk 相应的频数为: f1 , f2 , ,fk,简单平均数,加权平均数 (分组数据),表示各组的变量值(分组数列的组中值); 表示各组变量值出现的频数(即权数)。,例:根据某电脑公司在各市场上销售量的分组数据,计算电脑销售量的均

4、值。,样本方差和标准差 (Sample Variance and Standard Deviation),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,样本标准差 例题分析 4.18,样本标准差 例题分析 4.18,结论:每一天的销售量与平均数相比,平均相差21.58台,练习题 4.1,某百货公司6月份各天的销售额数据如下(单位:万元):(1)计算该百货公司日销售额的均值、中位数和四分位数; (2)计算日销售额的标准差。,解答 4.1,均值: 中位数:位置为第15位和第16位 四分位数:中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1

5、第15个数据的中间位置(第8位)靠上四分之一的位置上后四分位数位于第16第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273。标准差: 21.17,练习题 4.2,在某地区抽取的120家企业按利润额进行分组,结果如下:计算120家企业利润额的均值和标准差。,解答 4.2,各组平均利润为 x,企业数为f,则组总利润为xf,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:均值:,解答 4.2,标准差:,一个总体参数的区间估计,总体均值的区间估计 (大样本n 30),假定条件 总体服从正态分布,且方差() 已知 如果不

6、是正态分布,可由正态分布来近似 (n 30) 使用正态分布统计量 z总体均值 在1- 置信水平下的置信区间为,总体均值的区间估计 例题分析 6.2,一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。,总体均值的区间估计 例题分析 6.2,解:已知N(,102),n=25, 1- = 95%,z/2=1.96。根据样本数据计算得: 。由于是正态总体,且方差已知。总

7、体均值在1-置信水平下的置信区间为,因此:食品平均重量的置信区间为101.44g109.28g,总体均值的区间估计 例题分析 6.3,一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间。,总体均值的区间估计 例题分析 6.3,解:已知n=36, 1- = 90%,z/2=1.645。根据样本数据计算得: ,总体均值在1- 置信水平下的置信区间为,因此:在置信水平为90%的情况下,投保人平均年龄的置信区间为37.37岁41.63岁。,总体均值的区间估计 (小样本),假定条件 总体服从正态分布,但方差() 未知 小样本 (

8、n 30) 使用 t 分布统计量总体均值 在1-置信水平下的置信区间为,总体均值的区间估计 例题分析 6.4,已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(单位:h)如下。建立该批灯泡平均使用寿命95%的置信区间。,总体均值的区间估计 例题分析 6.4,解:已知N(,2),n=16, 1- = 95%,t/2=2.131根据样本数据计算得: ,总体均值在1-置信水平下的置信区间为:,因此,该种灯泡平均使用寿命的置信区间为1476.8h1503.2h,总体比例的区间估计,假定条件 总体服从二项分布 可以由正态分布来近似 使用正态分布统计量 z总体比例在1-置信水平

9、下的置信区间为,总体比例的区间估计 例题分析 6.5,某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,解:已知 n=100,p65% , 1- = 95%,z/2=1.96,因此,该城市下岗职工中女性比例的置信区间为55.65%74.35%,总体方差的区间估计,估计一个总体的方差或标准差 假设总体服从正态分布 总体方差 2 的点估计量为s2,且总体方差在1- 置信水平下的置信区间为,4.,总体方差的区间估计 例题分析 6.6,一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽

10、取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间。,总体方差的区间估计 例题分析 6.6,解:已知n25,1-95% ,根据样本数据计算得s2 =93.21 2置信度为95%的置信区间为,因此,该企业生产的食品总体重量标准差的的置信区间为7.54g13.43g,一个总体参数的区间估计 (小结),练习题 6.1,从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 样本均值的抽样标准差等于多少? 在95%的置信水平下,允许误差是多少?,解答 6.1,练习题 6.2,某快餐店想要估计每位顾客午餐的平均花费金额,在为期

11、3周的时间里选取49名顾客组成了一个简单随机样本。 假定总体标准差为15元,求样本均值的抽样标准误差; 在95%的置信水平下,求允许误差; 如果样本均值为120元,求总体均值95%的置信区间。,解答 6.2,练习题 6.3,某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 求职工上班从家里到单位平均距离95%的置信区间。,解答 6.3,解:已知N(,2),n=16, 1- = 95%,t/2=2.131根据样本数据计算得: ,总体均值在1-置信水平下的

12、置信区间为:因此,职工上班从家里到单位平均距离的置信区间为7.153(公里)11.597(公里).,练习题 6.4,某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%; (2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查?,解答 6.4,练习题 6.5,根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?,解答 6.5,检验2 已知均值的检验 例题分析

13、7.1,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),双侧检验,2 已知均值的检验 (小样本例题分析 7.2),根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),单侧检验,2 未知

14、大样本均值的检验 (例题分析 7.3),某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准? (0.05),单侧检验,2 未知小样本均值的检验 (例题分析 7.4),某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。,双侧检验,2 未知小样本均值的检验 (例题分析 7.5

15、),一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05),单侧检验!,总体比例的检验 (例题分析 7.6),一项统计结果声称,某市老年人口(年龄在65岁以上)的比重为14.7%,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?(= 0.0

16、5),双侧检验,方差的卡方 (2) 检验 (例题分析 7.7),某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升(1000cm3)的饮料误差上下不超过1cm3。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取25瓶,分别进行测定(用样本减1000cm3),得到如下结果。检验该机器的性能是否达到设计要求 (=0.05),双侧检验,用置信区间进行检验 (例题分析 7.8),一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(

17、= 0.05),双侧检验!,香脆蛋卷,2 已知均值的检验 例题分析 7.1,H0: = 0.081 H1: 0.081 = 0.05 n = 200 临界值(s):,检验统计量:,决策:,结论:,因为 Z0.025=1.96, -2.83-1.96 在 = 0.05的水平上,拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异。,2 已知均值的检验 (小样本例题分析 7.2),H0: 1020 H1: 1020 = 0.05 n = 16 临界值(s):,检验统计量:,因为 Z0.05=1.645, 2.41.645 在 = 0.05的水平上,拒绝H0,有证据表明这批灯泡的使用寿命有显

18、著提高。,决策:,结论:,2 未知大样本均值的检验 (例题分析 7.3),H0: 1200 H1: 1200 = 0.05 n = 100 临界值(s):,检验统计量:,因为 Z0.05=1.645, 1.51.645 在 = 0.05的水平上,不拒绝H0,不能认为该厂生产的元件寿命显著地高于1200小时。,决策:,结论:,2 未知小样本均值的检验 (例题分析 7.4),H0: = 5 H1: 5 = 0.05 df = 10 - 1 = 9 临界值(s):,检验统计量:,因为 t0.025=2.262, 3.162.262 在 = 0.05的水平上拒绝H0,说明该机器的性能不好。,决策:,结

19、论:,均值的单侧t 检验 (计算结果),H0: 40000 H1: 40000 = 0.05 df = 20 - 1 = 19 临界值(s):,检验统计量:,因为 t0.05=1.729, 0.8941.729 在 = 0.05的水平上不拒绝H0,不能认为制造商的产品同他所说的标准不相符。,决策:,结论:,总体比例的检验 (例题分析 7.6),H0: = 14.7% H1: 14.7% = 0.05 n = 400 临界值(s):,检验统计量:,因为 Z0.025=1.96, -0.254-1.96 在 = 0.05的水平上不拒绝H0,该市老年人口比重为14.7%.,决策:,结论:,方差的卡方

20、 (2) 检验 (例题分析 7.7),H0: 2 = 1 H1: 2 1 = 0.05 df = 25 - 1 = 24 临界值(s):,统计量:,在 = 0.05的水平上不拒绝H0,不能认为该机器的性能未达到设计要求,决策:,结论:,用置信区间进行检验 (例题分析 7.8),H0: = 1000 H1: 1000 = 0.05 n = 16 临界值(s):,置信区间为,决策:,结论:,假设的0 =1000在置信区间内,不拒绝H0,不能认为这批产品的包装重量不合格。,练习题 7.1,液晶显示屏批量生产的质量标准为平均使用寿命35000小时。某厂商宣称其生产的液晶显示屏的使用寿命远远超过规定标准

21、。现从该厂商生产的一批液晶显示屏中随机抽取了100件样本进行验证,测得平均使用寿命为35250小时,标准差为1380小时,试在(=0.05)的显著性水平下检验该厂商生产的液晶显示屏是否显著的高于规定标准?,练习题 7.2,某制盐企业用机器包装食盐,假设每袋食盐的净重量服从正态分布,每袋标准净重量为500克。某天开工后,为检验机器工作是否正常,从包装好的食盐中随机抽取了9袋,测得平均净重量为499克,样本标准差为16.03克,试在(=0.05)的显著性水平下检验这天包装机工作是否正常?,练习题 7.3,某公司计划为每一位员工配股,董事会估计配股方案在全体员工内的支持率为80%。现随机抽查100名

22、员工,其中支持配股方案的有76人。试在(=0.05)的显著性水平下检验董事会的估计是否可靠?,练习题 7.4,解答 7.1,解答 7.2,解答 7.3,解答 7.4,方差分析练习题 8.1,某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到如下表: 1)完成方差分析表 2)若显著性水平为 =0.05,检验三种方法组装的产品数量之间是否有显著差异。,练习题 8.2,从三个总体中各抽取容量不同的样本数据,得到下表。检验3个总体的均值之间是否有显著差异.( =0.01),练习题

23、 8.3,某家电制造公司准备购进一批5#电池,现有A,B,C三个电池生产企业愿意供货,为此比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得出其寿命(小时)数据如下表。试分析三个企业生产的电池的平均寿命之间有无差异。( =0.05) 如果有差异,用LSD方法建议哪些企业之间有差异。,解答 8.1,F=1.478F0.05(2,27)=3.354 131 所以不拒绝原假设,表明不认为三种方法组装的产品之间有显著差异。 P值也可以直接用来进行统计决策,若P ,则拒绝原假设,P ,则不拒绝原假设。该题中P=0.245 946 =0.05,因此不拒绝原假设H0。,解答 8.2,F=4.65

24、74F0.01(2,9)=8.0215 所以不拒绝原假设,表明不认为三个总体均值之间有显著差异。 P值也可以直接用来进行统计决策,若P ,则拒绝原假设,P ,则不拒绝原假设。该题中P=0.040877 =0.01,因此不拒绝原假设H0。,解答 8.3,F=17.0684F0.05(2,12)=3.88529 所以拒绝原假设,表明三个三个企业生产电池的寿命之间有显著差异。 P值也可以直接用来进行统计决策,若P ,则拒绝原假设,P ,则不拒绝原假设。该题中P=0.00031 =0.05,因此不拒绝原假设H0。,解答 8.3,第1步:提出假设 检验1: 检验2: 检验3:,解答 8.3,第2步:计算

25、检验统计量 检验1: 检验2: 检验3: 第3步:计算LSD 检验1: 检验2: 检验3,解答 8.3,第4步:作出决策A电池与B 电池寿命有显著差异不认为A电池与C电池寿命有显著差异 B电池与C 电池寿命有显著差异,回归练习题 9.1,某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 方差分析表,解答 9.1,解:(2) 由此可知,销售量与广告费用之间的相关系数是0.93。,解答 9.1,(3)估计的回归方程: 回归系数 表示广告费用每增加一个单位,销售量平均增加1.420211个单位。 (4) F=64.6221 ,所以这回归方程是显著的。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 统计学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报