1、统计实例,STAT,统计实例(Statistics in Practice)1988年7月28日的纽约时报上刊登了一篇反映人们地理知识的文章。这篇文章描述了一个由国家地理协会委托Gallup公司所做的研究结果。研究者们从一些国家抽取许多成年人并请他们鉴别在一个地图上的16个地方(包括13个国家、中非、波斯湾和太平洋),然后把每个人答对的个数加起来。四个国家的样本中答对的个数均值分别为: (1)美国:6.9; (2)墨西哥:8.2; (3)英国:9.0; (4)法 国:9.2。问题:哪国人民的地理知识掌握得最好? 法-英0;法-墨0;法-美0。(1)样本的随机性差异;(2)显著性差异。,第七章
2、假设检验,STAT,本章重点1、假设检验的基本原理;2、单个总体参数的假设检验;3、两个总体参数比较的假设检验。本章难点1、假设的设定;2、两类错误的辨析。参考文献1、刘汉良:统计学教程,上海财大出版社1997;2、袁卫、庞皓:统计学,高等教育出版社2005;3、曾五一:统计学概论,首都经贸大学出版社2003。,第七章 假设检验,STAT,第一节 假设检验(hypothesis testing)的基本原理一、原假设和备择假设(P173)例一名被告即将接受法庭的审判。 H0:被告是无罪的 (null hypothesis) H1:被告是有罪的 (alternative hypothesis)假设
3、检验 检验假设:检验原假设的正确性。例某种袋装食品10万袋,按规定每袋重量不得低于250克。今从中任抽100袋,发现有6袋低于250克,若规定不符合标准的比例超过5%就不得出厂,该批食品能否出厂?,第七章 假设检验,STAT,例河下乡统计员报告,其所在乡平均每个农户的家庭年收入为5000元。为核实其说法,县统计局从该乡随机抽取25户农户,得到平均年收入为4050元,试问该乡统计员的说法是否正确? H0: = 5000 “说法正确” H1: 5000 “说法不正确” 1、原假设:接受检验的假设; 研究者怀疑并希望否定的命题。2、备择假设:研究者希望(倾向于)肯定的命题。3、思路:反证法证明:A=
4、B,假设:AB 证明: 5000 ,假设: = 5000,第七章 假设检验,STAT,二、假设检验的基本原理1、小概率事件原理例A声称“他是一个素食者”。 H0:A是一个素食者 H1:A不是一个素食者(1)只抽一个样本:黄瓜 判断:接受H0,否定H1。含义很难拒绝 只好“含含糊糊地”接受或继续调查。(2)只抽一个样本:香肠判断:拒绝H0,接受H1。含义绝对无法接受 “斩钉截铁地拒绝”。,第七章 假设检验,STAT,例 据一调查公司声称2002年某市职工月收入XN(=750,2= 1502)。现随机抽取100名职工,计算出其月平均收入为780元。问该声称是否可以接受(显著性水平=0.05)。分析
5、建立假设:H0:=750 H1:750,第七章 假设检验,STAT,例一调查公司声称2002年某市职工月收入XN( 750, 1502 )。现随机抽取100名职工,得其月平均收入为780元,问该声称是否可以接受(=0.05)。H0:=750, +,-Z/2 0 Z /2,第七章 假设检验,STAT,例一调查公司声称2002年某市职工月收入XN(750, 1502 )。现随机抽取100名职工,得其月平均收入为780元,问该声称是否可以接受(=0.05)H0:=750,720.6 750 779.4,-1.96 0 1.96,1、小概率事件:发生概率在5%及以下的事件。2、小概率事件原理:一次试验
6、中小概率事件几乎不发生。,第七章 假设检验,STAT,三、假设检验中的两类错误例法官判案过程中的错误 H0:被告是无罪的,第一类错误:判定一个无罪的人有罪(冤案,屈打成招);第二类错误:判定一个有罪的人无罪(错案,逍遥法外)。 减小第一类错误 措施:限制警察获取证词的权力,防止逼、供、信或用刑等增大第二类错误。,第七章 假设检验,STAT,例一调查公司声称2002年某市职工月收入XN(750, 1502 )。现随机抽取100名职工,得其平均月收入为780元。问该声称是否可以接受(=0.05)。H0:=7501、H0为真( =750 ) 样本均值740 接受 样本均值780 “弃真”2、H0为伪
7、( =785 ),720.6 750 779.4,第七章 假设检验,STAT,四、检验类型例据历史资料,某厂以往所生产的汽车轮胎其平均行驶里程为25000公里。现对此进行改进,并从中随机抽取400只,测得平均里程为26300公里,试判断改进后与改进前的轮胎在平均行驶里程上有无显著的差异? (1)改后=改前25000 (2)改后改前25000 H0:=25000 H1: 25000, +,双侧检验:过大过小均拒绝,第七章 假设检验,STAT,例市政府欲购入10万只灯泡,合同规定其使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,现从中随机抽取100只,测得样本均值为960小时,可否
8、认为这批灯泡的平均使用寿命低于1000小时(=0.05) H0:1000 H1: 1000 注:当样本数据 总体数据0时 H1: 5% 注:当样本数据总体数据P0时 H1: P P0,P P0,右单侧检验“怕大不怕小”,第七章 假设检验,STAT,第二节 常用参数的假设检验一、单个总体,的检验1、正态总体且2已知例某厂商声称其新开发的钓鱼线的强度服从正态分布,且平均强度为8kg,标准差为0.5kg。现从中随机抽出50条,测试结果为平均强度为7.85kg,问能否接受厂商的声称?(=0.05)解:H0:=8 H1: 8,-Z/2 0 Z/2,第七章 假设检验,STAT,例某厂商声称其新开发的钓鱼线
9、的强度服从正态分布,且平均强度不超过8kg,标准差为0.5kg。现从中随机抽出50条,测试结果为平均强度为8.1kg,可否认为其平均强度比8kg高?(=0.05)解:H0: 8 H1: 8, x0,第七章 假设检验,STAT,2、正态总体,2未知例某种金属线的抗拉强度XN(10620, 2 ),据说目前有所下降。为此从新生产的产品中任取10根,测得样本均值10600kg,样本标准差为81kg。可否认为其平均抗拉强度比过去下降了?(=0.05)解:H0: 10620 H1: 500,1.645,第七章 假设检验,STAT,二、单个总体,P的检验(一)确定假设1、H0:P=P0 H1: P P0
10、2、H0:PP0 H1: PP03、H0:PP0 H1: PP0(二)检验统计量当n很大(30),且nP和n(1P)两者均大于等于5时,,第七章 假设检验,STAT,例据以往调查,购买某企业产品的顾客中30岁以上的男子占50% 。该企业关心这个比例是否有变,于是随机抽取400名顾客进行调查,结果有210人为30岁以上的男子。该厂希望在0.05的显著性水平下检验这个比例是否有变。解: H0:P=50% H1: P50%,-1.96 1.96,第七章 假设检验,STAT,三、两个总体平均数之差的假设检验(一)确定假设1、H0:12=0 H1: 12 0 2、H0:12 0 H1: 12 03、H0
11、:12 0 H1: 12 0(二)确定检验统计量,正态总体、2未知但相等,第七章 假设检验,STAT,例两种方法生产的产品抗拉强度都近似服从正态分布。方法1的标准差16kg,方法2的标准差28kg。现从方法1和方法2生产的产品中分别抽取容量为12、16的样本,其样本均值分别40kg和34kg。管理部门想知道这两种方法生产出来的产品的平均抗拉强度是否相同(0.05)建立假设:H0:12=0 H1: 12 0,第七章 假设检验,STAT,四、两个总体比率之差的假设检验(一)确定假设1、H0:P1=P2 H1: P1 P2 2、H0:P1P2 H1: P1P23、H0:P1P2 H1: P1P2(二
12、)检验统计量 当n很大(30),且np和n(1p)两者均大于5时,,第七章 假设检验,STAT,例一保险机构称,对于新出台的某一险种,沿海地区的人们的喜爱程度要高于内地的人们。为此进行的一次抽样调查显示:沿海和内地人们的喜爱程度分别为0.65、0.55,样本容量为300、400人。可否认为沿海比内地更喜爱这一险种(0.01)。建立假设:H0:P1 P2 0 H1: P1P2 0,第七章 假设检验,STAT,五、正态分布总体方差的假设检验(一)单个正态总体方差的假设检验1、建立假设:H0:2= 02 2 02 双侧检验 H0:2 02 2 02 右侧检验 H0:2 02 2 02 左侧检验2、构造检验统计量,3、确定决策准则,4、计算统计量的值并决策。,第七章 假设检验,STAT,例某车间生产铜丝,生产一向稳定。今从中随机抽取10根,测得铜丝的折断力均值为575.2,方差为75.73。问:是否仍可相信该车间生产的铜丝的折断力的方差依然是64?(=0.05,且已知铜丝折断力服从正态分布)解:建立假设:H0: 2= 64 H1: 2 64,第七章 假设检验,STAT,例某种保险丝的融化时间服从正态分布。按规定,融化时间的方差不得超过400。今从一批产品中随机抽取25个样品,测得融化时间的方差为410。问在0.05的显著性水平下能否认为这批产品的方差偏大?,