收藏 分享(赏)

概率论与数理统计chap3参数检验.ppt

上传人:eco 文档编号:6292997 上传时间:2019-04-04 格式:PPT 页数:96 大小:2.92MB
下载 相关 举报
概率论与数理统计chap3参数检验.ppt_第1页
第1页 / 共96页
概率论与数理统计chap3参数检验.ppt_第2页
第2页 / 共96页
概率论与数理统计chap3参数检验.ppt_第3页
第3页 / 共96页
概率论与数理统计chap3参数检验.ppt_第4页
第4页 / 共96页
概率论与数理统计chap3参数检验.ppt_第5页
第5页 / 共96页
点击查看更多>>
资源描述

1、应用数理统计,制药公司开发研制新的药物时,药物筛选成为需面临的一个极其重要的决策问题 统计学是对药物筛选技术做出了巨大贡献的学科之一。药物筛选过程中有两种可能的行为 “拒绝”开发的新药,这意味着所检验的药物无效或只有微弱的效果。此时采取的行动就是将该药物废弃 暂时”接受”开发的新药,此时需要采取的行动是对该药物进行进一步的细致试验 根据两种可能出现的研究结果,人们提出了如下相应的假设形式 H0:新药对治疗某种特定疾病无效(或效果微弱) H1:新药对治疗某种特定疾病有效,第三章 假设检验,第1节 假设检验的基本概念,例1. 某产品规定次品率不超过4%才能出厂。今从1000件产品中抽查10件,发现

2、有3件次品,问该批产品能否出厂?又若仅发现1件次品,该批产品能否出厂?,例2. 某地旅游者的消费额附从正态分布XN(,2), 调查25个旅游者,得出一组样本观测值x1,x2,x25,若有专家认为消费额的期望值为0,如何由这组观测值验证这个说法?,例3.用精确方法测量某化工厂排放的气体中有害气体的含量服从正态分布XN(23,22),现用一简便方法测量6次得一组数据23,21,19,24,18,18(单位:十万分之一),问用简便方法测得的有害气体含量是否有系统偏差?,这种利用样本检验统计假设真伪的过程叫做统计检验(假设检验),例4.从同类产品中,任取n = 200 批,质检结果如下表,其中xi表示

3、各批产品中次品数,ni表示有xi件次品的批数,试问次品件数X 服从泊松分布。,众所周知,总体 的全部信息可以通过其分布函数 反映出来,但实际上,参数 往往未知,有时甚至 的表达式也未知.因此需要根据实际问题的需要,对总体参数或分布函数的表达式做出某种假设(称为统计假设),再利用从总体中获得的样本信息来对所作假设的真伪做出判断或进行检验.,1.什么是假设? (hypothesis), 对总体参数的具体数值或分布所作的陈述 总体参数包括总体均值、方差等,我认为这种新药的疗效比原有的药物更有效!,次品率不超过1%,消费额的期望值为0,用简便方法测得的有害气体含量是否有系统偏差,次品件数X 服从泊松分

4、布,基本思想:先对要检验的对象作出假设,然后利用样本信息,依据小概率原理判断假设是否成立,作出拒绝或接受假设的过程: 如抽样结果是小概率事件,就拒绝假设;如抽样结果不是小概率事件,就接受假设。, 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理,原假设 (null hypothesis),研究者想收集证据予以反对的假设 又称“0假设” 总是有符号 , 或 4. 表示为 H0 H0 : = 某一数值 指定为符号 =, 或 例如, H0 : 10cm,研究者想收集证据予以支持的假设 也称“研究假设” 总是有符号 , 或 表示为 H1 H1 : 某一数值,或 某一数值 例如, H1 :

5、 10cm,或 10cm,备择假设 (alternative hypothesis),【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设,提出假设 (例题分析),解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0 : 10cm H1 : 10cm,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g。从消费者的利益出发,有关研究人员

6、要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为H0 : 500 H1 : 500,【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为H0 : 30% H1 : 30%,原假设和备择假设是一个完

7、备事件组,而且相互对立:在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设 (结论与建议),备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验 (假设的形式),以总体均值的检验为例,假设检验中的两类错误,1. 第类错误(弃真错误) 原假设为正确时拒绝原假设 第类错误的概率记为 被称为显著

8、性水平 2. 第类错误(取伪错误) 原假设为错误时未拒绝原假设 第类错误的概率记为(Beta),H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程, 错误和 错误的关系,你要同时减少两类错误的惟一办法是增加样本容量!,和 的关系就像翘翘板,小 就大, 大 就小,两类错误的控制,一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些 一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯

9、第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率,某厂生产的螺钉,按标准强度为68/mm2, 而实际生产的强度X 服N(,3.62 ).若E(X)=68则认为这批螺钉符合要求,否则认为不符合要求.为此提出如下假设:,必须在原假设与备择假设之间作一选择,若原假设正确, 则,可以确定一个常数c 使得,因此,取 ,则,现从整批螺钉中取容量为36的子样,其均值为 ,问原假设是否正确?,由,为检验的非拒绝域 (实际上没理由拒绝),即区间( ,66.824 ) 与 ( 69.18 , + ),H 0: = 68,为检验的拒绝域,或临界域,P(拒绝H0|H0为真),若H

10、0为真, 则,所以,拒绝 H0 的概率为,例中,犯第一类错误的概率,H0不真,即 68,可能小于68,也可能大于 68, 的大小取决于 的真值的大小.,下面计算犯第二类错误的概率 ,设, =P(非拒绝H0|H0不真),若,取伪的概率较大.,H0 真,H0 不真,仍取=0.05,则,( , 67.118 ) 与 ( 68.882 , + ),因此,非拒绝域为(67.118, 68.882),现增大子样容量,取n = 64, = 66,则,当子样容量确定后,犯两类错误的,命题,概率不可能同时减少.,此时犯第二类错误的概率为,证 设 在水平 给定下,检验假设,又,由此可见,当 n 固定时,1) 若,

11、2) 若,证毕.,注,从而,当 时,影响 错误的因素,1. 总体参数的真值 随着假设的总体参数的减少而增大 2. 显著性水平 - 当 减少时增大 3. 总体标准差 - 当 增大时增大 4. 样本容量 n 当 n 减少时增大,我们可以在事先确定用于拒绝原假设H0的证据必须强到何种程度。这等于说我们要求多小的P值。而这个P值就叫显著性水平,用表示 显著性水平表示总体中某一类数据出现的经常程度 假如我们选择=0.05,样本数据能拒绝原假设的证据要强到:当H0正确时,这种样本结果发生的频率不超过5%;如果我们选择=0.01,就是要求拒绝H0的证据要更强,这种样本结果发生的频率只有1% 如果P值小于或等

12、于 ,我们称该组数据不利于原假设的证据有的显著性水平,显著性水平 (significant level),根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量 对样本估计量的标准化结果 原假设H0为真 点估计量的抽样分布,检验统计量 (test statistic),标准化的检验统计量,显著性水平和拒绝域 (双侧检验 ),显著性水平和拒绝域 (双侧检验 ),显著性水平和拒绝域 (双侧检验 ),显著性水平和拒绝域 (双侧检验 ),显著性水平和拒绝域 (单侧检验 ),显著性水平和拒绝域 (左侧检验 ),显著性水平和拒绝域 (左侧检验 ),显著性水平和拒绝域 (右侧检验 ),

13、显著性水平和拒绝域 (右侧检验 ),决策规则,给定显著性水平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 作出决策 双侧检验:I统计量I 临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H0,什么是P 值? (P-value),以美国联邦贸易委员会定期设计调查大瓶Hilltop咖啡为例,根据规定,大瓶Hilltop咖啡的标签上表明其重量至少为3磅以上,这样假设检验的拒绝域在下侧;从而p-值为观测到的样本结果小于等于实测结果的概率。通常称p-值为实测显著性水平。对Hilltop咖啡问题,选择如下形式的原假设和备择假设H0:3 H1:3,什么是P 值?

14、(P-value),总体标准差=0.18时,检验统计量为 :,由n=36听咖啡所组成一个简单随机样本中,其样本均值2.92磅,计算检验统计量的值为:,p-值应用示意图,什么是P 值? (P-value),如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率 P值告诉我们:如果原假设是正确的话,我们得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设 被称为观察到的(或实测的)显著性水平 决策规则:若p值, 拒绝 H0,双侧检验的P 值,左侧检验的P 值,右侧检验的P 值,原假设的可信度有多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小

15、的P值)才能说服他们 拒绝的结论是什么?如果拒绝H0而肯定H1 ,就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本),多大的P 值合适?,显著性检验的目的是要描述样本所提供不利于原假设的证据有多强。P值就在做这件事。但是,要证明原假设不正确,P值要多小,才能令人信服呢?这要根据两种情况来确定,拒绝H0,P 值决策与统计量的比较,拒绝H0的两个统计量的不同显著性,Z,拒绝H0,0,统计量1,P1 值,统计量2,P2 值,拒绝H0,临界值,样本容量对检验结果的影响,投掷硬币1000次、40

16、40次和10000次时出现正面样本比例的抽样分布,0.5,0.507,这个结果出乎预料吗?,假设检验结论的表述 (“接受”与“不拒绝”),假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的 当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意味着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确 “接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但事实上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确,假设检验步骤的总结,

17、陈述原假设和备择假设 从所研究的总体中抽出一个随机样本 确定一个适当的检验统计量,并利用样本数据算出其具体数值 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域 将统计量的值与临界值进行比较,作出决策 统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P值作出决策,Neyman-Pearson范式中的术语,第I类错误(Type I Error),H0为真的时候拒绝H0 检验的显著性水平(significance level),第I类错误的概率,通常记为 第II类错误(Type Error),H0为假的时候接受H0,其概率记为 检验的功效(power), H0为假的时候拒绝H0

18、,其概率记为 检验统计量(test statistics) 拒绝域(rejection region)和接受域(acceptance region) 原分布(null distribution),在原假设为真的条件检验统计量所服从的分布,例3分析 用简便方法测得有害气体含量XN(,22),基本检验H0: =0=23,备择检验H1: 0= 23;,若H0成立,则,若取=0.05,则,P|U|u/2=,: P|U|1.96=0.05,在假设成立的条件下,|U|1.96为概率很小事件,一般认为:小概率事件在一次实验中是不会发生的,将样本观测值代入U得,|U|1.96,小概率事件在一次实验中发生了,故

19、假设不合情理,即:否定原假设,简便方法测得均值有系统偏差.,注 检验准则,则拒绝H0,则接受H0.,注意:否定域的大小,依赖于显著性水平的取值, 一般说来,显著性水平越高,即越小,否定域也越小,这时原假设就越难否定,第2节 正态总体参数的假设检验,对于给定的,检验水平,由标准正态分布分位数定义知,,因此,检验的拒绝域为,其中,为统计量U的观测值。,例1 某切割机在正常工作时, 切割每段金属棒的平均长度为10.5cm, 标准差是0.15cm, 今从一批产品中随机的抽取15段进行测量, 其结果如下:,假定切割的长度X服从正态分布, 且标准差没有变化, 试问该机工作是否正常?,解,查表得,根据定理知

20、,由t分布分位数的定义知,在实际中, 正态总体的方差常为未知, 所以我们常用 t 检验法来检验关于正态总体均值的检验问题.,上述利用 t 统计量得出的检验法称为t 检验法.,如果在例1中只假定切割的长度服从正态分布, 问该机切割的金属棒的平均长度有无显著变化?,解,查表得,例2,要检验假设:,指它们的和集,拒绝域为:,解,例3 某厂生产的某种型号的电池, 其寿命长期以来服从方差 =5000 (小时2) 的正态分布, 现有一批这种电池, 从它生产情况来看, 寿命的波动性有所变化. 现随机的取26只电池, 测出其寿命的样本方差 =9200(小时2). 问根据这一数据能否推断这批电池的寿命的波动性较

21、以往的有显著的变化?,拒绝域为:,可认为这批电池的寿命的波动性较以往的有显著的变化.,第3节 两个正态总体参数的假设检验,1.已知方差时两正态总体均值的检验,需要检验假设:,上述假设可等价的变为,利用u检验法检验.,故拒绝域为,由标准正态分布分位数的定义知,2.未知方差时两正态总体均值的检验,利用t 检验法检验具有相同方差的两正态总体均值差的假设.,引入统计量,对给定的,故拒绝域为,解,即甲、乙两台机床加工的产品直径无显著差异.,需要检验假设:,3.两正态总体方差的检验,为了计算方便, 习惯上取,检验问题的拒绝域为,上述检验法称为F检验法.,解,某砖厂制成两批机制红砖, 抽样检查测量砖的抗折强度(公斤), 得到结果如下:,已知砖的抗折强度服从正态分布, 试检验:,(1)两批红砖的抗折强度的方差是否有显著差异? (2)两批红砖的抗折强度的数学期望是否有显著差异?,(1) 检验假设:,例3,拒绝域为,(2) 检验假设:,拒绝域为,四、小结,本节学习的正态总体均值的假设检验有:,正态总体均值、方差的检验法见下表,附表,附表,3,2,1,附表,5,6,7,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报