收藏 分享(赏)

MSA的数学补充修改.ppt

上传人:j35w19 文档编号:4161440 上传时间:2018-12-12 格式:PPT 页数:39 大小:730.50KB
下载 相关 举报
MSA的数学补充修改.ppt_第1页
第1页 / 共39页
MSA的数学补充修改.ppt_第2页
第2页 / 共39页
MSA的数学补充修改.ppt_第3页
第3页 / 共39页
MSA的数学补充修改.ppt_第4页
第4页 / 共39页
MSA的数学补充修改.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、在核心工具中经常直接引用一些统计学的知识,譬如,在SPC中提到了样本容量对过程指数的影响等知识;在MSA中提到了2假设检验(一致性Kappa值评估),事件运算中的逆概公式(Bayes formula), t分布表等概念。由于是直接引用而没有考虑统计学知识之间的联系,往往使学习或应用者感到费解。于是编者编此“统计学知识补充”讲义。力求把这些统计学之间的知识联系起来。,1,统计学知识补充,统计学知识补充,要注意逻辑和连贯 一个章节,应仅或主要参考一本书 思路: P1-15:事件概率 略过:自学:二项分布/讲义:P34-39 N, t 分布:参考一本书 P1-22可以P22-内容如何在正文和补充资料

2、间分配?,2,统计学知识补充 随机事件 和及其概率定理,随机事件和样本空间/ 考虑用图表示,V“在一定条件下可能发生,也可能不发生的事件”称为随机事件, 常用大写A,B,C, 表示。,V 符号专门表示必然事件和不可能事件 一个试验E,如果事先不能准确预言它的结果,并且在相同条件下重复进行,E称为随机试验,简称“试验”. 随机试验的每个可能称为样本(基本事件).全体样本的集合称为样本空间, 用表示, w表示样本。,3,统计学知识补充,概率的初步定义对于一个随机事件A,我们可来以用一个数p来表示它在一次试验中出现的可能性大小我们把这个数称为事件A的概率记为P(A): P(A)=p设一批产品共100

3、件,其中有5件次品。现从中任取50件。 问:无次品的概率是多少?自学P7/和随机变量题比较,4,统计学知识补充,古典概型:定义:样本空间有限,各样本出现机会均等地数学模型 例一 见“ 习题部分” 古典概型的解法可有多种,5,统计学知识补充,概率的加法定理:如图可直观地得到 P(AB)=P(AB bar+A bar +AB) =P(AB bar)+P(A barB) =P(AB) 当A.B=V例:甲,乙同时向敌机炮击,击中概率甲为0.6,乙为0.5, 求敌机被击中的概率。自学P49,6,统计学知识补充,条件概率和概率乘法定理 前例: 如果已知第一个人抽得球票,该事件记为A, 问第二个人抽得球票的

4、概率多大? 解: 在A发生下,B发生概率 因只剩9张票中1张球要 P(BA)=1/9,7,统计学知识补充,条件概率和概率乘法定理A, B两个事件,P(A)0,则称在A发生的前提下B发生的概率为B在假设A下的条件概率: 记作P(BA) 概率乘法公式: P(AB)=P(A)P(BA),8,统计学知识补充,全概率公式 我们已知前例 P(B)=2/10 B=AbarB+A B P(B)=P(A bar B +AB) =P(AbarB)+P(AB) =P(A)P(BA bar)+P(A bar) P(BA bar) =2/10*1/9+8/10*2/9=2/10 P(B)=P(Ai) P(BAi) =P

5、(A)P(BA)+P(A) P(BA) =2/10*1/9+8/10*2/9=2/10,全概公式的思想是当求P(B)有困难时,可观察其发生的原因 如图原因有两个: AB和 AbarB ,求出P(AbarB)和P(A B),然后相加.,9,统计学知识补充,10,统计学知识补充,逆概公式:(Bayes 公式):与全概率公式的“由因导果” 相反, 它是“执果导因”求: P(AjB)P(AjB) = _P(Aj)P(BAj)_ P(Ai)P(BAi),11,统计学知识补充,假定用血清甲胎蛋白的方法诊断肝癌:令:C=“被检验者患有肝癌”A=“判断被检验者患有肝癌”设在人群中:P( C)=0.0004;又

6、设用该法诊断时:P(AC)=0.95P(AC)=0.90 现在若有一个人被诊断为患有肝癌,求:此人真的患有肝癌的概率P(CA),12,统计学知识补充,13,统计学知识补充 随机变量及其分布,随机变量 令试验的每一个可能的结果(样本点)w唯一地对应与一个实数(w),则称(w)为随机变量随机变量是样本点的函数 设一批产品共100件,其中有5件次品。现从中任取50件。 问:取到的次品件数是多少? 讲义P40/和概论题比较离散型随机变量 连续型随机变量,14,15,统计学知识补充,随机变量的两个参数 均值:用来表示分布的中心位置,通常用E(X)或来表示.样本均值:x=(xi)/n样本均值处于样本的中间

7、位置,它可以反映总体分布的均值, 是E(X)或的无偏点估计。 方差:用来表示分布的散布大小,通常用D(X)或2来表示,方差大意味着分布较宽较分散,方差小意味着分布窄较集中。样本方差:s2=(xi-x)2/(n-1)是2无偏点估计。样本标准差:s,统计学知识补充,分布函数 设是一个随机变量,x是一个任意实数(x+ ), 那么“x”是一个事件,它的概率P(x)是的x函数,我们记作Ft(x): Ft(x)=P(x)由分布函数的定义,知道了Ft(x),就知道了落在区间(,x的概率而且, Ft(x) P( x)=p(t)dt, (这里p(t)是概率密度函数,16,17,统计学知识补充,正态分布 N (

8、,2)其中是正态分布的中心,质量特性X在附近取值的机会最大,2是正态分布的方差,越大,分布越分散,越小,分布越集中N (0,1)为标准正态分布标准正态分布的特殊地位,它的概率密度用符号,分布函数符号表示:,由于正态分布对称: (-x)= (x) 可以证明 (-x)=1- (x) 例:设 N (0,1),求PI I3 解: PI I3=P(-3 3)= (3)- (-3)=2 (3)- 1=1.9973-1=0.9973 这个数字重要,应该记住!,正态概率的分布,18,19,统计学知识补充 正态分布,正态分布的标准化变换 可改写设XN (,2), 则U=(X- )/N(0,1)即:任一正态变量经

9、过标准化变换 (X- )/后都可归一到标准正态分布如: XN (10 ,22),通过标准变换U= (X- 10)/2 N(0,1),统计学知识补充 中心极限定理和 t分布/加强,中心极限定理的一般描述:某一个随机变量,只要是由大量的互相独立的因数综合影响而成,其中每个因数在总的影响下作用很小,那么这种随机变量近似地服从正态分布。 设X,X, X, X,为独立同分布的随机变量列,而且其期望E(X1)和方差(D(X1) 存在, 则limPaSn-n E(X1) / b =(待续) 这表明只要n充分大,随机变量 -E(x)/Squ. D(x)/n服从正态分布。 我们的n还不充分大,就用S2取代D(x

10、),然后把它的分布列成表格,这就是t分布。,20,21,统计学知识补充 中心极限定理和 t分布,t分布: 正态样本均值X的标准化变换中用样本标准差s代替总体标准差后的分布是自由度为n-1的t分布,记为t(n-1),即n(X- )/st(n-1) t分位数P(tta)=a,记为a的分位数为tata=-t1-a t分布的查表练习n=10 a取0.05 查表t1-a/2(n-1) 当s趋向,s= ; t分布就正态分布,22,统计学知识补充 统计估计,参数估计:点估计、区间估计 点估计用样本均值Xbar去估计总体均值用样本方差S2去估计总体方差2正态标准差的无偏估计有两个:R=R/d2 ; SPC中(

11、X-R)图S=S/c4 SPC中(X-S) 图,23,统计学知识补充,区间估计(针对MSA中偏移的估计)( 对于参数x,如果估计x落在x1和x2之间的概率为1-a,即:P (x1xx2)=1-a,则称随机区间 x1,x2是x的置信水平为1-a的置信区间)可删节?,为未知情形下,的置信区间,若 是未知参数,则以 的无偏估计 代替 ,这时由于枢轴变量 (7-15)所以对给定的置信度 ,存在 使(7-16)这里 的是自由度为n-1的t分布的 -上侧分位数,它的值可查附表4求得,将(7-15)中的T代入(7-16)可得,因此有 (7-17) 所以的置信度为 的置信区间是(7-18) 其长度为 需要说明

12、的是:置信区间公式中的 , ,在实际问题中都是具体观测值,计算时应是 ,26,统计学知识补充,我们用有限样本对偏移置信区间进行统计推断,用的就是这方法。,27,统计学知识补充 假设检验,其基本思想是根据所获样本,运用统计分析方法,对总体X的某种假设H0 作出接受或拒绝的判断。具体方法(针对MSA中93页的线形案例) 1,建立原假设 H0:0H1: 0 2,选择检验统计量,给出拒绝的形式 3,给出显著性水平a,常取a=0.05 4,定出临界值c,写出拒绝域W 5,判断,统计学知识补充,我们在生产中,有时会遇到以下类似的问题 例:某厂有一批产品,200件,按规定,次品率不得超过1%,今在其中任抽5

13、件,发现有次品,问这批产品能出厂吗? + 内容 假设检验的方法,能解决上述问题 它的基本思想是: 用反证法 首先假设,例 P 0.01,成立 而看由此会发生什么后果,如果 导致不合格现象出现 则假设不成立,否则,不能拒绝这个假设,28,统计学知识补充,应该指出这里的反证法不是纯数的反证法而是基于在实践中广泛采用的原则:“小概率事件(几乎不可能的事件)在一次观察中基本不会发生”MSA 中对线性的研究,用的就是这方法,29,30,统计学知识补充 假设检验/要简化,明确,正态总体均值的假设检验 已知时,用u检验 未知时,用t 检验 非参数时,用2检验,统计学知识补充 假设检验,非参数的统计推断和一致

14、性假设检验,即Kappa 检验 (结合讨论 2检验)。建立2行2列表(22 contingency table):计算理论数(TRC),计算公式为:TRC=nR.nc/n 公式 式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。结果就产生MSA中第128页的四个数:15.7R1C1, 34.3R1C2, 31.3R2C1,68.7R2C2.,31,统计学知识补充 假设检验,计算kappa: o:P observed(判断一致性比率,即不同作业员之间、同作业员不同次数之间)= (Pass Pass+Fail Fail)/总的检验次数 Pc:

15、P chance (预期偶然达成一致的比率) =(Pass Pass +Fail Pass)*(Pass Pass +Pass Fail/总检验次数之平方+(Pass Fail +Fail Fail)*(Fail Pass +Fail Fail)/总的检验次数之方 kappa= (P observed-P chance) / (1-P chance),32,统计学知识补充 回归分析,经验公式和最小二乘法 在计算MSA的线性时,用到了一元回归分析 它的思想是: 当我观察散点图上的散点很接近一条直线时 我们就根据经验公式估计: =a+bx我们用数量:Y t -( a+ b t )2 刻划( X t

16、 ,Y t )到直线L远距离,L线(Xn, Yn)(X5,Y5)(X3,Y3)(X1,Y1) (X4,Y4)图 (X2,Y2),33,统计学知识补充 回归分析,令Q( a, b)= Y-(a t+ b t)2 使Q( a, b)最小:最小=乘原则解得a=y-b xb=.,34,统计学知识补充 回归分析,平方和分解公式与线性相关关系 经验公式 Y=a+bX 即使是非线性关系也能求得,所以要作线性相关判别 方法:求U:回归平方和(线性影响)Q:残差平方和(非线性影响)比较U和Q选取量 F=U/Q/(n-2),35,统计学知识补充 回归分析(计算复杂,略去),预报与控制(在MSA中,被用来估计线性的

17、置信区间,在SPC 附录A中被用来估计样本量对指数的影响):当经验公式Y=a+bX 计算出以后,我们可以通过数据(x1,y1), (x2,y2), (xn,yn) 来预报 Yhat=a+bX+ 的范围。也就是Yhat的置信区间。 该区间为: Yhat s, Yhat+ s 求S:见MSA第93页;求:按MSA线性中的例子,样本量较大(n=60), n-2的t 分布接近N(0,1)(中心极限定理)。所以我们可以直接查标准正态分布表:0.05, =1.96. 这里S是关键, S越小,置信区间越窄,预报越准确。,36,习题部分,概 率题例: 10个人抽两张球票,(既10个签,8个写“无”,2个写 “

18、有”),一个一个依次抽取, 求第k (k=1,2,.10)个人抽得球票概率 古典概型题例: 盒中装有五个球(三个白球,两个黑球),从中任取一个。问:取到白球的概率是多少? 条件概 率题例: 盒中装有五个球(三个白球,两个黑球),每次从中任取一个,无放回地取两次, 求:第一次取到白球的概率;第二次取到白球的概率;第一次取到白球的条件下第二次取到白球的概率?,37,习题部分,独立性题例:自P25 盒中装有五个球(三个白球,两个黑球),每次从中任取一个,有放回地取两次。全概 公式题例: 盒中装有五个球(三个白球,两个黑球),每次从中任取一个,无放回地取两次, 求:第二次取到白球的概率,38,习题部分,逆概 公式题例:自讲义P34题2 盒中有12个乒乓球,9个新的,第一次比赛时取3个,比赛后放回盒中。第二次比赛时再从盒中取3个。 求第二次 从盒中取到新球的概率。 又,已知第二次 从盒中取到的都是新球,求第一次 从盒中取到的都是新球的概率?,39,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报