收藏 分享(赏)

第三章 概率分布与抽样分布 中国工业大学.ppt

上传人:无敌 文档编号:1072305 上传时间:2018-06-09 格式:PPT 页数:46 大小:918.52KB
下载 相关 举报
第三章  概率分布与抽样分布 中国工业大学.ppt_第1页
第1页 / 共46页
第三章  概率分布与抽样分布 中国工业大学.ppt_第2页
第2页 / 共46页
第三章  概率分布与抽样分布 中国工业大学.ppt_第3页
第3页 / 共46页
第三章  概率分布与抽样分布 中国工业大学.ppt_第4页
第4页 / 共46页
第三章  概率分布与抽样分布 中国工业大学.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

1、第三章 概率分布与抽样分布(Distribution and Sample Distribution),一、概率与概率分布 (一)概率 通俗地说,概率就是机率。在相同条件下进行n次随机试验,事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为P(A)=m/n。,条件概率:A、B为两个随机事件,P(AB)称为事件B发生的前提下事件A发生的条件概率。P(AB)= ,P(B)0。 由于增加了新的条件(附加信息),一般说来,P(AB)P(A)。,乘法公式: 将条件概率公式变形可得:P(AB

2、)=P(B)P(AB) 将上式中A、B的位置对调,可得:P(AB)=P(A)P(BA) 以上两式统称概率乘法公式。,全概率公式与逆概率公式: 1、完备事件组 若事件A1、A2、An互不相容(互斥),且其中之一必然发生,则事件A1、A2、An组成完备事件组。即 A1A2An=, AiAj=(ij) 2、全概率公式 若事件A1、A2、An为完备事件组,则对任一事件B,有,一、概率与概率分布 (二)概率分布 概率与随机变量密不可分。 随机变量:离散型、连续型。 概率分布:随机变量取一切可能值的概率的规律称为概率分布,即P(x=everyprobnumber)=? 概率分布可以用表、图形或公式等多种方

3、式来表示。,二项分布: 只有两种可能结果的试验称为贝努利试验。n次独立重复的贝努利试验称为n重贝努利试验。在n重贝努利试验中,结果A(成功)出现m次的概率分布为: 其中:,几何分布: 在可列重贝努利试验中,结果A(成功)在第m次首次出现的概率分布为: 二项分布、几何分布都是贝努利试验导出的分布。,超几何分布: 二项分布与几何分布都是在n重或可列重相互独立的贝努利试验中形成的。那么,如果这种试验不是相互独立的呢?比如: 假定有一批500个产品,而其中有5个次品。假定该产品的质量检查采取随机抽取20个产品进行检查。如果抽到的20个产品中含有2个或更多不合格产品,则整个500个产品将会被退回。 这时

4、,人们想知道该批产品被退回的概率是多少。该概率满足超几何分布(hypergeometric distribution)。,这样的抽样一般采取“不放回抽样”,也就是说,每次抽取之后并不放回。在这种情况下,每次抽取之后,总体之中的合格和不合格品的比例都会发生变化,和以前不一样了,因此,每次试验不再是独立的贝努利试验,在n次试验中,结果A(成功)出现m次的概率分布也就不再服从二项分布,而是服从超几何分布: 其中N为产品总数,n为试验次数也即抽取出的产品数;K为产品中结果A的总数也即产品中的总次品数。,一、概率与概率分布 (三)概率密度函数与累积概率分布函数 连续型随机变量不好讲概率分布,所以讲累积概

5、率分布,P(xeveryprobnumber)=? 而其累积概率分布也是无穷的,所以用函数来刻画,引入了概率密度函数(probability density function,pdf)和累积概率分布函数(cumulative distribution function,cdf)。 若X为连续型随机变量,且存在一个非负函数f(x),使得对任意区间(a,b),有 PX(a,b)=PaXb= 则称f(x)为连续型随机变量X的概率密度函数。,在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1x2,P(x1=30的条件,样本均值也近似服从正态分布,即:,同理,对于两个相互独立的正态总体N(1,1

6、2)、N(2,22),假设我们从这两个总体中分别抽取一个n1、n2个观察值组成的样本,那么,这两个样本均值的差也服从正态分布,即: 思考:如果这两个总体不是正态总体而n1、n2足够大,样本均值差的分布形态还是这样的吗?,标准正态分布N(0,1): 标准正态分布的重要性在于,任何一个一般的正态分布都可以化为标准正态分布,即 N(0,1)。 所以,说一个随机变量服从正态分布,与说它服从标准正态分布没什么太大差别,因为它可以转化为标准正态分布。,数据的标准得分: 我年收入60万,多吗? 两个水平类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一

7、样(数据:grade.txt)。一班的平均分和标准差分别为78.53和9.43,二班的均值和标准差分别为70.19和7.00。那么,一班得90分的张颖是不是比二班得82分的刘疏成绩更好呢?怎么比较才更合理呢?,数据的标准化: 虽然均值和标准差不同的数据不好直接比较,但是可以把它们进行标准化,再比较标准化后的数据。 数据标准化的方法主要有两种;数据标准化后得到的值称为标准得分(standard score、z-score):,可以看出,原始数据在各自的均值附近,离散程度也不一样。但它们的标准得分则在0周围,且离散程度也差不多。数据经过标准化后,均变换成均值为0、方差为1的样本。标准化后的数据没有

8、量纲;不同样本观测值的比较只有相对意义,没有绝对意义。,三、 分布 若X1、X2、Xn相互独立,且均服从标准正态分布N(0,1)。则随机变量Y=X12+X22+Xn2的概率分布为自由度为n的 分布,简记为Y (n)。,自由度:变量的自由程度。对于样本方差S2,则:,比如,有些产品出厂时不仅需要标注其性能参数均值,而且要标明均值的方差(标准差)。为了估计某产品能耗的方差,我们随机抽取了10件,测得其能耗为(千瓦时/小时):12.5,12.12,12.01,12.28,12.09,12.03,12.01,12.11,12.06,12.14。 那么,当其能耗x服从正态分布时:,思考: 在上一张片子中

9、,下面的统计量是严格服从卡方分布还是近似服从卡方分布?为什么?,再比如,为研究家庭食品支出与收入的关系,随机抽取了10户家庭作为样本,得到如下数据:那么,当食品支出y服从正态分布时:,下表是工商07级1班、2班某门课的考试成绩。思考: 服从卡方分布吗?如果服从,其自由度是多少?如果不服从,那在什么情况或什么条件下服从?,四、t分布 若随机变量XZ(0,1),Y (n),且X、Y相互独立,则随机变量Z= 服从自由度为n的t分布,简记为Zt(n)。,t分布概率密度曲线图如下: 特点:1、t分布为对称分布;2、n充分大时,t分布近似Z(0,1)。,考察统计量 其中,分子 ,分母中 。因此,Tt(n-

10、1)。,五、F分布 若随机变量X (n1),Y (n2),且X、Y相互独立,则随机变量Z= 服从自由度为(n1,n2)的F分布,简记为ZF(n1,n2)。F分布的概率密度曲线如下:,比如,下表是工商07级1班、2班某门课的考试成绩。假设两个班的学生成绩相互独立且都服从正态分布,那么,要分析两个班学习成绩的分化程度,我们可以考察下面的统计量:,比如,下表是工商07级1班、2班某门课的考试成绩。假设两个班的学生成绩相互独立且都服从正态分布,那么,要分析两个班学习成绩的分化程度,我们可以考察下面的统计量:,六、随机变量X与Y相互独立的充要条件: 1、离散变量:P(X=xi,Y=yi)= P(X=xi

11、)P(Y=yi)(边缘概率分布之积等于联合概率分布) 2、连续变量:f(x,y)=fX(x)fY(y)(边缘概率密度之积等于联合概率密度),R软件中的统计计算:常用分布: norm:正态;t:t分布;f:F分布;chisq:卡方分布;unif:均匀分布;binom:二项分布。每种分布有四个函数: ddensity(密度函数);pprobability(概率分布函数);qquantile(分位数函数);rrandom(随机数函数)。如,对于正态分布来说:dnorm、pnorm、qnorm、rnorm。 pnorm(0,0,1); rnorm(100,0,1); qnorm(0.975,0,1),

12、#画正态分布概率密度曲线(N(0,1),N(0,22),N(0,32) x=seq(-6,6,length=2000)plot(x,dnorm(x,0,1),type=l,lwd=3,xaxs=i,yaxs=i,font=3,ylab=Density of Normal, main=正态分布概率密度曲线(=0),col=red, pch=4) points(x,dnorm(x,0,2),type=l,lwd=3,col=red) #增加N(0,22)概率密度曲线 points(x,dnorm(x,0,3),type=l,lwd=3,col=red) #增加N(0,32)概率密度曲线#以下两句主要是把-1左边的区域加上竖线x1=seq(-6,-1,length=30)points(x1,dnorm(x1,0,1),type=h,lwd=2,col=dark green) #把-1左边区域加上竖线 text(-1,0.01,labels=if Xz(0,1),p(Xtext(locator(1),=1,adj=0);text(locator(1),=2,adj=0);text(locator(1),=3,adj=0) #通过鼠标直接点击给图形加上文字,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报