收藏 分享(赏)

数理统计CH2_抽样分布_2.1.ppt

上传人:11xg27ws 文档编号:9398116 上传时间:2019-08-05 格式:PPT 页数:64 大小:669KB
下载 相关 举报
数理统计CH2_抽样分布_2.1.ppt_第1页
第1页 / 共64页
数理统计CH2_抽样分布_2.1.ppt_第2页
第2页 / 共64页
数理统计CH2_抽样分布_2.1.ppt_第3页
第3页 / 共64页
数理统计CH2_抽样分布_2.1.ppt_第4页
第4页 / 共64页
数理统计CH2_抽样分布_2.1.ppt_第5页
第5页 / 共64页
点击查看更多>>
资源描述

1、2019/8/5,王玉顺:数理统计02_抽样分布,1,第2章 抽样分布 Sample Distribution,2019/8/5,王玉顺:数理统计02_抽样分布,2,使用随机变量X,首先要弄清它的概率分布 而实际上往往对X的概率分布一无所知,或者只知分布类型却不知分布参数 探明概率分布的唯一方法是相同条件下对X做n次独立重复试验,获得一个称作样本的试验结果序列X1,X1,Xn;样本分量的某种组合(函数)称作统计量;统计量的分布函数和概率密度称作抽样分布。,引言(Foreword),2 抽样分布,2019/8/5,王玉顺:数理统计02_抽样分布,3,本章内容,2 抽样分布,2.1 总体与样本 2

2、.2 抽样分布 2.3 统计量分位数 2.4 抽样分布定理 2.5 中心极限定理,2019/8/5,王玉顺:数理统计02_抽样分布,4,随机试验(Random Experiment),复习两个概念,2 抽样分布,满足下述三个条件的试验称为随机试验: (1)试验可在相同条件下重复进行; (2)试验的所有可能结果是明确可知的,并且不止一个; (3)每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。随机试验在统计学里可简称为试验。,2019/8/5,王玉顺:数理统计02_抽样分布,5,随机试验的所有可能结果所组成的集合称为样本空间,样本空间里的元素,即 随机试验的每一

3、个结果,称为样本点。 (sample point),样本空间(Sample Space),复习两个概念,2 抽样分布,2019/8/5,王玉顺:数理统计02_抽样分布,6,2.1 总体和样本 Population and Sample,2 抽样分布,2019/8/5,王玉顺:数理统计02_抽样分布,7,2.1 总体和样本,研究对象的全部或集合(对象整体) 随机试验所有可能结果的集合(样本空间) 随机变量X的所有可能观察值(数值集合) 总体亦称作母体 总体可划分为有限和无限两大类,有限总体可扩展为无限总体,(1)总体(Population),2019/8/5,王玉顺:数理统计02_抽样分布,8,

4、理解下面的总体: 研究中国的电视机寿命:中国的全部电视机产品或其寿命观察值的集合; 研究山西农业大学大学生的数学水平:山西农业大学的全部学生或其数学成绩的集合; 研究山西农业大学班级的运动成绩:山西农业大学的全部学生班或其运动成绩的集合。,2.1 总体和样本,(1)总体(Population),总体的构成元素和疆域由问题界定,2019/8/5,王玉顺:数理统计02_抽样分布,9,2.1 总体和样本,由于随机变量X代表所有可能的观察值,即它代表所研究问题的总体,故常称总体X 今后,所研究问题的总体常用随机变量X来指代,即采用下面的陈述:,(1)总体(Population),2019/8/5,王玉

5、顺:数理统计02_抽样分布,10,2.1 总体和样本,构成研究对象整体的一个分割单位(单位) 随机试验的一个可能结果(样本点) 随机变量X的一个可能观察值(变量值) 个体有数值型和非数值型两种,(2)个体(Individual, Unit),总体和个体是彼此对立的两个概念,2019/8/5,王玉顺:数理统计02_抽样分布,11,理解下面的个体: 一台电视机或一台电视机的寿命观测 一个学生或一个学生的数学成绩 一个学生班或一个学生班的运动成绩,2.1 总体和样本,(2)个体(Individual, Unit),个体的大小和疆域由问题界定,2019/8/5,王玉顺:数理统计02_抽样分布,12,2

6、.1 总体和样本,(3)抽样(Sampling),从总体中选取或抽取若干个个体称作抽样。总体中每个个体被抽到的概率都一样,称作机会均等。按机会均等原则选取若干个个体的行为或过程,称作随机抽样(sampling )。,2019/8/5,王玉顺:数理统计02_抽样分布,13,2.1 总体和样本,对总体X实施n次随机抽样,可视作对1个随机变量X做n次独立重复试验。 试验序号做下标,随机变量X的n次试验或抽样记作X1,X2,Xn或(X1,X2,Xn),即随机变量系或随机向量,称该随机变量系或随机向量为样本(sample),称n为样本容量(sample size)。,(4)样本(Sample),样本是总

7、体的一个子集,样本是n次抽样n个随机变量的合称,2019/8/5,王玉顺:数理统计02_抽样分布,14,2.1 总体和样本,试验或抽样后,获得随机变量系X1,X2,Xn的一组试验结果,或随机变量X的n次试验结果,它们就合称为样本观察值(observation); 样本观察值记作实数向量 (x1,x2,xn) 或一组实数x1,x2,xn; 注意:样本是随机变量系或随机向量,每个分量都是随机变量;样本观察值是实数向量,每个分量都是实数数值。,(5)样本观察值(Observation),样本观察值是样本的一次实现,2019/8/5,王玉顺:数理统计02_抽样分布,15,2.1 总体和样本,样本X1,

8、X2,Xn被视作对随机变量X实施n次重复独立的随机试验; n次重复独立随机试验的可能样本观察值不止一组,每次试验恰好出现所有可能观察值的一组,但试验前并不知道会出现哪一组; 样本和样本观察值常不加区分统称为样本,(6)从随机试验角度看样本,注意样本的随机性,2019/8/5,王玉顺:数理统计02_抽样分布,16,2.1 总体和样本,满足下面三个条件称作简单随机样本: 对总体X的抽样是随机抽样(等概抽样); 样本X1,X2,Xn各个分量彼此相互独立,即每次抽样的事件概率与以往抽样无关; 样本 X1,X2,Xn各个分量的分布相同。对一个总体的重复抽样自然满足同分布。,等概、独立、同分布抽样获得简单

9、随机样本 以后不加特别声明“样本”指简单随机样本,(7)简单随机样本(Simple RandomSample),2019/8/5,王玉顺:数理统计02_抽样分布,17,2.1 总体和样本,若样本X1,X2,Xn的函数Y=f(X1,X2,Xn )不含任何未知参数,则称Y为统计量。 统计量有三个特征: 统计量仍是随机变量; 统计量不含任何未知参数; 统计量有相应的概率分布(称作抽样分布),统计量是样本各个分量的某种组合,(8)统计量(Statistic),2019/8/5,王玉顺:数理统计02_抽样分布,18,2.1 总体和样本,若未知但已知,试判断右方所示的样本函数是否是统计量?,(8)统计量(

10、Statistic),2019/8/5,王玉顺:数理统计02_抽样分布,19,2.1 总体和样本,几个常用的统计量:,(8)统计量(Statistic),2019/8/5,王玉顺:数理统计02_抽样分布,20,总体、样本和统计量构成统计学最基本的概念和关系; 统计量是样本的函数; 统计量也是随机变量,引入这个术语只不过是特别强调它产生的过程,总体-样本-统计量。因此,统计量也有概率分布,特别地称作抽样分布。,2.1 总体和样本,(9)小结(Summary),2019/8/5,王玉顺:数理统计02_抽样分布,21,2.2 抽样分布 Sample Distribution,统计量的概率分布称作抽样

11、分布,2 抽样分布,2019/8/5,王玉顺:数理统计02_抽样分布,22,许多研究问题可归结为对随机变量X的观测。X是研究对象,表示全部可能的试验结果,称其为总体X(population),X的分布称作总体分布。从总体X中随机地抽取若干个个体(unit)称作抽样(sampling),抽取的n个个体X1,X2,Xn称作样本(sample),构建样本的某种函数即统计量(statistic),统计量的分布称作抽样分布(sample distribution)。统计量可用于推断总体的统计规律及特征。,2.2 抽样分布,为什么研究抽样分布?,样本是总体的近似或代表,2019/8/5,王玉顺:数理统计0

12、2_抽样分布,23,2.2 抽样分布,对正态总体抽样获得容量为n的样本,由样本构造Z、2、T、和F四种统计量,分别服从Z、2、T和F四种分布,称作数理统计学的四大概率分布或抽样分布。 对于正态总体抽样获得的样本统计量,可由四大分布构造出精确的小样本统计方法;所谓小样本统计方法,是指样本容量n无论多小也能精确计算抽样观测事件的概率;,为什么研究抽样分布?,正态总体抽样的四大分布,2019/8/5,王玉顺:数理统计02_抽样分布,24,2.2 抽样分布,对于非正态总体抽样获得的样本统计量,当n充分大时,某些统计量的分布趋近正态分布(极限分布为正态分布),可由四大分布构造出近似的大样本统计方法。所谓

13、大样本统计方法,是指样本容量n需要足够大,由正态总体抽样的四大分布近似计算抽样观测事件的概率;,为什么研究抽样分布?,正态总体抽样的四大分布,2019/8/5,王玉顺:数理统计02_抽样分布,25,2.2.1 分布 Chi-Square Distribution,2.2 抽样分布,2019/8/5,王玉顺:数理统计02_抽样分布,26,为检验实际分布与理论分布的吻合程度,即拟合优度检验(goodness-of-fit test),英国统计学家Karl Pearson(卡尔皮尔逊)于1899年提出一个新统计量(Pearsons Chi-Square Statistic),从而创立了卡方分布(Ch

14、i-square distribution); 卡方分布衍生自正态分布; 由卡方分布创建了许多重要的统计方法,如适合性检验、方差检验、列联表分析等。,(1)2分布简史,2.2.1 分布,2019/8/5,王玉顺:数理统计02_抽样分布,27,(2) 统计量,2.2.1 分布,设样本X1,X2,Xn来自正态总体N(,2),即各个样本分量独立同分布且是正态分布,则它们标准化随机变量的平方和,服从自由度df=n的卡方分布(Chi-square distribution),记作,2019/8/5,王玉顺:数理统计02_抽样分布,28,若统计量的表达式仅含有df个独立随机变量,亦即该统计量是df个独立随

15、机变量的函数,则该统计量的“自由度”为df; 确定统计量自由度的方法是:若统计量表达式不仅包含n个独立的随机变量,还包含由该n个独立随机变量所构成的k个样本统计量,则统计量的自由度df=n-k。,(3) 统计量的自由度,2.2.1 分布,2019/8/5,王玉顺:数理统计02_抽样分布,29,2.2.1 分布,(4) 统计量的概率密度,统计量的概率密度是观测x和自由度n的函数,2019/8/5,王玉顺:数理统计02_抽样分布,30,2.2.1 分布,(4) 统计量的概率密度,其中,卡方分布概率密度中的函数具有下面的取值规律:,2019/8/5,王玉顺:数理统计02_抽样分布,31,2.2.1

16、分布,(4) 统计量的概率密度,正态概率积分,2019/8/5,王玉顺:数理统计02_抽样分布,32,2.2.1 分布,(4) 统计量的概率密度,2分布是一种左倾的偏态分布,自由度n是它的唯一分布参数; n愈小2观察值愈集中于左侧,峰值升高而右尾收缩变细; n愈大2观察值愈向右分散,峰值降低而右尾扩伸变粗;概率密度曲线愈来愈对称。,2019/8/5,王玉顺:数理统计02_抽样分布,33,2.2.1 分布,(5) 统计量概率密度的证明,引用浙大概率统计教材P63例3所证明的标准正态随机变量平方Y=Z2的分布:,引用分布定义:,2019/8/5,王玉顺:数理统计02_抽样分布,34,2.2.1 分

17、布,(5) 统计量概率密度的证明,比较分布可知,Z2服从(1/2,1/2):,2019/8/5,王玉顺:数理统计02_抽样分布,35,2.2.1 分布,(5) 统计量概率密度的证明,引用教材P97-P99例3所证明的分布可加性,2019/8/5,王玉顺:数理统计02_抽样分布,36,2.2.1 分布,(6) 分布的性质,期望和方差:,2019/8/5,王玉顺:数理统计02_抽样分布,37,2.2.1 分布,(6) 分布的性质,设ZN(0,1),则概率密度为,2019/8/5,王玉顺:数理统计02_抽样分布,38,2.2.1 分布,(6) 分布的性质,设ZN(0,1),则概率密度为,2019/8

18、/5,王玉顺:数理统计02_抽样分布,39,2.2.1 分布,(6) 分布的性质,卡方分布可加性:利用分布可加性可简便地推证,两独立卡方统计量之和服从自由度相加的卡方分布:,2019/8/5,王玉顺:数理统计02_抽样分布,40,2.2.1 分布,(6) 分布的性质,大数定律:当n+时,2(n)分布趋于均值等于n 、方差等于2n的正态分布;概率密度曲线愈来愈对称; 应用:只要自由度n足够大, 2(n)分布就可用N(n,2n)正态分布近似。,2019/8/5,王玉顺:数理统计02_抽样分布,41,2.2.2 t 分布 t-distribution Student Distribution,2.2

19、 抽样分布,2019/8/5,王玉顺:数理统计02_抽样分布,42,William Sealy Gosset(威廉姆斯戈赛)在1908年发表的一篇论文中首先推导出t-分布 当时Gosset在都柏林的Guinness(强性黑啤酒)啤酒厂工作,由于被禁止以他本人的名义发表论文,所以使用了Student(学生)这一笔名 之后英国统计学家R.A.Fisher(罗纳德费雪)的工作发扬光大了t检验及相关理论,正是他将此分布称为student distribution(学生分布),(1) t 分布简史,2.2.2 t 分布,2019/8/5,王玉顺:数理统计02_抽样分布,43,The derivation

20、 of the t-distribution was first published in 1908 by William Sealy Gosset, while he worked at a Guinness brewery in Dublin. He was not allowed to publish under his own name, so the paper was written under the pseudonym Student. The t-test and the associated theory became well-known through the work

21、 of R.A. Fisher, who called the distribution “Students distribution“.,(1) t 分布简史,2.2.2 t 分布,2019/8/5,王玉顺:数理统计02_抽样分布,44,(2)T统计量的定义,2.2.2 t 分布,设ZN(0,1)和 22(n),且它们相互独立,则由标准正态Z统计量与自由度为n的2统计量所构建的新统计量:,服从自由度为n的t分布(t-distribution or student distribution),且自由度n是它的唯一分布参数。,记作,2019/8/5,王玉顺:数理统计02_抽样分布,45,2.2.

22、2 t 分布,(3)T统计量的概率密度,t(n)分布概率密度是观测t和自由度n的函数,2019/8/5,王玉顺:数理统计02_抽样分布,46,2.2.2 t 分布,t(n)是对称分布,自由度n是它的唯一分布参数; n愈大峰值愈高及两尾收缩变细,t观察值愈集中于期望0; n愈小峰值愈低及两尾伸展变粗,t观察值愈向两侧分散。,(3)T统计量的概率密度,2019/8/5,王玉顺:数理统计02_抽样分布,47,2.2.2 t 分布,(4)T统计量概率密度的证明,方开泰,许建伦统计分布北京:科学出版社,1987,方开泰(l 940),江苏扬州人,国际数理统计学会院士,均匀设计创始人。1957-63北京大

23、学数力系;1963-67中科院研究生;1980年副研究员;1986年-中科院应用研究所研究员;1984-92中科院应数所副所长;1985-博士生导师;1980-82美国耶鲁大学、斯坦福大学Visiting Fellow;1985-86年苏黎士高工客座教授;1988.1-6北卡罗尼西大学访问教授;1993起为香港浸会大学讲座教授;1982年选为美国IMS终生Fellow;1995-99任国际统计学院(ISI)理事(代表中国);曾任中国概率统计学会理事长、中国概率统计学会秘书长、国际统计协会院士、数学统计学会会员、中国数学会执行副秘书长、委员等职务。,百战黄沙终不悔!,2019/8/5,王玉顺:数

24、理统计02_抽样分布,48,2.2.2 t 分布,T统计量的期望和方差:,(5) t 分布的性质,2019/8/5,王玉顺:数理统计02_抽样分布,49,2.2.2 t 分布,T统计量的期望和方差,(5) t 分布的性质,1/2统计量与2统计量有相同的概率密度,卡方概率积分,2019/8/5,王玉顺:数理统计02_抽样分布,50,2.2.2 t 分布,(5) t 分布的性质,分布对称性:概率密度关于t=0对称。亦即位于t=0两侧的t点和-t点具有相同的概率密度。,2019/8/5,王玉顺:数理统计02_抽样分布,51,2.2.2 t 分布,概率密度峰点:x=0处概率密度最大,众数0,(5) t

25、 分布的性质,2019/8/5,王玉顺:数理统计02_抽样分布,52,2.2.2 t 分布,大数定律: 当n时,t分布趋于标准正态分布,它们都关于0对称; 一般当n30时,t(n)分布就可用标准正态分布N(0,1)替代。,(5) t 分布的性质,2019/8/5,王玉顺:数理统计02_抽样分布,53,2.2.3 F 分布 F-distribution,2.2 抽样分布,2019/8/5,王玉顺:数理统计02_抽样分布,54,英国统计学家R.A.Fisher和美国统计学家George Snedecor分别独立提出了F分布 为了彰显Fisher对统计学的杰出贡献和对Fisher本人的敬重,Sned

26、ecor将其命名为F分布。 Fisher采用F分布发明了著名的方差分析(ANOVA),方差分析已成为统计学的核心统计方法。,2.2.3 F 分布,(1)F分布简史,2019/8/5,王玉顺:数理统计02_抽样分布,55,2.2.3 F 分布,(2)F统计量的定义,设Q12(n1)和Q22(n2),且它们相互独立,则由2统计量Q1和Q2所构建的新统计量:,服从自由度为n1,n2的F-distribution(F分布),其中n1称为第一自由度,n2称为第二自由度,2019/8/5,王玉顺:数理统计02_抽样分布,56,2.2.3 F 分布,两统计量Q12(n1)及Q22(n2)均源自正态总体抽样的

27、样本; Q1和Q2相互独立,意味着它们对应的两样本独立,两样本甚至源自不同的正态总体; 两自由度n1和n2的次序不能颠倒。第一自由度n1属于F统计量分子上的2统计量,第二自由度n2属于F统计量分母上的2统计量。,(3)F统计量要点,2019/8/5,王玉顺:数理统计02_抽样分布,57,2.2.3 F 分布,F(n1,n2)分布的概率密度是观测x和两个自由度n1及n2的函数:,(4)F统计量的概率密度,2019/8/5,王玉顺:数理统计02_抽样分布,58,2.2.3 F 分布,(4)F统计量的概率密度,F(n1,n2)是一种向左的偏态分布,分布参数分别是第一自由度n1和第二自由度n2; 固定

28、第一自由度n1,n2愈大峰值愈高及右尾收缩变细,F观察值愈向左侧集中。,2019/8/5,王玉顺:数理统计02_抽样分布,59,2.2.3 F 分布,(4)F统计量的概率密度,F(n1,n2)是一种向左的偏态分布,分布参数分别是第一自由度n1和第二自由度n2; 固定第二自由度n2,n1愈大峰值愈右移并略升高,右尾收缩变细微小,F观察值愈向中部集中。,2019/8/5,王玉顺:数理统计02_抽样分布,60,2.2.3 F 分布,(5)F统计量概率密度的证明,方开泰,许建伦统计分布北京:科学出版社,1987,方开泰(l 940),江苏扬州人,国际数理统计学会院士,均匀设计创始人。1957-63北京

29、大学数力系;1963-67中科院研究生;1980年副研究员;1986年-中科院应用研究所研究员;1984-92中科院应数所副所长;1985-博士生导师;1980-82美国耶鲁大学、斯坦福大学Visiting Fellow;1985-86年苏黎士高工客座教授;1988.1-6北卡罗尼西大学访问教授;1993起为香港浸会大学讲座教授;1982年选为美国IMS终生Fellow;1995-99任国际统计学院(ISI)理事(代表中国);曾任中国概率统计学会理事长、中国概率统计学会秘书长、国际统计协会院士、数学统计学会会员、中国数学会执行副秘书长、委员等职务。,2019/8/5,王玉顺:数理统计02_抽样

30、分布,61,2.2.3 F 分布,F统计量的期望和方差 引用前述求解T统计量期望时的中间结果,(6)F分布的性质,2019/8/5,王玉顺:数理统计02_抽样分布,62,2.2.3 F 分布,(6)F分布的性质,反对称性:F统计量的倒数1/F服从自由度对调后的F分布,即,2019/8/5,王玉顺:数理统计02_抽样分布,63,2.2.3 F 分布,(6)F分布的性质,大数定律: n1,n2愈大,概率密度愈峰值升高及两尾收缩,峰值右移并趋于相对f=1对称; 应用:n1,n2时F(n1,n2)趋于正态分布NE(F),Var(F);只要n1,n2足够大就可用正态分布替代。,2019/8/5,王玉顺:数理统计02_抽样分布,64,结束,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报