1、抽样误差 与 区间估计,从一个例子来谈抽样误差,假如事先知道某地七岁男童的平均身高为119.41cm。研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了五次。,张汝阳,2,抽样误差,张汝阳,3,抽样误差,张汝阳,4,抽样误差,张汝阳,5,导致总体均数与样本均数、样本均数之间有差别的可能原因是?,抽样误差的定义,张汝阳,6,五次抽样得到了不同的结果,原因何在?,抽样误差的表现,张汝阳,7,均数的抽样误差之特点,张汝阳,8,各样本均数未必等于总体均数;样本均数间存在差异;样本均数的分布很有规律;,抽样误差,张汝阳,9,定义:由于个体变异的存在,由抽样引起的样本统计量与总体参数间及样本统计
2、量间的差别。2个原因:个体变异抽样行为2个表现:不同样本统计量间的差别样本统计量与总体参数间的差别抽样误差是不可避免的!抽样误差是有规律的!, ,中心极限定理(central limit theorem),张汝阳,10,Case 1: 从正态分布总体N(,2) 中随机抽样(每个样本的含量为n如10),可得无限多个样本如1000次,每个样本计算样本均数,则样本均数也服从正态分布。样本均数的均数为 ;样本均数的标准差为 。,中心极限定理(central limit theorem),张汝阳,11,Case 2: 从非正态分布总体(均数为,方差为2)中随机抽样(每个样本的含量为n50),可得无限多个
3、样本,每个样本计算样本均数,样本均数的分布也趋于正态分布。样本均数的均数为 ;样本均数的标准差为 。,标准误(standard error),张汝阳,12,样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度。前者称为理论标准误,后者称为样本标准误。用标准误来衡量抽样误差的大小!,这个公式是怎么来的?,张汝阳,13,样本均数的抽样分布,与样本含量的关系,张汝阳,14,n 越大,均数的均数就越接近总体均数;n 越大,变异越小,分布越窄;对称分布接近正态分布的速度,大于非对称分布。单峰快于多峰。分布越偏,接近正态分布所需样本含量越大。,抽样误差的规律性(
4、1),张汝阳,15,均数的抽样误差规律:在样本含量足够大时,无论总体分布如何,其均数的分布趋于正态分布,t 分布,张汝阳,16,正态分布的标准化变化,张汝阳,17,若 X N(,2) , 则 。,因 , 则 。,t分布的演化,张汝阳,18,根据中心极限定理的内容,当样本含量足够大时,对从均数为,标准差为的任意总体中随机抽样所得的样本均数进行标准化变换,有,t 分布的概念,张汝阳,19,实际工作中,总体方差未知。所以,用样本方差代替总体方差, 的分布如何?,t分布起源,张汝阳,20,t 分布的概念,张汝阳,21,用样本方差代替总体方差,此时不服从正态分布。而服从 t 分布。记为:,张汝阳,22,
5、自由度分别为1、5、 时的 t 分布,研究抽样分布的目的,张汝阳,23,样本统计量的抽样分布规律是统计推断(statistical inference)的理论基础。只有了解抽样分布规律,才能深刻理解统计推断的内涵。,表示总体均数的标准误。( ) 表示样本均数的标准误。( )同一批数值变量资料的标准差不会比标准误大。( )即使变量X偏离正态分布,只要每次抽样的样本数足够大,样本均数也近似服从正态分布。( ),张汝阳,24,练习1,练习2,张汝阳,25,表示( )A 总体标准差B 样本标准差C 抽样分布均数的理论标准差D 抽样分布均数的估计标准差,练习3,表示 ( )A 总体均数的离散程度B 总体标准差的离散程度C 样本均数的离散程度D 样本标准差的离散程度,张汝阳,26,练习4,从连续性变量X中反复随机抽样,随样本含量增加 将趋于( )A X的原始分布 B 正态分布C 均数的抽样分布 D 标准正态分布,张汝阳,27,练习5,张汝阳,28,下面关于标准误的四种说法中,哪一种最不正确( )A 标准误是样本统计量的标准差B 标准误反映了样本统计量的变异C 标准误反映了总体参数的变异D 标准误反映了抽样误差的大小,简答题,张汝阳,29,请简述标准差与标准误的区别和联系。区别:公式标准差-个体变异、标准误-抽样误差联系:固定时,抽样误差与样本量成反比均表示离散程度个体值的,统计量的,