1、第5章 抽样估计和假设检验,第5章 抽样估计和假设检验,抽样估计所采用的是统计推断中参数估计的思想和方法,简单随机抽样情况下的抽样估计就是统计推断中的参数估计,在不同的抽样方式下又产生了具体的估计方法,比如系统抽样下的估计、分层抽样下的估计、整群抽样下的估计等等。统计推断是统计的核心思想,包括参数估计和假设检验等内容。是根据带随机性的观测数据即样本数据以及问题的条件和假定(概率模型),而对未知现象作出的,以概率形式表述的判断。它是数理统计学的主要任务,其理论和方法构比例理统计学的主要内容。统计推断的一个基本特点是:其所依据的条件中包含有带随机性的观测数据。以随机现象为研究对象的概率论,是统计推
2、断的理论基础。,第5章 抽样估计和假设检验,在数理统计学中,统计推断常包含两个方面的内容,一是已知条件:所研究问题的总体、总体分布(部分未知或未知)、样本;二是推断结论:通过样本(观测数据)作出与未知分布有关的某种结论。例如,某一群人的身高构成一个总体,通常认为身高服从正态分布,但不知道这个总体的均值,随机抽部分人,测得身高的值,用这些数据来估计这群人的平均身高,即属参数估计问题。若感兴趣的问题是“平均身高是否超过170cm”,就需要通过样本检验此命题是否成立,即假设检验。,第5章 抽样估计和假设检验,本章要介绍的内容由抽样估计和假设检验两部分组成。抽样估计包括总体均值的抽样估计和总体比率的抽
3、样估计,第5章 抽样估计和假设检验,5.1 抽样估计概述 5.1.1 抽样估计的概念 1. 抽样估计 抽样估计就是按照随机抽样的原则,从总体中抽出一部分单位作为样本,并利用样本的实际资料计算样本指标值,然后根据样本指标对总体的数量特征(总体指标)做出具有一定可靠程度的估计和判断的一种统计分析方法。,第5章 抽样估计和假设检验,5.1.1 2.总体和样本 总体也称全及总体,指所要认识研究对象的全体。它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。总体的单位数通常是很大的,甚至是无限的,一般用N表示总体的单位数。 样本又称子样,它是从全及总体中随机抽取出来的们作为代表这一总体的哪部分单
4、位组成的集合体,样本的单位数是有限的,相对值或标志属性决定的。,第5章 抽样估计和假设检验,5.1.1 3.总体参数和样本统计量 总体参数是总体的数量特征。对于某个总体来说,其参数是定值。但是在某一实际问题中,总体参数通常是未知的,这就需要通过样本数据所提供的总体的有关信息对参数进行推断。一个全及指标的指标数值是确定的、唯一的,所以称为参数。一个总体常常有多个参数,这些参数从各个不同的角度反映总体分布的基本情况和特征。通常最关心的就是表示总体分布集中趋势和分散趋势的两个参数,即总体的均值和方差。,第5章 抽样估计和假设检验,5.1.1 样本统计量是样本的数量特征。它随样本的不同而变化,是一个不
5、包含任何未知参数的样本函数,因此是个随机变量。样本统计量一方面表示样本本身的分布状况和特征,另一方面也是总体参数的估计量。,第5章 抽样估计和假设检验,5.1.1 4. 样本容量和样本数目 样本容量是一个样本所包含的单位数,一般用n表示。通常认为n30为大样本,n30为小样本。 样本数目是从一个总体中按照一定样本容量可能抽取的样本的数目。,第5章 抽样估计和假设检验,5.1.1 5. 抽样的方法 重复抽样(重置抽样) 从具有N个单位的总体中随机抽取一个单位(登记其序号和相应的标志值)之后,又将它重新放回总体,参加下一次抽选,依次连续进行n次抽选,便构成一个容量为n的样本,这样的抽样方法称为重复
6、抽样。总体每个单位在各次抽样中被抽取的概率都相同。,第5章 抽样估计和假设检验,5.1.1 不重复抽样(不重置抽样) 从具有N个单位的总体中随机抽取一个单位,不再将它重新放回总体参加下一次的抽选,这样的抽样方法称为不重复抽样。从抽样分布角度来看,这种抽样分布实际上等同于一次从总体中同时抽取n个单位组成一个样本。,第5章 抽样估计和假设检验,5.1.2 抽样估计的理论依据 抽样估计是通过样本对总体的推算,这样统计量与被估算的总体指标之间的关系,就是推算的关键。而两者的关系主要通过统计量的分布来反映,且因样本量的大小而有所差别。,第5章 抽样估计和假设检验,1.大数定律 大数定律是指一切关于大量随
7、机现象平均结果稳定性的定理,包含马尔可夫定理、辛钦定理、车贝雪夫定理、贝努里定理、普阿松定理等等,它为均值稳定性的存在及整个抽样估计提供了最基本的理论依据。 大数定律的本质是尽管单个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消,致使总的平均结果趋于稳定。,第5章 抽样估计和假设检验,2. 中心极限定理 中心极限定理是指在一定的条件下,大量相互独立的随机现象的概率分布以正态分布为极限的定理。因正态分布在概率论中占有中心地位,所以把以正态分布为极限的定理叫做中心极限定理。 中心极限定理表明,在实际问题中,随机变量不论来自什么样分布的总体,都可用正
8、态分布的理论来说明和估计平均数的问题。当然原分布与正态分布的差异越大,抽样数目就要越多,这样才能保证平均数的分布接近正态分布。,第5章 抽样估计和假设检验,大数定律揭示了大量随机变量的平均结果,但并没有涉及到随机变量的分布规律。而中心极限定理则说明了许多随机变量的分布是正态或近似正态的,这就可以简化抽样估计中许多统计量的分布问题,所以它是统计学中的重要工具之一。,第5章 抽样估计和假设检验,5.2 抽样分布 5.2.1 抽样分布 1. 抽样分布 样本统计量的所有可能取值及其概率所形成的概率分布称为抽样分布。某个样本统计量(如均值、比例、方差等)的抽样分布,从理论上说就是在重复选取容量为n的样本
9、时,由每一个样本计算出的该统计量数值的相对频数分布或概率分布。,第5章 抽样估计和假设检验,5.2.1 抽样分布 2. 样本均值的抽样分布 若总体服从均值为 ,方差为 的正态分布,则从总体中抽取出的样本均值仍然服从正态分布,即。 如果总体不是正态分布,根据统计学中的中心极限定理,随着样本容量的增加,的抽样分布近似服从正态分布。,第5章 抽样估计和假设检验,5.2.1 抽样分布 3. 样本方差的分布 当总体服从正态分布 时, 服从 分布(将在下一节中介绍),其中样本方差为,第5章 抽样估计和假设检验,5.2.1 抽样分布 4. 样本比例的分布 总体中具有某种属性的单位数与总体全部单位数之比称为总
10、体的比例,记作。而样本中具有某种属性的单位数与样本总数之比称为样本比例,记作。 若从总体中随机抽取出容量为n的样本,发现其中具有某种属性的单位数为,则样本中具有某种属性的单位的比例为当样本容量很大时,样本比例近似地服从正态分布,第5章 抽样估计和假设检验,5.2.1 抽样分布 5. 两个样本平均数之差的分布 统计学中还经常用到分别来自两个正态总体的样本均值差的分布问题。如果有两个正态分布的总体 和 ,其均值分别为 和 ,方差分别为 和 ,若从这两个正态总体中分别抽取容量为n1和n2的两个独立样本,则两个样本平均数之差也一定服从均值为 ,方差为 的正态分布,即,第5章 抽样估计和假设检验,第5章
11、 抽样估计和假设检验,5.2.2 t分布 当样本容量小于30时,样本均值的分布与正态分布之间的误差较大,此时可用分布来描述。 分布与正态分布一样也是对称的。一般地,分布比正态分布更平坦一些。随着样本容量的增加,分布的形状由平坦逐渐变得接近于正态分布。通常认为当样本容量时,可以用正态分布代替分布。,第5章 抽样估计和假设检验,不同大小的样本对应于不同的分布,这是因为分布与自由度有关。所谓自由度就是可以自由选样的数值的个数。比如样本容量是n,在样本均值确定的条件下,对样本中的数据能够自由决定数值的个数就只有n-1个了。实际上,当把n-1个数值选定以后,第n个数据的值也就自动确定了。由此可见,大小为
12、n的样本的自由度就是n-1。图3-2是自由度分别为1和10的t分布曲线并与标准正态分布曲线比较。,第5章 抽样估计和假设检验,第5章 抽样估计和假设检验,5.2.3 分布 设总体服从于标准正态分布,即 ,又 为取自该总体的一个样本,它们的平方和记作 ,即 = + + + 则称统计量 为服从自由度为n的 分布,记作 。 分布的密度曲线与自由度有关。从图5-5可以看出,当自由度很小时,分布密度曲线向右伸展。随着自由度的增加,分布的密度曲线变得愈来愈对称,当自由度达到相当大时,分布的密度曲线接近正态分布。,第5章 抽样估计和假设检验,5.2.4 F分布 设X和Y分别服从自由度为n1-1和n2-1的
13、分布,即 , 且相互独立,则称统计量服从自由度为n1-1和n2-1的F分布。 F分布有两个自由度,一个是分子的自由度,一个是分母的自由度。,第5章 抽样估计和假设检验,5.3.1 抽样误差的概念 抽样误差是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起样本指标与总体指标之间的绝对离差。表示如下:,第5章 抽样估计和假设检验,抽样实际误差是指每次抽样所得的样本指标与总体指标之间的离差,它随着样本的不同而不同,是一个随机变量,即有多少种可能的样本就有多少种可能的实际抽样误差。因此,在抽样估计中要结合所有可能的样本来研究所有可能的实际抽样误差。但是在现实的抽样估计中,抽
14、样实际误差是不可能得到的,我们只能通过抽样分布推算抽样误差。,第5章 抽样估计和假设检验,抽样平均误差 是指所有可能出现的样本统计量的标准差。对于一个特定的总体和样本容量来说,它是固定的、可以计算的。其定义公式如下,第5章 抽样估计和假设检验,5.3.2 抽样平均误差的计算 抽样平均误差是反映抽样误差一般水平的指标,即所有可能出现的样本指标与总体指标的标准差。 1. 抽样平均误差的计算方法 样本平均数的抽样平均误差 重复抽样: 不重复抽样:,第5章 抽样估计和假设检验,2. 样本比例的抽样平均误差 重复抽样: 不重复抽样:在实际计算抽样平均误差时,当总体比例P未知时,可用样本比例p来代替, 即
15、:,第5章 抽样估计和假设检验,3. 影响抽样(平均)误差的因素 总体标志变异程度的大小(总体标准差 的大小)与 成正比例关系。 样本容量的平方与 成反比例关系。例如:要使抽样误差减少为原来的一半,则样本容量将为原来的4倍。 抽样方法的不同。重复抽样的 总是大于不重复抽样的 。 抽样的组织形式。抽样的组织形式不同,抽样误差也不同。,第5章 抽样估计和假设检验,5.3.2 抽样极限误差 抽样极限误差是从另外一个角度来考虑抽样误差的问题,又称为允许误差或抽样误差范围。 用样本指标估计总体指标,必须要考虑抽样误差的大小。 抽样极限误差是指抽样指标与总体指标之间抽样误差可允许的范围,它等于样本指标可允
16、许变动的上下限与总体指标的绝对值。,第5章 抽样估计和假设检验,5.3.3 概率度或 称为抽样误差的概率度。,第5章 抽样估计和假设检验,如例5.7,已知某乡粮食亩产量的标准差为=80公斤,总体单位数N =20000亩,样本单位数n=400亩,求得其抽样平均误差为:如果确定抽样极限误差为5公斤,则,我们可以用概率度: 表示抽样极限的误差范围,即用1.25x来规定误差范围的大小。,第5章 抽样估计和假设检验,5.3.3 置信度 抽样估计的置信度是样本指标与总体指标的误差不超过一定范围的概率,用F(t)表示,又称抽样估计的概率保证程度。 1. 总体平均数抽样估计的置信度2. 总体比例抽样估计的置信
17、度,第5章 抽样估计和假设检验,若反复抽样多次,每个样本值确定一个区间 ,每个这样的区间要么包含的真值,要么不包含的真值,据Bernoulli大数定律,在这样多的区间中,包含真值的约占,不包含真值的约仅占,比如,=0.005,反复抽样1000次,则得到的1000个区间中不包含真值的区间仅为5个。,第5章 抽样估计和假设检验,置信度1越大,则临界值的绝对值就越大,估计区间的精度就越低;反之,置信度愈小,则区间精度就愈高。同时,样本容量n愈大,精度愈高,容量提高到4倍,精度才提高1倍。其实在样本容量一定时,估计的精度和置信度是彼此矛盾的,提高精度(即缩小区间)就降低了置信度;而提高置信度,往往需要
18、扩大置信区间,从而又降低了估计的精度。统计学家尼曼(Neyman、J)提出的原则是:先保证可靠性,以接近1的概率来确定估计区间,然后再尽可能的提高精度。所以人们常给以较小的概率值(如0.01或0.05),使置信度1-较高。,第5章 抽样估计和假设检验,5.3 抽样估计的方法 5.3.1 总体参数的点估计 1. 点估计的概念 点估计指用样本统计量直接代替总体总体参数的估计方法。 2. 抽样估计的优良标准 在对总体特征做出估计时,并非所有估计量都是优良的,从而产生了评价估计量是否优良的标准。衡量一个样本统计量是否是总体参数的优良的估计量一般有如下三条标准,即:无偏性、一致性和有效性。,第5章 抽样
19、估计和假设检验,5.3.2 总体参数的区间估计 1. 区间估计的概念 在统计分析中,我们常常用一个区间及其出现的概率来估计总体参数。这种估计总体参数的方法称为区间估计。 具体地说,区间估计是用估计量所构成的区间来估计总体参数,并以一定的概率保证总体参数将落在所估计的区间内。 这一概率保证程度称为置信度,这种估计区间称为置信区间。例如,,第5章 抽样估计和假设检验,2. 区间估计的方法及要素 总体平均数的区间估计或 总体比例的区间估计或 由上述区间估计公式可概括出区间估计的基本要素,即:估计值;抽样极限误差 ;置信度(概率保证程度)。,第5章 抽样估计和假设检验,3. 区间估计的步骤 置信度约束
20、下的区间估计步骤。 根据抽样估计原理自总体中抽取容量为n的样本,在置信度一定的情况下,我们可以采取如下步骤进行区间估计:,第5章 抽样估计和假设检验,明确置信水平1-或。常用的置信水平主要有95%,95.45%,99.73%等; 确定概率度t(即临界值水平)。根据置信度,查标准正态概率双侧临界值表确定概率度(临界值)t; 计算统计量的值。对总体平均数进行估计时,要计算样本平均数及抽样平均误差x和允许误差x;对总体比例(比重)进行估计时,要计算样本比例p和抽样平均误差p及允许误差p;对总体方差进行估计时,要计算样本修正方差及其抽样误差和允许误差。 构造置信区间。置信区间是优良的统计量允许误差构成
21、的,对于总体平均数在某置信度约束下的置信区间就是样本平均数允许误差。,第5章 抽样估计和假设检验,5.3.3 总体总量的抽样估计 抽样调查的如期完成,能使我们得到两个重要的抽样指标:一个是代表抽样总体(样本)一般特征的样本平均数,或称抽样平均数;一个是反映某一标志的单位数在样本中所占的比重,或称抽样比例。有了这两个表示抽象调查结果的综合指标,就可以对于某些未知的结果进行预测与预算。,第5章 抽样估计和假设检验,抽样调查的功能和作用,在于它能以点推面。所谓“以点推面”就是用样本所包括的点来推算总体所代表的面,即用样本平均数来代表总体平均指标或用样本比例来代表某一标志在总体中所占的比重。这里的样本
22、平均数的求得并不是最终目的,而是通过它门来反映和代替统计总体的平均指标或相对数。如果结合总体中已知的有关总量指标(即绝对数)还可以通过样本平均数和样本比例来推算总体中未知的其它总量指标。根据抽样结果,推算总体的总量指标可以有如下两种方法:,第5章 抽样估计和假设检验,5.4 抽样的组织形式 5.4.1 抽样设计的有关问题 抽样估计是建立在随机抽样的基础上的,而随机抽样的中心是抽样调查方案的设计,主要包括抽样技术和试验设计两项主要内容。抽样技术是指为保证样本的随机性和代表性而选择抽样方法和制定抽样方案等应遵循的基本原则的研究。试验设计是指对试验方案的选择和对试验数据的统计分析等。试验设计主要是对
23、自然现象进行观察的方法,在社会经济统计学中应用较少,为此我们不作详细介绍。,第5章 抽样估计和假设检验,5.4.1 抽样设计的有关问题 抽样调查方案的主要内容: 确定调查的目的。 确定调查对象、调查单位和报告单位。 拟定调查提纲、确定调查项目、并设计调查表。确定调查的时间。 确定调查的组织实施计划。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 抽样组织方式是指在抽样时对总体的加工整理形式,根据对总体的加工整理形式不同,在随机抽样中抽样的组织形式很多,如:简单纯随机抽样、分类抽样、等距抽样、整群抽样和多阶段抽样等。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 1. 简单随机抽
24、样 简单随机抽样又称为纯随机抽样,它是不对总体作任何加工整理,直接从总体中随机抽取调查单位的抽样调查方法。所以也叫简单随机抽样。简单随机抽样是最常用的纯随机抽样。它必须满足下列两条要求:代表性,即要求样本(x1,x2 ,xn)中的每个x 都与总体X具有相同的概率分布,简称为同分布。独立性,即要求样本(x1,x2 ,xn)中的各x是相互独立的。在前面讲解中我们所使用抽样概念都是简单纯随机抽样,在以后的学习中如果不说明抽样的形式,则都是指简单随机抽样。简单随机抽样是抽样中最基本的方式,它适用于均匀总体,即具有某种特征的单位均匀地分布于总体的各个部分。,第5章 抽样估计和假设检验,5.4.2 抽样组
25、织方式 简单随机抽样的平均误差 简单重复随机抽样:简单不重复随机抽样:,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 2. 类型抽样 类型抽样的概念 类型抽样又称分层或分类抽样。它是先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽取一定单位构成样本的抽样组织方式。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 类型抽样是应用于总体内各单位在被研究标志上有明显差别或差别悬殊的总体的抽样。如:研究农作物产量时,耕地有平原、丘陵和山地等;研究职工的工资水平时,各行业之间有明显的差别;研究居民家庭收支情况时,家庭的收入水平差距很大。类型抽样实质上是把统计分组和抽样原理有机结
26、合的抽样组织方式。通过分组,使组中具有同质性,组间具有差异性,然后从各组中简单随机抽样。这样可以保证样本对总体具有更高的代表性,所以计算出的抽样误差就比较小。类型抽样应掌握的主要原则是:分组时应使组内差异尽可能小,使组间差异尽可能大。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 类型抽样的方法 按样本单位在各组中的分配状况,类型抽样可分为等比例抽样和不等比例抽样。等比例抽样就是按同样的抽样比n/N,确定各组中应抽的样本单位数。如各组单位数为Ni,则从中抽取的样本单位数为ni。各组样本单位数确定后,按随机原则从各组中抽取各类单位组成样本。不等比例抽样多指某类单位在总体中占的比重过小时,
27、按比例抽不到或只能抽到很少单位,为了保证样本中各类单位的代表性而采取不等比例抽样的方法。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 类型抽样的抽样平均数和抽样平均误差 抽样平均数: 重复抽样的平均误差: 不重复抽样的平均误差: 类型抽样的优点:它提高了样本代表性;降低了影响抽样平均误差的总体方差。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 3. 等距抽样 等距抽样的概念 等距抽样又称机械抽样或系统抽样它是先将总体单位按某一标志排序,然后按照固定的顺序和相同的间隔来抽选样本单位的抽样组织形式。 无关标志抽样是指排序的标志与研究的标志无关。如观察学生考试成绩,用姓氏笔划排序
28、;观察产品的质量,按生产的先后顺序等。无关标志排序可以保证抽样的随机性。它实质上相当于简单随机抽样。 有关标志排序抽样是指排序的标志与被研究标志相关。如农产品产量调查时,将地块按过去连续几年的亩产排序;家庭消费水平调查中,按收入额排序等。按有关标志排序可以利用辅助的信息,使抽样估计的效率提高,但必须采用科学的方法,避免由于抽样间隔与排序标志的周期性变化的重合所产生的系统性误差。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 无关标志抽样是指排序的标志与研究的标志无关。如观察学生考试成绩,用姓氏笔划排序;观察产品的质量,按生产的先后顺序等。无关标志排序可以保证抽样的随机性。它实质上相当于
29、简单随机抽样。 有关标志排序抽样是指排序的标志与被研究标志相关。如农产品产量调查时,将地块按过去连续几年的亩产排序;家庭消费水平调查中,按收入额排序等。按有关标志排序可以利用辅助的信息,使抽样估计的效率提高,但必须采用科学的方法,避免由于抽样间隔与排序标志的周期性变化的重合所产生的系统性误差。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 等距抽样的优点 按等距抽样组织形式抽取样本单位,能够使抽出的样本单位更均匀地分布在总体中,等距抽样的误差一般较简单随机抽样的误差小,特别是当研究的现象标志变异程度较大时,更能显示出等距抽样的优越性。 等距抽样的抽样平均误差 等距抽样均为不重复抽样,其
30、平均误差的计算可分为两类,一是按无关标志排序时,可用简单随机不重复抽样的平均误差公式计算。按有关标志排序时,可用类型抽样的平均误差公式计算。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 4. 整群抽样 整群抽样的概念。 整群抽样也叫分群抽样或集团抽样,是将总体划分为若干群,然后以群为单位从中随机抽取部分群。对中选群中的所有单位进行全面调查的抽样组织方式。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 在大规模的抽样调查中,如果总体单位多,且分布区域广,缺少进行抽样的抽样框,或按经济效益原则不宜编制这种抽样框的情况下,宜采用这种形式。因为整群抽样将抽样单位由总体单位扩大到群,所
31、以它的抽样框是很简单的。如:对某市居民的家庭收入进行调查,采用整群抽样,就可以按行政区域分为街道,然后随机抽取一些街道,进行全面调查,相对于以上的三种抽样更加适宜。 整群抽样中的群,主要是自然形成的,如按行政区域,地理区域等。由于整群抽样的样本单位的分布集中于群内,所以同样条件下,较简单随机抽样的样本代表性差,所以应适当增加样本单位,以提高估计的精确度。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 整群抽样的估计方法。 设总体中的全部单位划为R群,每群中所包含单位数为m,现从群中随机抽取群组成样本。则各群的平均数为:,第5章 抽样估计和假设检验,各群的样本平均数: 全样本平均数:群间
32、方差为:整群抽样一般为不重复抽样,其抽样误差为:,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 5. 多阶段抽样 前面所介绍的几种抽样方式都是从总体中进行一次抽样就产生一个完整样本的抽样方法,通常称为单阶段抽样。但是在实践中,通常情况下,总体所包括的单位数很多,分布很广,要通过一次抽样就选出有代表性的样本是很困难的。此时我们可将整个抽样过程分为几个阶段,然后逐阶段进行抽样,最终得到所需要的有代表性的样本,这种抽样方法称为多阶段抽样。,第5章 抽样估计和假设检验,5.4.2 抽样组织方式 多阶段抽样时的阶段数不宜过多,一般采用二、三个阶段,至多四个阶段为宜,否则,手续繁琐,效果也不一定好
33、。多阶段抽样时前几个阶段的抽样都是以整群抽样的方式进行的。为保证抽样结果的代表性,抽取的群数和抽样的方式都要注意样本单位分布的均匀性。为此,在第一阶段抽样时通常多抽一些群数。对于群间差异大的阶段,则应当多抽一些,反之,可以少抽一些。在每一阶段抽取群体时,可以采用简单随机抽样法或等距抽样法。不同的阶段既可以用同一种抽样方式,也可以用不同的抽样方式。,第5章 抽样估计和假设检验,5.4.3 样本容量的确定 1. 确定抽样样本容量的必要性 样本容量就是抽样数目。根据大数定理,在抽样调查中样本容量越多,样本对总体的代表性越大,抽样误差越小;样本容量减少,抽样误差就要增大。同时,抽样数目越多,抽样调查的
34、费用也越高,而且还会影响到抽样调查的时效性。因此,确定样本容量时,应在保证满足抽样调查对数据的估计精确度和概率把握程度下,尽量缩小抽样数目,即为必要抽样数目。,第5章 抽样估计和假设检验,5.4.3 样本容量的确定 2. 影响样本容量的因素 总体被研究标志的变异程度。 允许的误差范围。 抽样估计的可靠程度1或F(t)。 抽样的方式和方法,第5章 抽样估计和假设检验,3. 简单随机抽样的样本容量计算样本容量的公式,可以根据抽样极限误差和抽样平均误差计算公式的关系推出。,第5章 抽样估计和假设检验, 平均数估计的样本容量。 重复抽样时,由 可得 不重复抽样时,由 可得 比例估计的样本容量 重复抽样时,由 可得 不重复抽样时,由可得,第5章 抽样估计和假设检验,4. 其他抽样组织方式的样本容量 简单随机抽样是最基本的抽样方法,其样本容量的确定方法说明了样本容量确定的一般原理,其他抽样组织形式样本容量的确定方式与之相同。,