1、第5章 抽样与抽样分布,抽样的基本概念(理解) 基本的抽样方法(掌握) 常用的抽样分布(知道),主要内容和学习目标,一、抽样的基本概念,总体、单位与样本,样本容量与样本个数,参数与统计量,非抽样误差与抽样误差,抽样单元与抽样框,总体:调查研究的事物或现象的全体用符号X表示 单位:构成总体的每一个个别事物用符号Xi表示 样本:从总体中抽取的一部分总体单位的集合用符号(X1,X2,Xn)表示样本是一个n维随机变量样本观察值用符号(x1,x2,xn)表示简单随机样本是具有代表性和独立性的样本,总体、单位与样本,样本容量:一个样本中所包含的单位数用符号n表示样本容量大,则抽样误差小,但调查成本高样本容
2、量小,则调查成本低,但抽样误差大n30的样本称为大样本n30的样本称为小样本 样本个数:指从一个总体中可能抽取的样本个数,样本容量与样本个数,参数与统计量,参数: 是用来描述总体的数量特征的常数 参数通常是一个未知的常数 统计量: 是指不含任何参数的样本函数 是用来描述样本的数量特征的随机变量 统计量通常是可以由样本数据计算出来的,常用的总体参数,总体均值,总体方差,总体比例,常用的样本统计量(一),样本均值,样本方差,样本比例,常用的样本统计量(二),Z统计量,t统计量,2统计量,非抽样误差与抽样误差,非抽样误差: 由于调查者或被调查者的人为因素造成的登记性误差 由于主观因素破坏了随机原则而
3、产生的系统性偏差 非抽样误差是可以避免或消除的 抽样误差: 由于抽样的随机性而带来的偶然的代表性误差 抽样误差是抽样调查中所固有的误差 抽样误差是不可避免的,但可事先计算或控制,抽样单元与抽样框,抽样单元:在大规模抽样调查,通常将总体划分成不重叠且又穷尽的若干部分,每一个部分称为一个抽样单元。 抽样单元的划分可以是自然形成的,也可以是认为划定的抽样框:是指关于总体单位或抽样单元的名册 编制高质量的抽样框是保证抽样调查达到预期目的的前提条件之一,返回,二、基本的抽样方法,简单随机抽样,等距抽样,分层抽样,整群抽样,简单随机抽样(一),简单随机抽样:也称为纯随机抽样 是从总体包含的N个单位中任意抽
4、取n个单位作为样本 总体中每个单位可能被抽中的概率相等它是一种最基本的抽样方法 它是其他抽样方法的基础,简单随机抽样(二),简单随机抽样的优点 在理论上容易处理 当总体包含的单位数N不大时,实施并不困难 简单随机抽样的缺点 当总体包含的单位数N很大时,抽样框很难编制 当总体包含的单位数N很大时,调查极不方便,等距抽样(一),等距抽样: 首先将总体中的所有单位按排序 然后在规定的范围内抽取一个单位作为初始单元 最后按事先定好的间隔K确定其他样本单位计算公式: N为总体单位数,n为样本容量,等距抽样(二),等距抽样的优点 实施简单 估计的精度较高等距抽样的缺点 对估计量精度的估计比较困难,分层抽样
5、(一),分层抽样:又称为分类抽样或类型抽样 首先将总体按某种特征或原则划分成若干层 然后在每层内独立地、随机地抽取子样本 最后将子样本合起来构成总体样本 划分层时 应使层内各单位的差异尽可能小 而使层间各单位的差异尽可能大,分层抽样(二),分层抽样的优点 可以同时对总体参数和各层的目标量进行估计 实施和组织比较方便 样本在总体中的分布比较均匀 层次划分合理时,可以大大提高估计的精度,整群抽样(一),整群抽样 首先将总体划分成若干群 然后以群为抽样单元抽取样本 最后对抽中的各个群内的所有单位进行调查 划分群时 应使群内各单位的差异尽可能大 而使群间各单位的差异尽可能小,整群抽样(二),整群抽样的
6、优点 抽样时只需群的抽样框,可以减少工作量 群内各单位集中,调查方便、节省费用 整群抽样的缺点 估计的精度较差,Excel在抽样中的应用,方法一:利用Excel的分析工具库中的“抽样”工具进行方法二:利用Excel的函数“RAND”、“CEILING” 和“INDEX”进行,返回,三、常用的抽样分布,样本均值的抽样分布,样本比例的抽样分布,样本方差的抽样分布,样本均值的抽样分布(一),定理1:设X1,X2,Xn是来自正态总体N(2)的样本,则有,定理2:设X1,X2,Xn是来自非正态总体N(2)的样本,但样本容量n充分大(n30),则近似有,样本均值的抽样分布(二),定理3:设X1,X2,Xn
7、是来自正态总体N(2)的样本(或是来自非正态总体的样本,但样本容量n30),则有,定理4:设X1,X2,Xn是来自正态总体N(2)的样本,则有,样本均值的抽样分布(三),定理5:设X1,X2,Xn是来自某一总体X的样本,且总体X的均值为,方差为2,则有,样本均值的抽样分布与总体分布的关系: 样本均值的期望值总体均值 样本均值的方差总体方差/n 样本均值的标准差=总体标准差/,样本比例的抽样分布,定理6:设X1,X2,Xn是来自二项分布总体B(n,)的样本,但样本容量n充分大(np5,n(1-p)5),则有,定理7:设X1,X2,Xn是来自二项分布总体B(n,)的样本,但样本容量n充分大(np5,n(1-p)5),则有,样本方差的抽样分布,定理8:设X1,X2,Xn是来自正态总体N(2)的样本,则有,Excel在抽样分布模拟中的应用,首先利用Excel的分析工具库中的“随机数发生器”工具得到总体数据 然后利用Excel的分析工具库中的“抽样”工具或“RAND”函数抽取适当的样本,并计算出样本统计量的值 最后根据样本统计量的值计算或作图,显示抽样分布的特征,返回,End of Chapter 5,