1、抽样调查,侯震梅,统计认识活动的一个重要环节是通过统计调查获取数据,然后再据以进行科学的统计分析。 统计调查有多种,其中应用最为广泛的就是抽样调查,可以说,抽样调查是国际上通行的统计调查的主要方法之一. 目前我国1%人口抽样调查、农业抽样调查、就业抽样调查、工业企业调查、批发零售业和餐饮业抽样调查已列入国家统计调查制度。,抽样调查的基本概念,抽样调查(sampling survey)是使用频率最高的一种调查方式,它是按照一定程序,从所研究对象的全体(总体)中抽取一部分(样本)进行调查或观察,获得对总体的数量特征的估计和推断。,根据“单元是否按照一定的概率入样”进行分类:,随机(概率)抽样(pr
2、obability sampling ) 非随机(非概率)抽样(non- probability sampling ),随机抽样是指按照概率原则,从总体中抽取一定数目的单位作为样本进行观察,随机抽样使总体中每个单位都有一定的概率被选入样本,从而使根据样本所做出的结论对总体具有充分的代表性。 非随机抽样是以方便为出发点或根据研究者主观的判断来抽取样本。非随机抽样主要依赖研究者个人的经验和判断,它无法估计和控制抽样误差,无法用样本的量化数据来推断总体。,抽样调查的作用,可以承担全面调查无法胜任的项目。对那些不可能进行全面调查或普查的总体,只能进行抽样调查; 节约费用; 调查周期短,时效性强; 有助
3、于提高调查数据的质量。,抽样调查发展史,1、1802年Laplace用抽样法推断法国人口。 比较完整的早期抽样调查的例子是法国数学家Laplace对人口的抽样调查。 2、1903年挪威统计学家凯尔的抽样调查方法被国际统计学会(ISI)承认。 竭力提出并推行抽样调查的先驱者是挪威统计局的凯尔,于1895年在国际统计学会第五次大会上提出的,当时称之为代表性抽样。1903年,国际统计会第九次大会取得一项决议,推荐使用凯尔提出的抽样方法。,3、1906年英国统计学家Bowley提出简单抽样理论。 1906年英国人鲍利提出中心极限定理,为抽样调查奠定了理论基础,1925年的国际统计大会才承认随机抽样的可
4、行性和有效性。 4、1934年Neyman提出分层抽样 1934年,奈曼发表的著名论文“代表性抽样的两种方法:分层抽样方法和目的抽样方法”是现代抽样调查理论发展史上的一个里程碑。 5、1947年联合国推广应用。 美国政府在就业、人口、农业等方面大力推广抽样调查,出现了一大批著名的抽样调查专家,包括戴明、汉森、赫维茨、麦多等。,我国抽样调查的发展,清华大学教授陈达主持云南呈贡县人口普查,调查后用抽样方法进行核对比较,并发表论文人口普查选择研究。 解放后,统计工作主要学习苏联,1955年开始农民家计抽样调查,1963年成立农产量调查队。 1981国家统计局筹建农村抽样调查队和城市抽样调查队。,抽样
5、调查应用举例,1、人口调查:我国每10年一次普查,每年进行人口变动量的抽样调查。 美国用抽样调查数据提供有关人口、劳动就业、失业情况的基础数据。 2、经济调查:农作物的播种面积和产量的抽样调查。 农村经济抽样调查:农民的生产、收入、分配、积累、消费调查。 1982年4月起进行物价抽样调查:产品质量抽样调查,3、社会调查: 公众和民意抽样调查。 1990年妇女社会地位抽样调查 1992年中国儿童情况抽样调查 对技术人员状况、对公众科学态度调查. 4、卫生调查 预防接种调查、流行病调查 1998年,第二次国家卫生服务调查 5、环境调查 耕地、森林、草原、能源、动物、害虫、大气、水质。,抽样调查应用
6、举例,关于抽样调查设计与分析的若干问题,近二十年来,人们对信息的要求日益强烈,抽样调查作为十分时髦而又重要的统计调查方法已得到广泛的重视。 一项抽样调查,除了必要的经费和组织保证外,他的成功与否主要取决于它的设计与分析。,一、抽样设计的目标与准则,(1)目地性:整个抽样设计,包括抽样框的设计、样本容量的设计、抽样方法的设计、估计量的设计、调查方法与问卷的设计,都必须以研究目地为依据,服务于研究目地。 (2)可度量型:是指能用样本自身计算出调查得到的估计值的有效性,即能算出估计值可能的误差范围。 (3)可行性:指能否基本上按预定的设计完成调查。 (4)经济性:即以最小的费用实现调查目标。,二、任
7、意抽样、判断抽样与概率抽样,样本的抽取方法有两大类:概率抽样与非概率 抽样。概率抽样也称随机抽样,其基本特征是对总 体中的每一个可能样本都以确定的概率来抽取样 本,而不是根据某种准则来挑选样本。概率抽样 能保证样本的代表性,根据样本数据获得总体目 标量估计的同时,获得对这种估计的精度估计。,任意抽样的结果是不可靠的,其作用非常 有限,因为所得样本对总体没有代表性。判 断抽样的效果取决于调查的经验和判断。,三、调查的形式与调查表的设计,调查的形式取决于调查的内容和调查者的 能力。目前大多数调查项目,特别是社会与 经济调查或对人的意向与行为调查,通常采 用问卷调查的形式。,四、抽样调查的误差、精度
8、与样本量,抽样调查中的误差分为抽样误差与非抽样误差。非抽样误差:调查误差(测量误差)、单元无回 答、抽样框不完整、数据录入产生的误差。抽样误差:样本估计总体产生的,大小取决于样本 量,样本量越大,精度越高。我们的目的是在可能费用的条件下,尽可能提高精度;或者在要求保证给定精度的条件下,使费用尽可能的节省。,五、抽样单元的划分与抽样框的准备,对抽样单元的合理划分及一份完整的抽样框 是进行概率抽样的前提。抽样单元可直接采用 自然单位或各级行政单位,例如在电视收视率 的调查中,可以将每个电视观众作为抽样单 元,也可将每个拥有电视机的家庭作为抽样单 元。,六、设计效应与样本量的确定,样本量的确定取决于
9、对精度的要求以及费用的限制。对简单随机抽样有比较简单的确定方法,对于其他的设计需要设计效应。,七、总体目标量的估计与方差估计,抽样调查的目的是通过样本数据对总体目标量进行估计。本课程将集中介绍常用的抽样方法、目标量的估计方法及误差的估计方法。,方差与偏量,信度,效度,S(),B(),均方误差=方差+偏倚平方 几何意义:,误差限与置信度,估计量的误差通常用误差限来表示。 置信度为 的绝对误差限满足置信度为 的相对误差限 r 满足,只要n充分大,估计量 的分布是近似正态分布的,,对可用估计量,它必定是近似无偏的,因此有,八、不回答的影响与处理,替换样本问题 加权调整 沃纳随机化回答模型,1、 抽样
10、调查 孙山泽著 2、 抽样技术及其应用杜子芳著 3、 Survey Sampling Kish著 4、 抽样技术 金勇进著,参考书目,基本要求,1. 掌握各种抽样估计的基本思想 2. 掌握抽样估计的计算方法和公式 3. 案例分析 4. 抽样调查实践,第一章 引 言,1.1 概率抽样调查 1.2 有限总体抽样的样本分布 1.3 概率抽样的几种基本的抽样方法,概率抽样调查,(1)概率抽样调查的的定义 概率抽样调查是在非全面调查中运用概率统计理论指导的抽样方法,按随机的原则从全部研究对象中抽取一部分单位代表总体进行研究,并依据所获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计判断,来认识总
11、体的一种统计方法。,随机性,代表性,总体性,推断,抽样的随机性决定了样本的代表性,才能用样本推断出总体的数量特征。,数量特征,总体分布,事件概率,(2)概率抽样的原理,(3)概率抽样调查的优越性,a. 适用面广、较高精确性。科学的抽样手段使数据有代表性, 可靠的数学方法使结果有精确性 b. 抽样误差可以进行计算并加以控制 c.节省费用,节省人、财、物,时效性强 d. 可用专用设备和高质量的专业人员,概率抽样的几种基本的抽样方法,1. 简单随机抽样:对中取出个样本,每一样本出现的概率相同,有放回与无放回。 2. 系统抽样(机械抽样或等距抽样):将总体单元按某种顺序,将个个体序号1,2,N对应,然
12、后选数k, 将个体顺序排列如下,直至N个个体排完,对号码1,2,k作简单随机抽样,第i个入样,则k+i, 2k+i, ,均入样,或采用头尾相接。,2.不等概抽样:对总体不同的单元有不同的入样概率。 3. 分层抽样:将总体分成若干个小总体(层),在每层中抽取样本,将各层的样本和在一起组成员总体的一个分层样本。 4. 多阶抽样:将总体分成若干个小总体,但并不在每一小总体中抽取样本,而将这些小群体称为第一抽样单元,将他们看作个体进行抽样。 5. 多重抽样:对总体进行一次以上的抽样。,本书所讨论的抽样均指概率抽样,还需指出一些非概率抽样的方法, a.便利抽样:也称为任意抽样偶遇抽样,是指调查者为了方便
13、而任意抽取样本单位的一种抽样方法。例如,要了解某种商品使用的普遍程度,调查员在道路、商店、学校等场所随便选择部分人作为样本进行调查。,b. 判断抽样:也称为立意抽样,指的是由抽样者根据自己的主观经验抽取样本。 c. 重点抽样:只对总体中的重点单元进行特征测量的调查 例如,调查我国钢铁行业的现状,则只对宝钢、鞍钢、首钢等几家大型企业进行调查。 d. 滚雪球抽样:利用样本点寻找样本点。 e. 配额抽样:先将总体中的所有单元按一定分类标志分为若干类,然后在每类中采用便利抽样或判断抽样的方式选取样本。样本的类别结构与总体大致成比例。可以看出,重点抽样与典型抽样查都属于判断抽样。,2、抽样调查的操作流程
14、 建立课题,明确调查的目的 调查的准备阶段a. 总体及目标量的确定总体为想要达到调查目的所要关注的集合, 即所有调查客体的集合,相应的构成总体的调查 客体称为个体。,抽样单元:将总体分成有限个互不相重合的部分,每个部分称为单元.单元比个体的概念要广泛,可以是一个个体,也可以是多个个体的集合 单元可大可小,单元又可分为小的单元。 b. 抽样框:是一个包含总体全部单元及其主要特征的图表。 抽样框的基本形式:名单抽样框、区域抽样框、时间抽样框。 c. 收集数据的方法 d. 抽样设计,总 体,次级单元,初级单元,次级单元,次级单元,初级单元,全国,省,县,全 国,城市1,城市2,城市,城市4,居 委
15、会,居 委 会,居 委 会,住 户,住 户,住 户,一览表式抽样框,地图抽样框,e. 问卷设计 3. 现场工作阶段 4. 数据处理阶段 5. 写出报告、结论,1.2 有限总体抽样的样本分布,由于本书研究的大规模抽样调查对象是一个有限总体,总体中的单元是可识别。引入符号:总体有N个单元,N已知数,设总体的每个单元用Ui表示,则有限总体记为,抽取的方案使每一可能的样本以一个确定的出现概率,因此构成了由抽样设计形成的样本概率分布,基于此分布我们可算样本统计量的期望、方差等。这些期望、方差称为基于设计的期望、方差。 例1 有放回的简单随机抽样。每一样本出现的概率为例2.不放回的简单随机抽样,每一样本出现的概率为 记一个可能的样本为s,在抽样设计下出现此样本的概率为p(s), 对任意单元Yk, 对包含Yk,的s求和,称为入样概率。,命题 1 对简单随机抽样有,命题 2 对简单随机抽样有,由样本对总体 的指标进行估计,本书的主要内容就是如何求出这几个指标:总量、平均、方差、比例。,