1、第一章调查的两个重要特征:1 调查时一种有策划,有方法,有程序的活动2 调查的结果表现为收集到的数据 数据类型: 实验数据 和 调查数据从总体抽样方法看,分两类抽样:1 非概率抽样 2 概率抽样非概率抽样(抽取样本时,不依据随机原则):1 判断选择 2 方便抽样 3 自愿抽样 4 配额抽样概率抽样也称随机抽样,是依据随机原则概率抽样特点:1 按一定概率以随机原则抽样 2 每个单元被抽中概率已知3 当用样本对总体目标量进行估计时,要考虑到该样本被抽中的概率目标总体,简称总体,指所有研究对象的全体,或者是研究人员希望从中获取信息的总体抽样总体,指从中抽取样本的总体。区别:抽样总体的具体表现是抽样框
2、。通常情况下,抽样总体应该与目标总体完全一致,但实践中两者不一致的情况却时常发生样本参数的四大类型:1 总体均值 2 总体总值 3 总体比例 4 总体比率均方误差 BVMSE2)(B - 偏差 v - 估计量方差精度有误差来表现抽样调查步骤:1 确定调研问题 2 抽样方案设计 3 问卷设计 4 实施调查过程 5 数据处理分析 6 撰写调查报告第二章简单随机抽样:之所以有此称呼,主要是由于在简单随机抽样中用于估计总体均值的统计量是样本均值抽样比:样本容量相对于总体规模的比例 ,一般记为N/nf简单随机抽样的抽样规则是:1 按随机原则取样,在取样时排除任何主观因素选择抽样单元,避免任何先入为主的倾
3、向性,防止出现系统误差2 每个抽样单元被抽中的概率都是已知或事先确定的,或者事先可以计算得到3 每个抽样单元北被抽中的概率都相等,即简单随机抽样属于一种等概率随机抽样简单随机抽样:每个样本被抽到的概率都等于 CNn/1在全部可能的 个样本中,因而任意应该特定单元的入样概率为CNn NCNn/1-nf对于简单随机抽样,作为 的简单估计, = 是无偏的。YYyYE)y(对于简单随机抽样,1 R 不是无偏的 2 R 是近似无偏的第三章层-如果一个包含 N 个单位的总体可以分为“不重不漏”的 L 个分子总体,即每个单元必属于且仅属于一个子总体,则这个自总体为层。分层随机抽样三个条件:1 每层都抽样 2
4、 各层都独立地抽样 3 各层的抽样都是简单随机抽样先“比”后“加权”,此时得到的估计量称为分别比估计先“加权”后“比”,此时得到的估计量称为联合比估计先“回归”后“加权”,此时所得估计量为分别回归估计先“加权”后“回归”,此时所得估计量为联合回归估计各样本量分配方式:1 比例分配 2 最优分配 3 内曼分配 4 常数分配第四章整群抽样是将总体划分为若干群,然后以群为抽样单元,从总体中随机抽取一部分群,对入选群内的所有单元进行调查的一种抽样方法整群抽样具有的优点:1 抽样框编制得以简化2 实施调查便利,节省费用整群抽样不足-通常情况下,抽样误差较大群的规模是指群的单元的数量PSU 初级抽样单元S
5、SU 二级抽样单元整群抽样的估计效率与群内相关系数 密切相关c第五章不等概抽样实际工作中,还适用的情况如下1 抽样单元在总体中所占地位不一致2 调查的总体单位与抽样单位不一致3 改善估计量放回不等概抽样 -放回的与规模大小成比例的概率抽样(放回不等概抽样)PPS 抽样实施主要方法 代码法 拉希里法不放回不等概抽样,样本的抽取可以有以下方法1 逐个抽取法 2 重抽法 3 全样本抽取法 4 系统抽样法第六章系统抽样不同点:首先将总体的全部单元按某一已知变量排队,接着依照简单随机抽样方法从总体中抽取第一个样本点(随机起点),然后按某种固定顺序规律依次抽取样本点,构成样本。系统抽样的优点1 简便易行
6、2 系统抽样可以使样本单元在总体中分布均匀主要缺点:由于样本量有时不唯一,所有不存在严格意义上的无偏估计量,从而导致难以估计抽样误差圆形等距抽样与直线等距抽样的区别:1 编号不是直线排列而是环形排列 2 随机起点的选择范围由 1-k 扩展到了 1-N第七章二重抽样与两阶段抽样在概率上很容易混淆,两者都可以视为分阶段抽样方法,都是两重抽样与两阶段抽样的差异还是比较明显区别:1 二重抽样会对第一重样本进行调查,并利用2 二阶段抽样的第一阶段抽样单位和第二阶段抽样单位往往不同,而二重抽样则往往是第一重的子样本电话调查的抽样方法1 电话号码薄法 2 随机拨号法 3 综合法第八章辅助信息分类1 内部 2
7、 外部 内部辅助信息来自本次调查的情况1 目标变量之外的其他变量 2 为改进估计而专门设计的变量 3 访问员反馈信息外部辅助信息主要来自二手资料1 普查资料 2 前期调查资料 3 各级政府部门的统计数据 4 各企业单位的工作记录辅助信息的利用1 抽样设计 2 估计 (目标量估计) 3 数据调整设计效应可以起到简化问题的作用,主要表现在:1 对复杂样本的抽样设计效率进行比较 2 计算复杂抽样所需要的样本量简单随机抽样所需的样本量 ,复杂抽样所需样本量 n=n 丿 . deffn丿我们把一个样本单元所代表的总体单元的数量称为这个样本单元的设计权数。最终权数=设计权数*结构调整系数*无回答调整系数自加权设计是调查中每个样本单元的设计权数是相同的,也就是说每个单元的最终入样的概率是相等的。自加权设计与等概率抽样,等概率抽样是抽取样本是每个单元入样概率相等。区别:自加权要保证每个单元最终入选样本的概率相同(相对于最终结果而言)等概率抽样要求在一次抽样过程中,每个单元都有相同的入选概率。