分享
分享赚钱 收藏 举报 版权申诉 / 35

类型第四章------选取样本.ppt

  • 上传人:无敌
  • 文档编号:109365
  • 上传时间:2018-03-13
  • 格式:PPT
  • 页数:35
  • 大小:193.52KB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第四章------选取样本.ppt
    资源描述:

    1、第四章 选取样本,选取样本,授课内容,概述概率抽样非概率抽样,第一节 概述,1.1、抽样调查的概念及特点1.2、抽样的术语与程序,1.1、抽样调查的概念及特点,一. 抽样调查的概念 抽样调查就是从研究对象的总体中选择一部分代表加以调查研究,然后用所得的结果推论和说明总体特征,这种由总体中选取一部分代表的过程就是抽样,所选取的这一部分代表就称为样本. 选取样本的方法分为两大类: 一类是依据研究任务的要求和对调查对象的分析,主观地,有意识地在研究对象的总体中进行选择.叫非概率抽样,主要用于案例研究. 另一类是依据概率理论,按照随机原则选择样本,完全不带调查者的主观意识,称为概率抽样,主要用于以调查

    2、为基础的研究.,1.1、抽样调查的概念及特点,二.抽样调查的特点与普查相比具有如下特点: 1. 调查费用较低. 2. 速度快 3. 应用范围广 4. 可获得内容丰富的资料 5. 准确性高,1.1、抽样调查的概念及特点,三 抽样调查的理论依据 部分包含于整体之中,部分与整体有同样的特征,现象,关系及过程. 抽样调查的成功与否首先要求所选取的样本能够代表总体, 既所抽取出来的样本的总特征能够再现总体的结构.怎样能够保证呢?概率抽样.,1.2、抽样的术语与程序,一,抽样的基本术语1.总体(population) 总体通常与构成它的元素(element)共同定义;总体是构成它的所有元素的集合,而元素则

    3、是构成总体的最基本单位.总体中所包含元素的数目通常用大写字母 N 表示.2.样本(Sample) 样本就是从总体中按一定方式抽取出的一部分元素的集合如从某省总数为12.8万的大学生总体中,按一定方式抽取出1000名大学生进行调查,这1000名大学生就构成该总体的一个样本.样本中的元素数目通常用小写字母 n 表示.,1.2、抽样的术语与程序,3 抽样框(Sampling Frame) 抽样框也叫抽样范围,是指一次抽样时总体中所有个案(元素)的完整清单.4 参数值( Parameter ) 也称总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现.在统计中最常见

    4、的参数值是总体某一变量的平均数, 需要注意的是,参数值只有对总体中的每一个元素都进行调查或测量才能得到.,1.2、抽样的术语与程序,5 统计值(Statistic) 统计值也称为样本值,它是关于样本中某一变量的综合描述.或者说是样本中所有元素的某种特征的综合数量表现.统计值是从样本中计算出来的,它是相应的参数值的估计量,比如样本平均数就是总体平均数的估计量。参数值和统计值的区别是:参数值是固定不变的,唯一的,通常是未知的,而统计值是变化的,即,对于同一个总体来说,不同样本的统计值是有差别的,对于任一特定样本来说统计值是已知的,可计算的,从统计值推论参数值,正是社会调查的一项重要内容。,1.2、

    5、抽样的术语与程序,6 置信度(Confidence level)与 置信区间 (Confidence Interval)置信度也称为置信水平,它是指总体参数值落在样本统计值某一区间内的概率,或者说是总体参数值落在样本统计值某一区间中的把握性程度.它反映的是抽样的可靠性程度. 置信区间指的是样本统计值与总体参数值之间的误差范围,置信区间反映的是抽样的精确性程度,比如,从某一机关一万名干部中抽取200人为样本,调查其平均工资,若样本的平均工资为100元,那么总体平均工资落在95-105元这一区间的概率可能为96%(误差为5元),落在90-110元这一区间的概率可能为99%(误差为10元)可见,置信

    6、区间越大,即,误差范围越大,置信水平越高,抽样的精确性程度就越低,反之,置信区间越小,误差范围越小,抽样的精确性程度就越高.,1.2、抽样的术语与程序,二 抽样的程序 在总体中抽取一个样本时,总要尽可能地使样本具有代表性.如果样本的统计值近似总体的参数值,则这个样本可以称为一个代表性样本.(representative sample).问题是怎样做才可以减少抽样的误差,求得一个有代表性的样本呢? 这就要依据下面的四个步骤:,1.2、抽样的术语与程序,1 界定总体根据调查的目的要求,确定调查对象的范围,包括时间,地点和人物,例如我们要研究北师大大学生生活态度,可以界定总体的范围如下,2011年北

    7、京师范大学大一至大四的在校本科大学生.总体的定义越清楚越好,由样本所得的研究结果,原则上只能推论到这个所界定的总体范围.,1.2、抽样的术语与程序,2 确定抽样框在应用之前必须审核其完整性和准确性,例如,有无遗漏,有无列于名单上但实际上不存在的个案,有没有重复或不属于研究范围的等等.,1.2、抽样的术语与程序,3 设计和选取样本确定样本的数量. 决定样本的大小时,必须同时考虑抽样误差和研究代价.如,抽样框中有三万大学生,不可能全部调查,要抽取多少个案来进行研究呢?在正常的情况下,样本越大就越有代表性,但是样本越大,所需的研究代价就越大.选择抽样的具体方法 抽样方法有许多种,不同的方法产生的样本

    8、代表性是不同的.,1.2、抽样的术语与程序,4 样本评估 在样本抽出后,需采用各种调查方法对样本进行实际调查以收集资料,最后对收集到的资料进行计算并将结果推论和说明总体. 在开始调查之前要对样本进行评估,评估的目的是初步检查样本的代表性,以免由于前面步骤中的失误使样本偏差太大, 评估样本:收集若干容易得到的资料以进行总体和样本之间的比较. 如果样本与总体的情况相似,这样的样本就有代表性,如果两者资料相差甚多,则表明前面的抽样步骤有问题要检查,修正.,内容,第一节 概述第二节 概率抽样第三节 非概率抽样,概率抽样包括:,简单随机抽样系统抽样分层随机抽样整群抽样多阶段抽样,第二节 概率抽样,含义:

    9、总体内的所有个体具有相同的被抽入样 本的确定性的机会。分类:简单随机抽样,等距抽样,分层抽样,整 群抽样,以及多阶段抽样.应用:概率抽样适合以调查为基础的研究。,第二节 概率抽样,简单随机抽样 简单随机抽样对总体中的所有个体按完全符合随机原则的特定方法抽取样本,既抽样时不进行任何分组,排列,使总体中的任何个体都同样有被抽取的平等机会,对总体中的所有份子一视同仁,毫无例外.小总体时: 抓阄,抽签, 较大总体时: 随机数字表.,第二节 概率抽样,等距抽样 也叫系统抽样或机械抽样.它是简单随机抽样的一个变体,具体做法是: 1.将总量的所有个体按一定顺序排列. 2.计算抽样距离.距离是由总体数目与样本

    10、数目决定的.如果总体数为N,样本数为n,则抽样距离应是: N K= n 3.在K个个体中,用完全随机的方法抽取一个个体,设其所在的位置的序号为K 4.自 K 开始,每隔K个抽取一个体,依次抽取的位置序号为k.,k+k. k+2k ,k+k. k+2k,k+(n+1)k。,第二节 概率抽样,等距抽样是以总体的随机排列为前提的,如果总体的排列出现有规律的分布时,会使等距抽样产生极大的误差,降低样本的代表性. 等距抽样最适用于同质性较高的总体。当总体内个体类别之间的数目悬殊过大时,样本的代表性可能较差,在这种情况下应采用另一种抽样方法.,第二节 概率抽样,分层随机抽样 分层随机抽样是将总体依照某一种

    11、或某几种特性分为几个子总体,每个子总体称为一层,然后从每一层中抽取一个子样本,将这些子样本合在一起即为总体的样本. 分层抽样适用于总体内个体数目较多,结构比较复杂,内部差异较大的情况.,第二节 概率抽样,整群抽样 是将总体按照某种标准划分为一些子群体,每个子群体作为一个抽样单位,用随机的办法从中抽取若干子群,将抽出的子群中所有个体合在一起作为总体的样本. 分层抽样是在所有子群中均抽取一个子样本作为总体样本的一部分,而整群抽样是抽取若干子群,并将抽出的子群中全部个体作为样本,总体样本只分布在几个群中. 所以整群抽样的分群标准要求群间异质性低,群内异质性高.适用于界定不清的总体.,实例: 整群抽样

    12、,希瑞需要选择一个样本,通过访谈形式调查复印机的使用情况。由于支付差旅费和有关的数据收集费用有限,她决定根据当地行政区域划分访问四个区域性公司。所有当地行政区域清单构成她的抽样框。每一个当地行政区域用唯一的数字表示,第一个区域为0,第二个为1,以此类推。从当地行政区域抽样框中选取了四个样本群。希瑞的样本是选中样本群中的所有公司。她认为合适的电话簿会提供每个样本群中所有公司的名单。,第二节 概率抽样,多阶段抽样 在整群抽样中,当子群数和子群内部个体数目较多,而彼此间的差异性不太大时,常常采用更加经济的方法,即,不将样本子群中的所有个体作为样本,而是再从中用随机抽样的方法抽出最终样本.因最终样本的

    13、获取经过两次抽样,我们称之为二阶段抽样,同样地可进行三阶段,四阶段,即多阶段的抽样. 它通常在第一阶段使用严格的随机抽样方法,而从第二阶段起使用概率比例抽样,即根据每一群所含个体的多少分配样本名额.,实例:多阶段抽样,例如,某市有23个区,共714万人,从中抽取1000人的样本,将区作为初级抽样单位,每区人数不等,把每区人数的号码范围列出,东区是1-120000号,西区是120001-270000号.一直排到7140000号.从这些号码中用随机数字表确定10个号码,则这10个号码所落入的区即为调查区.如抽中340000号,它落在南区,则南区为调查区,从这10个调查区中,每区再随机抽取100人就

    14、构成最终样本. 多阶段抽样特别适用于调查范围大,单位多,情况复杂的调查对象,但多阶段抽样由于在每一阶段抽样是都会产生误差,因此经多阶段抽样得到的样本的误差也相应增大.这是它的不足之处.,内容,第一节 概述第二节 概率抽样第三节 非概率抽样,非概率抽样包括:,偶遇抽样主观抽样配额抽样滚雪球抽样,第三节 非概率抽样,概率抽样能够排除调查者的主观影响,抽选出代表性的样本,并能够确知和控制抽样误差的大小, 但是在很多情况下,这种严格的随机抽样很难进行,例如,由于调查对象的总体边界不清,无法编制随机抽样所应具备的抽样框,因而无法进行随机抽样. 有时调查的目的仅仅是对问题做出探索,获得研究的线索和提出假设

    15、,而不是由样本推论总体,在这种情况下一般代之以非概率抽样.,第三节 非概率抽样,非概率抽样是基于主观判断的抽样,操作方便,省钱省力,统计上也比概率抽样简单,而且能对调查总体和调查对象有较好的了解,抽样也可获得较大的成功. 但是非概率抽样由于排除不了调查者的主观影响,以致无法说明样本是否体现了总体的结构,所以,将非概率抽样的结论推论到总体时要极其慎重,否则就容易出现以偏概全的错误. 非概率抽样主要有偶遇抽样,主观抽样,定额抽样,滚雪球抽样等. 非概率抽样主要应用于案例研究。,第三节 非概率抽样,偶遇抽样 是指研究者将其在一定时间内,一定环境里所能遇见或接触到的人均选入样本的方法.“街头拦人”。由

    16、于是依据调查者的方便任意选取样本,也称为方便抽样. 偶遇抽样的优点是方便省力.但是样本的代表性差,又很大的偶然性.,第三节 非概率抽样,主观抽样 它是调查者根据研究目标和自己主观的判断来选择和确定调查对象的方法. 这种样本的代表性取决于研究者对总体的了解程度和判断能力,当总体规模小,所涉及的范围较窄时样本的代表性较好, 当总体大范围广,代表性将显著降低. 它的作用在于发现问题,提出假设,而不在于对总体做出概括.,第三节 非概率抽样,配额抽样 它与分层随机抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层所占的比例与它们在总体中所占的比例一样.但不同的是,分层抽样中各层子样本是随机抽取的,而定额抽样中各层的子样本是非随机抽取的. 定额抽样是以代表总体为目的的,因此必须对总体的性质有充分的了解.适用于访问性调查。,第三节 非概率抽样,滚雪球抽样 当我们无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道那些符合条件的人,再去找越来越多具有相同性质的群体成员,小结,第一节 概述第二节 概率抽样第三节 非概率抽样,

    展开阅读全文
    提示  道客多多所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第四章------选取样本.ppt
    链接地址:https://www.docduoduo.com/p-109365.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    道客多多用户QQ群:832276834  微博官方号:道客多多官方   知乎号:道客多多

    Copyright© 2025 道客多多 docduoduo.com 网站版权所有世界地图

    经营许可证编号:粤ICP备2021046453号    营业执照商标

    1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png



    收起
    展开