第七章--选择研究对象-–抽样.ppt-道客多多

资源描述

1、第七章选择研究对象抽样,任何研究首先必须要有明确研究对象，然后才能根据研究对象收集资料。在教育研究中，研究对象通常是人，如：学生、教师、家长等，当然，研究对象还可以是与教育有关的现象与问题。选择研究对象是教育研究设计的主要内容之一，它不仅与研究目的、内容密切相关，而且还直接关系到资料的收集、整理、分析，同时它还涉及到整个研究的费用以及应用范围。一般来说，如果研究对象仅仅是个别的或少数人，通常不存在抽样问题，因为研究对象的总体差不多就是研究的直接对象。但是绝大多数研究课题设计的对象总体比较大，有时趋于无穷。要将课题规定的所有对象都拿来进行研究往往是难以做到的，也没有必要，因此需要选择部分的

2、研究对象，这样的程序和方法，用一个专业术语表示就是“抽样”。,一、抽样的基本原理抽样（Sampling）就是从一个总体（population）中抽取部分具有代表性的个体作为样本（sample），然后用这一样本的结果去推断总体。在这里，总体指研究对象的全体，样本是指从总体中抽取的部分个体。例如做汤，为了知道汤的咸淡，没有必要等到一锅汤喝完后再对汤的味道下结论，只需舀一勺汤品尝一下，然后根据尝的味道推断这锅汤的味道。在这里，一锅汤就是研究的的总体，而这一勺汤则是从总体中选取得到的样本。又如，我们要了解上海市小学三年级学生的识字量是多少？由于全市小学三年级学生数量巨大，不可能给每个学生都测量一下

3、，研究只能在上海市小学三年级学生总体中抽取部分个体对他们进行识字量测验，然后从得出的研究结果推断全市小学生的识字量。假设上海市小学三年级学生总体为100000人，从中随机抽取样本1000人，并对这1000人进行识字量测试，获得结果为平均识字量1600字，然后根据测试结果推断上海市小学三年级学生平均识字量为1600字左右。抽样的基本原理见下图：,抽样是以概率论为理论基础。抽样的作用是为了合理地减少研究对象，既可以节约人力、物力、时间，又可使研究力量相对集中，使研究工作深入、细致，从而提高研究的准确性和可靠性。一般来说，定性研究中抽取的样本很小，样本有时仅仅是一个案例或一个个体，研究目的是为了对

4、所研究对象进行更深入的了解。而定量研究的样本数较大，样本可以是一群个体，并要考虑样本能否准确代表总体，能否对总体作出推断。,二、抽样的基本要求抽样是有一定规则的，抽样的基本要求是： 1总体范围的确定抽样，首先要明确规定抽样的总体范围，一般来说，研究课题和研究目的决定了总体的范围。如，“上海市区初中学生身体素质的调查”这个课题的总体就是上海市区全体初一至初三的中学生，不包括郊县的初中生。如果总体范围不很清楚，在抽样前应对总体做出明确的规定。否则，会对抽取样本和研究结果的推断造成麻烦。通常研究课题的确立就已基本框定了总体范围，研究者要考虑的是为什么要确定该总体的理由，以及研究的预期效果和可行性

5、问题。 2抽样的随机化抽样要尽可能做到随机化（random）。随机化是指总体中的每个个体被选入样本的概率（probability）不为零。也就是说，总体中的每一个个体入选的机会均等。随机是科学研究的基本原则。抽样的随机化是一种精确而科学的过程，是科学研究结果可靠性的保证，可以避免研究者自觉或不自觉的偏见。抽签、摇奖就是根据抽样的随机化原理设计的。严格的抽样必须是随机的，这样可避免研究者的主观倾向或人为因素造成的抽样偏差（sampling bias）。 3样本的代表性样本的代表性指样本应具备总体的性质或特征，样本能在较大程度上代表总体。样本研究的关键在于抽样和推论，抽样是推论的先决条件，样本

6、的代表性会影响研究结论的可靠性和研究结论的推断程度。代表性越高的样本，其研究结果的普遍性就越大；反之，如果样本没有代表性往往会导致研究的失败。常为人引用的一个例子是：1936年美国的总统大选，当时美国的文学文摘杂志曾做了一次关于总统大选的民意调查，调查结果预测兰登将在总统选举中获胜，罗斯福落选。但事实正好相反，选举结果是罗斯福当选总统。虽然文学文摘杂志的民意调查样本数很大，但调查者的样本是从电话号簿和汽车登记册中抽取的。1936年正是美国经济大萧条过后，有汽车有电话的人仅代表了美国选民中的某个特定阶层，对于选民总体来说不具备代表性。这次民意调查的失败主要在于抽样偏差，样本没有代表性，抽取的样本

7、在质上与总体特征不相吻合。与此同时，盖洛普民意调查所也作了总统大选的调查，只发了2000份问卷，结果预测成功，罗斯福当选总统。后来盖洛普嘲笑文学文摘杂志说：“用两匹马来拉的车，用50匹马来拉是无用的。”,4.合理的样本容量样本容量又称样本大小，是指抽取样本的具体数量。样本数量的多少是研究无法回避的问题，是研究设计中重要的一环，也是比较困难的一件事。它既要符合研究目的、内容，满足教育统计的要求，又要考虑抽样的可能性，并使误差减少到最低限度。一般来说，样本数越多，代表性越好，但是增大样本，势必增加研究的人力、物力、财力，增加研究的难度，造成不必要的浪费。如果样本数太小，则抽样误差较大，样本不能

8、代表总体，不利于统计分析，影响研究效果。样本数量究竟多少为宜，这是一个复杂的问题。我们很难说出一个确定的数字，样本数量要从多个方面综合起来考虑。一般来说，样本容量大小取决于以下一些因素：（1）研究的类型、范围当研究是定量研究，研究范围较广，样本数量可适当大一些；反之，当研究是定性研究，研究范围较狭窄，样本数量可适当少一些。（2）研究分析的精确程度当研究要求有较高的统计显著程度，具有较高的可信程度时，样本数量可多些；反之，则可少些。（3）允许误差的大小当研究允许的误差值小，要求的可信程度高，所需样本容量相应要大；反之，则可小些。,下表示当总体趋于无限大时，不同的允许误差和可信程度要求

9、不同的样本数量。允许误差和可信程度与样本容量关系表,（4）总体的同质性当总体的变异性比较大，变量的相关程度比较低，研究的条件控制不严格，样本数量可适当增加些；反之，当总体同质性比较好，变量的相关程度较高，研究条件控制严格，则可少些。如，人的血液同质性比较好，医院化验只需抽取一点点血。学生的智力、能力变异性比较大，因此抽取样本相对比较大。（5）测量工具的可靠程度当测量工具的可靠程度即测定指标信度比较低时，测量的误差就比较大，这时需要增大样本数量；反之，则可减少样本数量。一般说来，有关学习能力和成就的测量工具可靠性程度好些，有关人格特质、自我概念、态度等方面的测量工具可靠程度差些。（6）

10、研究的成本研究的成本包括经费、时间、人力、物力，抽样数量总是要控制在研究成本允许的范围内。因此，确定样本容量时，必须仔细分析研究的条件，量体裁衣。（7）分析的类别当研究的关系复杂，分析的项目较多，那么样本数量可多些；反之，则可少些。一般应保证每一分析小类的样本数量不少于10。,以上七个方面都是原则性的意见，可作为决定样本容量大小的参考依据。下面根据实际经验提供一些可参照的数据：教育研究中的调查或描述现状的研究，样本数量最好不要少于100；相关性研究中，样本数量最好不少于30；实验研究中，每组样本数量最好不少于30；全国性的调查，样本数量控制在15002500之间；地区性的调查，

11、样本数量控制在5001000之间。当然，以上给出的数字仅仅供参考，在研究中具体样本数为多少，还需根据实际情况作出决定。对于初学者，不妨先查看有关文献中的同类研究，别人的样本数量是多少以作为参照。另外，我们还可以根据推算样本数量的公式计算出总体数量与样本数量的参照数据，见表7-2,从总体与样本数量的关系表中可以发现，样本数并不是随总体数量的增加而同步增加的。当总体数量不断增加，样本数量的增长逐步减缓，在总体数量与样本数量曲线图上呈一条负加速的增长曲线。见图7-2。由此可见，当总体大于10000，接近无限总体时，样本数量的增长微乎其微，在曲线图上几乎就是平走。,三、抽样的基本过程抽样的基本过

12、程从研究设计考虑抽取研究对象开始，到完成抽样获得实际样本为止，大约经历以下四个操作步骤： 1.研究对象或理论总体总体就是研究对象的全部。课题确立时的总体往往是虚拟的，是理论上的总体。如，进行一项有关10岁儿童生长发育的研究，如果期望以研究结果解释全世界的10岁儿童，那么理论总体就是全世界10岁儿童；如果期望以研究结果解释全中国的10岁儿童，那么理论总体就是全中国的10岁儿童；如果期望以研究结果解释上海市的10岁儿童，那么理论总体就是上海市10岁儿童；如果期望以研究结果解释某一学校的10岁儿童，那么理论总体就是某校的10岁儿童。由此可知，总体的范围可大可小，由研究者依据研究目的自行界定。如何界

13、定总体可以参考以下几点：（1）考虑并说明采用“特定群体”为总体的理由（为什么？理由何在？）（2）考虑并说明不采用“其他群体”为总体的理由（为什么？理由何在？）（3）考虑研究的预期效果（结果的推广程度）（4）考虑研究的可行性（研究的必要条件）,2.可获得总体或抽样框架理论总体往往是虚的，不是一个实在的、可操作的总体。而可获得总体则是实在的、具体的、可操作的总体。抽样框架是抽样单位的实际名单，样本就是从抽样框架中选取。如果一个学生样本是从学校的学生花名册中抽选，这个花名册就是抽样框架。比较复杂的抽样，抽样框架可以有不同的层次。如先抽取不同类型的学校，然后再从学校花名册抽取个体。通常确定课

14、题基本上规定了研究的总体，根据这个总体再去寻找可能的抽样框架，然后对这个抽样框架进行检验和评估，看这个抽样框架是否符合研究要求。 3.选择样本选择样本是指通过抽样方法得到的样本数量，是被选取参与研究的人员。这个样本数量只是理想上的数量。 4.实际样本实际样本是指实际参与研究的样本数量。如果进行问卷调查的话，实际样本相当于回收问卷的数量。例如，我们要对当前高中教师的教学理念的变化进行调查，理论总体是上海市所有高中教师，可获得总体是某个区的高中教师，抽样框架为该区的高中教师2000人，选择样本为300人，而实际样本即实际参与研究的教师为270人。在实际社会科学研究中，总体与抽样框架的问题并

15、未引起重视，一般来说，根据样本所得的研究成果只能代表组成抽样框架的总体，只能推断组成抽样框架的总体。在抽样过程中，确定样本的大小是一件重要的事，也是一件相当困难的事。样本太小，不能代表总体，也不利于统计分析；可是一旦增大样本，势必增加收集资料所需的人力、物力、以及时间等资源，而且庞大资料的整理与分析也较困难。研究者必须在两难中作出决断。,博格（W、R、Borg）与高尔（M、D、Gall）建议，在下列情况下要有较大的样本：研究中有较多的变量未于控制时预期效果可能由于研究变量的性质而较不明确时当研究样本必须再细分为次项目来分析时当预期会有较多被试退出研究时当总体的异质性较大时当测量工

16、具的可靠程度较低时当期望有较高的统计显著性或统计鉴定力时一般来说，样本容量不如样本的准确性重要，即使样本容量很大，如果选择不当，也会得出无效结论，因此谨慎抽样比增加样本容量更重要。,哈佛大学教育研究院的莱特（R.J.Light）等人以预设的的统计鉴定力来表示进行研究时所需要的样本人数，见下表：表7-3 以统计鉴定力推估样本人数表,表中左栏是研究方法的类型；表的第二栏是统计方法；第三栏是统计鉴定力，分为.90、.80、.70三个层次，研究者可以自行决定一个层次，鉴定力越大表示研究者期望辨识研究效果的可能性越大；最后一栏是预期的效果大小，包括小、中、大三个层次，研究者必须依据理论、经验、以及

17、先前类似研究的结果来判断并决定。例如，要比较12岁女生与18岁女生的身高差异时，我们判断其效果大小应属于“大效果”，因为经验上这两类女生的身高有相当大的差异；如果比较15岁女生和8岁女生的身高差异，则属于“中效果”；若比较17岁女生与18岁女生的身高差异，应属于“小效果”。如果以相关系数表示效果大小，那么相关系数在.1左右属于“小效果”，相关系数在.3左右属“中效果”，相关系数在.5以上者属“大效果”。从两组平均数差异来看效果大小，差异在.20个标准差者为“小效果”，在.50个标准差者为“中效果”，在.80个标准差者为“大效果”。如果我们要进行一项两种不同教学方法的比较实验研究，看哪种教学

18、法法效果好。首先，我们确定这是一个比较两组平均数差异（实验组与控制组之间差异）的研究；其次，我们设定统计鉴定力为.90（我们期望有较大的可能性确定研究效果）；并且进一步判断这类研究的效果应属于“大效果”（容易显示效果）。根据以上判断，从表上找到样本人数为68人，即实验组要有34人，控制组要有34人。如果将统计鉴定力降为.80，则样本人数为52人，如果将统计鉴定力再降为.70，则样本人数为40人。为了保证研究结果能在统计分析中明显显示，在实际研究中，样本数最好不要少于表中规定的人数。,四、抽样的具体方法教育研究一般都从总体中抽取一小部分个体作为收集资料的直接对象，这一小部分对象即为“样本”。抽

19、取样本进行研究，不但节省人力物力，也缩短资料取得与整理的时间，故成为教育研究的主要方式。抽样的具体方法多种多样，抽样的方法可以分为两大类：概率抽样和非概率抽样。概率抽样（probability sampling）是以“概率”为基础的抽样方法，它的核心技术为“随机样本”。主要抽样方法有：简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样等。概率抽样样本具有代表性，可以作推论，常用于正式的、量化的研究。非概率抽样（non-probability sampling）是根据研究者的主观判断、或根据客观条件的方便来抽样，不涉及概率原则。主要抽样方法有：方便抽样、目的抽样等。非概率抽样不具代表性

20、，通常不能推断总体，常用于非正式的、质化的研究。1概率抽样概率抽样就是研究总体中每个个体被抽取的概率是已知的，抽样方式是随机的。概率抽样常用于定量研究或大规模的正式研究中。具体的抽样方法有：（1）简单随机抽样简单随机抽样是概率抽样中最基本的，运用最广泛的抽样方法。它简便易行，是其他抽样方法的基础。简单随机抽样总体中的每一个体都有被抽到的同等机会，可通过抽签、随机数字表或摇号机摇号等来实现抽样。抽签。先给总体中的每个个体编上号码，每个号码做一个签，将全部的签充分混和后，随机从中抽取，被抽到签号的个体进入样本，直到取够所需样本数目为止。例如总体共50人，要抽取样本10人。我们先给总体编号，从1

21、-50，然后随机抽10个号，抽中号的个体即作为样本。简单随机抽样见下图：,例如要从总体800人中抽取100人的样本，先给800人从001-800编号，然后从随机数字表中任何一行，任何一列的任何数字开始，按任意方向依次取三位数（由于本例个体编号为三位数），凡是碰到001-800范围内的数字即为中选的号，直至取足100个号为止。其中如果某号大于800或已被抽取过再次出现，则跳过不算。例如从表7-4 随机数字表第18行，第1列开始向右取三位数，803（略去，因为超过800），270， 267，198，191，843（略去），429，081，349，268直到抽足100个号为止。这100个号的被试就构

22、成了该研究所需的样本。另外，功能较全的计算器都编有随机数字程序，可利用计算器的这一功能进行随机抽样。以卡西欧（CASIO）fx-3600 型计算器为例，操作过程为：开机后，按 INV 键和 .键，显示屏上出现三位小数,这三位小数就是随机数字,不断地重复按INV键和 .键，显示屏上就会不断地出现随机数字。用计算器随机抽取样本的基本程序与随机数字表的基本程序一样，直到取足样本为止。,（2）系统随机抽样系统随机抽样又称等距抽样或机械抽样，是把总体中的所有个体按某一顺序排列编号，然后依固定的间隔抽取样本。先随机确定第一个样本数后，根据样本与总体的比例，每间隔n个数抽取一个。例如，要从800名学生中抽

23、取100人作为被试，先将被试按序编号，再按公式计算抽样间隔的数字：800100 = 8，再从1-8中随机选定一个数字，假定为6，那么编号6，14，22，30，38，46798这100个号码的被试构成了系统随机抽样的样本。系统随机抽样使样本分配均衡，更具代表性，抽样误差较简单随机抽样小，操作也较简单，实际应用较广。系统随机抽样见下图：,（3）分层随机抽样分层随机抽样又称分类抽样或配额抽样，是将总体按某一标准分成若干层次或类别（子总体），然后以各层或各类在总体中所占比重，按比例随机抽取样本。例如对某校800个学生进行学习态度的调查，拟抽取十分之二的学生（160人）作为样本。首先按成绩评定标准将学生

24、分成优、良、中、差四层，优（160人），良（320人），中（240人），差（80人）。然后用简单随机抽样在这四层中按比例分别抽取样本，从优等中抽取1602/10=32人；从良等中抽取3202/10=64人；从中等中抽取2402/10=48人；从差等中抽取802/10=16人。这160人组成了分层随机抽样的样本。分层随机抽样确保每层子总体都被包容在抽样范围内，避免了某一子总体出现“超载”现象或出现意外样本。对于总体构成比较复杂，同质性程度不高，总体数量较大，各层次标志比较明显的情况下，宜采用分层随机抽样。分层随机抽样见下图：,（4）整群随机抽样整群随机抽样就是以自然群体（学校、班级等）为单位

25、，从较大的群总体中随机抽取样本，整群随机抽样与其他抽样方式的区别在于：它抽取样本的单位是群体，不是个体。例如要在某区初一年级进行一项研究，我们可以随机抽取几所学校，在这几所学校初一年级中再随机抽取两个班级作为样本，班中的所有个体都为被试。采用整群随机抽样比较方便，也切实可行。这种抽样不会因研究而打乱原有的班级，能兼顾到常规的教学秩序，不会影响师生之间的配合。整群随机抽样可以节省取样在人力、物力上的费用，最适合于总体范围大，抽样数量多的研究。但是整群随机抽样所获得的样本分布可能不均匀，群体间可能会存在差异，在一定程度上会影响样本的代表性。因此，当采用整群随机抽样时，要考虑群体和群体之间是否同质

26、。一般来说，按常态编班的班级，彼此间有较高的同质性，按能力分班的班级，同质性较低。,2、非概率抽样非概率抽样是指每个研究对象被抽取的概率是未知的，抽样方式不是随机的，样本通常是按研究目的而选择的。非概率抽样常用于定性研究或小范围的非正式的研究中。具体的抽样方法有：（1）目的抽样目的抽样是在研究情境不能运用随机抽样时，为达到研究目的，研究者根据自己的判断而选择样本的抽样方法。目的抽样与随机抽样的区别在于它们抽样的方式不同，它们运用的逻辑基础不同。随机抽样的逻辑基础是所选择的样本要有代表性，而目的抽样的逻辑基础是想掌握和了解样本的实际情况。目的抽样并非是随意的，样本的选择是以实现确定的目的、

27、准则为依据的。例如，记者的采访一般都采用目的抽样，不是以随机的方式获取被试，而是有目标地选择被试。虽然这样的研究结果不一定能推断到总体中去，但获取样本方便。（2）完全抽样完全抽样就是样本数量和总体数量完全一致。这是抽样的特例，通常在总体数量极少的情况下适用。例如，某校有8位因学业成绩特别差而留级的学生，研究者就将这8位学生全部作为样本进行研究。（3）异质抽样异质抽样就是抽取某些特征完全不同的、差异最大的个体为样本，目的是为了获得两类信息：一是不同个体之间的区别和差异；二是不同个体之间的共同之处。例如，要描述学校工作现状，研究者可选择学生特征、教师管理方式、所处社区环境以及其他统计特征都

28、不相同的学校作样本，也可选择反差最大的，处于问题两头的极端个案作为样本。采用异质抽样的研究常常是比较研究。（4）同质抽样同质抽样就是选择具有典型意义的、特征相近的个体为样本。与异质抽样相比，同质抽样走的是中间道路。例如，在一项研究中，既不选最好的学校，也不选最差的学校，而是选择中等程度的学校。这些学校的特征具有典型性和相似性，能代表大多数的普通学校。,（5）立意抽样立意抽样又称定标抽样，是研究者根据自己确定的标准，凭自己的经验和主观判断来决定所需样本。立意抽样注重样本质的方面，能针对性地研究某些问题，经济实用，但抽样的主观性较强。例如，对教师成长过程进行研究，选择那些得过奖的优秀教师为样本

29、。对儿童学习能力进行研究，选择那些超常儿童作为被试等。（6）方便抽样方便抽样又称随意抽样，指按研究者的需要和方便，利用现有的机会对偶然遇到的对象进行抽样。例如，研究者与某一学校的校长熟识，征得同意后，以该校学生作为样本。又如，抽取某次演讲的听众或正在图书阅览室看书的学生为被试进行调查。方便抽样简便易行，是为大家经常采用的方法，但它受研究者主观意志的支配，很难保证样本的代表性，对数据作出推论时必须非常小心。（7）关键案例抽样关键案例抽样就是选择一个可以对一个理论及其现象提供严格测试的样本。巴顿（Michael Patton）曾对关键案例抽样提供了一个很好的例子1。在伽利略的重力的研究中，

30、他想要探知物体的重量是否影响它降落的速度。为了能推广到世界上所有物体，他并没有随机抽取不同重量的物体，而是选择了一个关键案例羽毛。正如他演示的那样，如果在真空管中，羽毛与其他更重的物体（如硬币）以相同的速度下降，那么他就能从这一个关键案例研究的结果以符合逻辑的方式推广到一切物体。他的发现十分有用而且可信。教育研究中，很难会有像自然科学发现那样的精确结果，但是关键案例抽样的方法则有助于人们去探索决定性的案例，更进一步理解教育现象。假如决定性的案例成立，那么就有理由在更大范围推广这一研究结果。,（8）滚雪球抽样滚雪球抽样就是根据已有研究对象的建议或线索找出其他研究对象的累积过程。是先抽取目标群

31、体少数成员，然后向他们询问有关信息，再获得更多的研究对象。如了解学校社团组织招募人员的方式，可以先访问新近人员，向他们询问是谁介绍进这个组织的。然后再访问被提到那些人，询问他们是谁介绍加入组织的。样本像“雪球”一样越滚越大。这种方法常用在定性的实地调查研究中，或探索性研究中。选择研究对象是研究者必须面对的实际问题。具体抽样的方法，样本容量的大小，应根据研究的实际情况而定。一般来说，概率抽样不受抽样者主观意志的影响，能确切地定义样本，确定抽样概率，抽样误差比较小，并能从样本推断总体，为研究结果的准确性和可靠性提供保证。然而，概率抽样并非在任何情况下都是可行的，不同的研究目的要求不同的抽样方法与其

32、相适应。非概率抽样比较灵活，操作简单方便，不受统计原理框架的限制，但抽样的主观性较强，缺乏代表性。当运用非概率抽样时，代表性就不可能在概率的基础上进行讨论，只能在逻辑的基础上进行讨论。因此，在条件许可的情况下，应尽可能采用概率抽样。,五、避免抽样偏差抽样的目的就是要以具体的样本资料来解释总体的基本状态，因此要求样本资料能充分反映总体的真实情况，只有这样对研究结果的解释才确切可信。然而样本数据和总体实际之间会有差异存在，这种差异可以来源于两种原因：抽样误差（sampling error）和抽样偏差（sampling bias）。了解抽样误差的影响因素，把握抽样误差的来源，可以减少或避免误差的产

33、生，提高研究的质量。 1抽样误差抽样误差有广义和狭义之分，广义的抽样误差是指样本特征与总体特征之间的差异，不管差异来自何种原因；狭义的抽样误差专指随机抽样过程中，由于概率原理而自然形成的误差（在本文中我们取狭义的解释）。因为抽样误差是随机形成的，所以又被称为随机误差。例如，要了解上海市小学五年级学生英语学习状况，可以采用简单随机抽样的方法，抽取1000人的样本对试卷成绩进行分析，平均分数为75分，然后推断全市五年级英语成绩为75分。但是如果将全市五年级小学生英语试卷都拿来统计一番的话，可能全市平均分为73.5分或76.1分，这与1000人抽样获得的平均分之间的差异为抽样误差。由此可知，任

34、何随机抽样的过程，总是会有一定的抽样误差，这种误差总是存在的，是难以避免，难以控制的。一般来说，减少抽样误差的方法是增加样本数量，使抽样的标准误变小。 2抽样偏差抽样偏差是指抽样过程中有系统的偏离总体普遍特征的倾向，即样本没有代表性，与总体不同质，并且导致样本成为有偏差的样本。抽样偏差与抽样误差的区别在于抽样误差是随机形成的，误差是无法避免的；而抽样偏差则是人为因素造成的，是可以避免的。例如，前面提到的1936年美国总统大选，文学文摘杂志按汽车牌照和电话号簿登记地址抽样获取的样本，就是抽样偏差的典型例子。,要避免抽样偏差必须了解偏差的主要来源。一般而言，导致抽样偏差主要有三个来源1： 1不适

35、当的抽样方法一般非概率抽样所选择的样本往往是有偏差的样本，应避免使用。不要为了方便、省事，而导致最后结果无效。即使是概率抽样方法，如运用不当，也有可能形成抽样偏差。如，简单随机抽样未能按照抽样的随机原则行事；分层抽样的层次标准不明确，划分层次不妥当；等距抽样时没有注意总体的排列顺序是否随机；整群抽样时未能确定群体之间是否同质等。因此，在使用具体抽样方法时，要切实了解和掌握各种抽样方法的适用条件，结合研究总体的特点和结构灵活加以运用。 2自愿者参与研究自愿者构成的样本往往是有偏差的样本，因为自愿本身代表了某种倾向，代表某一类对象的特征。自愿者往往比非自愿者更积极努力，更投入，因此当采用自愿者

36、参与研究时，一定要了解自愿者的背景资料，以及与研究变量有关的特征，并分析这些特征对研究结果可能产生的影响，以此确定样本的取舍。罗森塔尔（Robert Rosenthal）和罗斯诺(Ralph Rosnow)的研究发现，自愿者与非自愿者的参与，对于研究结果存在差异。并将自愿研究者的特征概括为11种。自愿参与者大多数比不愿参与者受过更好的教育；自愿者大多数要比不愿参与者社会地位高些；自愿者比非自愿者大多聪明；自愿者比非自愿者更渴望得到社会认同；自愿者比非自愿者更加善于交际；自愿者比非自愿者更易引起注意；自愿者比非自愿者更具开放性；女性比男性更易自愿参加一般性的研究；自愿者比非自

37、愿者少一点权威主义色彩；犹太人比新教教徒更乐意参加；参与一般研究时，自愿者不及非自愿者来得顺从。当研究采用自愿者被试时，应仔细考虑以上11种自愿参与者的特征；这些特征与研究变量有多大相关？自愿者与非自愿者特征上的差异将怎样影响研究结果？具体操作应更多地考虑怎样使样本具有代表性。,3、样本流失现象在实际研究过程中，常常会有部分被试由于种种原因中途退出研究，或未给予回应（如未填写问卷，未接受访问）导致原来计划获得的样本数量减损，从而使样本失去代表性。通常样本流失大多具有特殊的原因，有可能代表了某种意见或倾向，如果将这些人从样本中剔除，那将使研究样本失去具有某种意见或倾向的个体，使样本成为有

38、偏差的样本，导致研究结果不具有普遍性。典型的例子是1936年美国总统大选，文学文摘杂志预测失败的原因，除了样本有偏差，还有一个原因是问卷回收率太低。调查共发了1000万份问卷，最后回收仅200万份，占应回收样本的20%。一般问卷调查的回收率要求达70%以上，少于50%要考虑放弃调查。对于样本流失，研究者一方面可以从研究工具和实施程序的改善着手，力求减少被试的心理负担和时间压力，避免引起被试的反感和抗拒；另一方面可以做些补救措施，对流失者追踪，继续寄送问卷、电话联系，鼓励回应等。总之要适当运用抽样方法，避免抽样偏差，使样本具有代表性。研究设计中的抽样是一项技术性较强的内容，也是研究者为获得准确可靠的信息所必须认真考虑的问题。能否正确抽样，能否合理的选择研究对象，是对研究人员综合能力的挑战和考验。以下一些情境是在抽样时需要避免的：抽样时仅仅考虑方便就确定研究对象。所选择的样本对总体没有代表性。具体抽样的方式不适合研究目的。没有详细说明样本的特征，使人无法推知样本代表的总体。定量研究中随意选择样本容量。没有考虑自愿参与者与非自愿参与者的不同以及对研究结果的影响。抽样方式与研究类型不吻合。,

展开阅读全文