1、第二章 心理实验的变量与设计,主要内容: 一、实验设计的概念 二、实验设计的内容 三、实验设计的基本类型 四、实验设计的基本类型,一、实验设计的概念,实验设计乃是进行科学实验前做的具体计划。它主要是控制实验条件和安排实验程序的计划。,二、实验设计的内容,实验设计的目的在于尽可能减少额外的或未控制的变量,从而增加实验产生有效的一致结果的可能性。实验设计是实验成功的关键。从实验变量角度,实验设计涉及三个基本问题: (1)实验采用多少自变量和因变量?(2)各自变量内又采用多少处理水平?(3)如何将被试分配到各自变量的各处理水平中?,实验设计的流程图,自变量,被 试,因变量,额外变量,实验设计的类型,
2、自变量,被试,因变量,额外变量,单因素, 多因素 设计,完全随机,随机区组,拉丁方设计,单元 ,多元设计,根据对无关变量控制的方式的不同可以划分为:完全随机设计;随机区组设计;拉丁方设计,几个概念,因素:自变量,是研究者通过操纵、改变它,来估价它对因变量的影响。 水平:实验中所操纵的变量的每个特定的值叫因素的水平。 处理与处理水平的结合:实验中一个特定的、独特的实验条件。 自变量有A、B。每个自变量有两个水平。 A1 B1;A1B2; A2 B1 ,A2 B2,主效应:可考察各个自变量对同一因变量的主要影响效应。 交互作用:如果在一项有两个或两个以上自变量的实验里,一个自变量的效果,在另外一个
3、自变量的每一水平上不一样,这就叫自变量的交互作用 简单效应:当出现交互作用后就需要考察自变量之间的具体作用,这就是简单效应,即一个自变量的各个水平在另一个因素的某个水平上的效应。,三、实验设计的基本类型,根据实验中要操纵变量的多少: 单因素实验设计 多因素实验设计 根据在各种自变量及各种处理水平中是否用相同被试: 被试内设计 被试间设计 混合设计 从对实验控制条件的严密程度的不同: 真实验设计 准实验设计 非实验设计,(一)被试内设计,也叫单组实验设计(within-subjects design),是每个被试须接受自变量的所有情况的处理。 基本原理:每个被试参与所有的实验处理,然后比较系统被
4、试在不同处理下的行为变化。 在实验研究中,如果实验者主要想研究每一个被试对实验处理所引起的行为上的变化,可考虑采用被试内设计。 被试内设计可分为两种子类型:1、抵消实验条件的设计。2、重复测量。,1、抵消实验条件的设计,指抵消实验过程中无关变量的一种设计。 有些无关变量在某些实验情况下既不能被消除,又不能保持恒定。例如,单组实验往往由于前一处理影响后一处理的效果,产生顺序误差。为了抵消顺序误差,最简单的方法就是用ABBA的排列顺序来安排实验顺序。,ABBA设计,适用于自变量水平只有两个(分别用A和B表示)时的情况。 被试按照ABBA的顺序接受4次实验处理。,抵消实验条件的设计模式,ABBA设计
5、举例,鲍尔(Bower,1961)曾经以老鼠来研究奖赏对反应形成的影响。实验的任务是让老鼠走迷津,自变量是奖赏量。 实验中,每只老鼠都要接受两种奖赏水平的处理:A是走完迷津得到8粒食物,B则是得到1粒食物。 如果研究者先进行所有的A实验,然后接受所有的B实验,或者反过来,都会导致奖赏量和实验顺序本身发生混淆。 所以尝试以ABBA的顺序进行以消除顺序效应。,抵消实验条件的设计评价,优点: (1)能较好地控制被试变量; (2)能较好地控制顺序误差; (3)时间上比较经济。 缺点: (1)反应变量在时间维度(轴)上的关系是线性时才能使用。 (2)对有些实验不适用。如用两种学习方法学习同一实验材料。,
6、拉丁方设计分配材料,当自变量的水平有两个以上时,平衡的拉丁方设计是较为常见的设计。一个平衡的拉丁方设计是一个两维矩阵,其中列表示自变量水平,行表示被试。 例:文章六种生字密度:5:1,10:1,15:1,20:1,25:1,30:1。因变量:阅读理解测验分数。,自变量有六个水平的拉丁方设计的标准块,随机块,2、重复测量 重复测量一个因素设计基本模式,实验设计:一个研究要探讨文章的生字密度(4个水平:5:1,10:1,15:1,20:1 )对学生阅读理解的影响。被试8名。研究假设阅读理解是不是随着文章中生字密度的增加而降低。,重复测量两个因素实验设计举例,学生采用不同学习方式学习不同类型单词是否
7、有差异? 学习方式:分散集中;单词类型:复杂简单,(二)被试间设计,被试间设计是要求每个被试(组)只接受一个自变量的处理,对另一被试者(组)进行另一种处理,故又称独立组设计。 由于每个被试只接受一种处理方式,因此一种处理方式不可能影响或污染另一种处理方式。但问题在于:被试间的差异如何控制?等组(被试同质问题) 为了达到等组,被试间设计采用两类分组技术:随机组设计和配对组设计。 被试间设计的统计检验独立样本的差异显著性检验。,1、随机组设计,将被试随机分配在不同的组内接受不同的自变量处理。 随机组设计的基本假设是将被试随机分配到不同的组,若对各组用同一样的课题,在系统的条件下进行测量,其结果就成
8、为系统组,则他们的成绩在统计上应是相等的。 教学方式对成绩没有影响。,随机组设计的优缺点,优点是:(1)用随机分配被试者的方法可控制两组被试者变量的差异,分组方法简单可行。(2)由于对每一被试者只作一次观测,可消除某些实验误差,如消除学习误差的影响。 缺点是:(1)分成等组的方法仍欠精密。(2)若两组在不同时期观测,就有可能插入实验以外的偶发事件,影响因变量的观测结果。,2、配对组设计,也叫对等组设计、匹配组设计,是随机组设计的一种扩展。目的是使各组的特性更加相同。这种设计可以控制组内变异和组间变异。 匹配被试就是对全部被试进行预备测验,测验的性质与正式实验的性质是类似的,或者说是相关的,然后
9、按测验成绩均匀地形成组。 教学方式对成绩没有影响,智力作为控制因素。,配对组设计的步骤,第一步:让所以被试做“共同作业”,即接受预备测验,获得作业分数; 相同任务:如打靶;根据打靶成绩进行分组; 类似任务:如问题解决不同种类问题解决; 相关任务:如智力测验问题解决。 第二步,根据作业分数形成配对组。,配对设计的优缺点,优点:在实验处理之前,就把组间变异缩到最小,并使各组内变异比单独的随机分配更接近相等。因此,这种设计能对被试个别差异给予更多的控制,小型实验用配对设计,其效果比用随机分组的效果更为显著。 缺点:实验者因分配被试而大大增加工作量。,被试内和被试间设计比较,被试内设计:也叫单组实验设
10、计,是每个被试须接受自变量的所有情况的处理。被试间设计:被试间设计是要求每个被试者只接受一种实验处理,对另一被试者进行另一种处理,故又称独立组设计。,(三)混合设计,混合设计是指在一个研究中有些自变量按组内设计安排,有些自变量按组间设计安排。一般说来,如果一种自变量很可能会影响另一种自变量,那么对这些自变量按组间设计安排,其余的自变量按组内设计安排。,混合设计举例一,Johnson等(1983)用混合设计的方法比较抑郁者和非抑郁者的记忆成绩。 他们假设,抑郁者比非抑郁者对于未完成的记忆任务的记忆效果更好。 实验中,要求抑郁组和非抑郁组完成20项记忆任务,其中,10项记忆任务在完成之前被打断。在
11、全部任务完成后,要求被试回忆记忆任务的名称或尽可能多地描述记忆任务。,比较,被试变量是组间设计(抑郁、非抑郁) 任务类型是组内设计(完成、未完成)。,混合设计举例二,让被试以不同的背诵方式对一系列意义上没有联系的3个英语单词为一组的材科进行加工,背诵的次数也不相同。 背诵方式有4种,产生了4种实验条件: (1)数字条件。(2)机械背诵。 (3)造句背诵。(4)想象背诵。背诵次数分别为1,2,4,8,10次,每次背诵时间为2秒。,混合设计,背诵方式为组间设计:所有被试分成4组,每组被试只用一种方法背诵。 背诵次数为组内设计:但在每种背诵方式下,背诵次数都有1,2,4,8,10五种每个被试都要按随
12、机安排的顺序轮流进行这五种不同次数的背诵。,实验程序,1、选择被试 2、被试分组 3、安排被试接受哪些实验处理 4、分组实验,A、B、C、D四组,A组:数字条件 B组:机械背诵 C组:造句背诵 D组:想象背诵,四、实验设计的基本类型,(一)真实验设计 (二)准实验设计 (三)非实验设计,(一)真实验设计,真实验设计对实验条件的控制程度要求 较高,在使用这类实验设计时,实验者可以有效地操纵实验变量,能有效地控制内在无效来源和外在无关因素的影响,能在随机化 原则基础上选择和分配被试,从而使实验结果更能客观地反映实验处理的作用。,真实验设计类型,单因素完全随机设计多因素完全随机设计单因素随机区组设计
13、多因素随机区组设计,完全随机,随机区组,1.完全随机设计,完全随机化设计也称简单随机化设计,是指用随机化方法将 被试随机分为几组,然后依实验的目的对各组被试实施不同的处理。,(1)单因素完全随机设计,单因素完全随机设计是指研究者在实验中只操纵1个自变量,并采用随机化的原则把被试分配到自变量不同水平上的一种实验设计。 1.随机实验组控制组前测后测设计 2.随机实验组控制组后测设计 3.随机实验组控制多组后测设计 4.所罗门四组设计,实验研究的符号系统 RRandom随机选择与分配被试 G(S)被试组,用下标表示组别 X自变量,即实验处理,用下标表示不同自变量水平,即不同处理 OObservati
14、on观测值,用下标表示各项观测结果 表示对控制组未给予实验处理,或给予实验组相对照比较的条件 MMatching匹配,已按随机化方法在处理之前将被试匹配分组,实验组控制组前测后测设计,R1,X,O2,O1,R2,-,O4,O3,例 教学训练对标题预测内容的能力影响,实验组,内容预测2,方法训练,内容预测1,控制组,内容预测4,常规训练,内容预测3,评价,随机实验组控制组前测后测设计基本控制了绝大多数影响内 部效度的因素。 这是因为该设计采用随机布置的方法将被试分为两组,从而可以控制选择、被试的中途退出以及选择与成熟的交互 作用等因素对实验结果的干扰。 另外,由于安排了实验组和控制组,在实验过程
15、中,发生在前测到后测这段时间内的事件对实验组控制组的影响基本相同,因而可以控制历史、成熟、测验、仪器使用 等影响内部效度的因素对实验结果的影响。 该设计使用了前测验它为检查随机分组是否存在偏差提供了充分的 依据但它也带来了不利的一面,即被试由于前测验而获得的经验,可能对后测验产生敏感性,出现测验的反作用效果,导致对实验设计外部效度的影响。,实验组控制组后测设计模式,R1,R2,X,O1,-,O2,差异?,注意:独立样本T检验来进行差异判断。,例 观看暴力电视对攻击行为的影响.,实验组儿童,控制组儿童,看暴力电 视,攻击次 数,-,攻击 次数,差异?,实验组控制组多组后测设计模式,R1,R2,X
16、1,O1,X2,O2,差异?,注意:F检验来进行差异判断,R3,O3,-,例 电视内容对攻击行为的影响.,实验1组儿童,实验2组儿童,看暴力电视,攻击次数,看助人 电视,攻击次数,差异?,控制组儿童,-,攻击次数,注意:F检验如有显著差异,则还需进一步多重比较。,评价,1 采用随机选取和分配被试的方法,可以控制选择,被试消亡以及选择和成熟的交互作用. 2 安排实验组和控制组,可以控制历史,成熟,仪器的使用等因素对实验的干扰. 3 不进行前测,可以消除练习,熟悉和疲劳效应.,设计的显著性检验,随机实验组控制组后测设计使用的统计分析方法比较简单。 大部分研究者使用F检验对两组后测成绩进行比较研究;
17、非参数检验也常使用曼-惠持尼U-检验或中位数检验法。,设计的显著性检验,其一是对增值分数进行统计分析。方法是对每一名被试,用其后测成绩减去前测成绩(O2-O1,O4-O3), 分别求出两组增值分数的平均数。对两组增值分数进行显著性检 验的方法有:t-检验(参数统计);曼惠持尼(MannWhitney)U-检 验或中位数检验(非参数检验)。 另外,还有协方差分析法,这种方法被研究者认为是很好的方法。此方法是将前测分数作为协变量,对实施实验处理前的组间差异进行控制和调整,以便使两组的后 测成绩能够比较不受前测成绩的影响。,所罗门四组设计,这一设计实际上是上述等组前后测设计和等组后测设计的综合,是由
18、所罗门(Solomon,1949)首创,故称为所罗门四组设计(Solomon four group designs)。 这种设计包含有两个实验组和两个控制组,四组受试者均由随机方法选择而来。其中,有两个组接受前测,两个组则无。实验处理后,四组均接受后测。 实验效果的测定,可用相关样本或独立样本的Z检验或t检验(N30用Z检验,N30用t检验)的方法,检验下列四种平均数的差异显著性: 第一组前测和后测平均数的差异(O2-O1); 第一组和第二组后测平均数的差异(O2O4); 第三组、第四组后测平均数的差异(O5O6); 第一组、第二组前测平均数和第三组后测平均数的分别差异(O5O1或O5O3)。
19、,统计检验方法,统计检验方法,如果上述四个差异的检验都获得一致性的效果,研究者将更有信心确定是实验处理产生了效果。因为这等于重复做了四次实验(若以有前测和无前测比较,则等于重复做了二次实验)。 有关前测经验的单独效果之检验,可比较第二组和第四组后测平均数的差异(O4O6)。 可以控制和测量前测的主要效果,可以控制和测量前测与实验处理间的交互作用效果(通过第一组和第三组的比较),可以测量“成熟”和“历史”的综合影响效果(根据第四组的后测平均数O6和第一、二组的个别前测平均数O1、O3的比较)。可见,这种设计是最严谨控制的实验设计之一。 由于有四个组,需要大量的样本,研究者须付出很大的代价,缺乏实
20、用性。因此,在一般的教育研究中,这种设计的应用并不广泛。,(2)多因素完全随机实验设计,研究者在同一个实验里同时操纵2个或2个以上自变量,并把被试完全随机地分配到各个处理的组合中,以观察自变量以及自变量之间交互作用效果的实验设计.,多因素实验设计是指在实验中包括两个或两个以上因素(自变量),并且每个因素都有两个或两个以上的水平,各因素的各个水平互相结合,构成多种组合处理的一种实验设计,又称完全随机析因设计。 在完全随机析因设计中,研究者可以考察各个自变量交互作用对因变量的主要影响效应(交互作用),并同时考察各自变量对同一因变量的主要影效应(主效应),以及考察一个因素的各个水平在另一个因素的某个
21、水平上的效应(简单效应);在心理学的实验研究中,这种设计具有很大的实用价值。,多因素实验的优点,多自变量实验具有个明显的优点: 第一,做一项有两个或两个以上自变量的实验,比分别做两个或两个以上的实验效率要高; 第二,做一项实验比分别做两个或两个以上的实验,易于保持额外变量的恒定; 第三,是最重要的,在几个自变量同时并存的情形下所概括的实验结果,比从几个单独实验所概括的结果更有价值,更接近生活实际。 第四,可以分析交互作用。,关系示意图,因素,水平,A1B1(O1),A2B1(O3),A1B2(O2),A2B2(O4),主效应,O1-O2与O3-O4O1-O3与O2-O4,交互作用,A,A1,A
22、2,B1,B2,B,例 治疗方法和治疗时间对效果的影响,“虚无”结果,因素主效应,治疗时间主效应,因素主效应,治疗方法主效应,主效应,治疗时间和治疗方法的主效应,交互作用,有交互作用,交互作用,无交互作用,思考题?,答:B有主效应,思考题?,答:A有主效应,思考题?,答:无效应,思考题?,答:A,B有主效应,思考题?,答:A,B无交互效应,练习题 假设我们进行一个简单的双自变量实验(A、B),每一个自变量都有两种水平(1、2)。下面是实验做完后得到的每种实验条件的平均值。在左边矩阵图中是一种假设的结果,右边是另一种假设的结果。例如:性别和材料性质对记忆效果的影响,其中A1为男,A2为女,B1为
23、抽象材料,B2为具体材料。下表结果一种代表可能结果。,解释: 在左边,我们认为两自变量没有交互作用,之所以下这样的结论是因为B因素的效果在A1和A2上都相等:一个变量的效果没有因另一个自变量的水平不同而改变。在图中,一般线是平行的时候,表示没有交互作用发生。在矩阵图中,纵行或横行的总和表示A变量或B变量各自的效应,这通常称为主效应(main effects)。为了得到对B变量的最好预测,我们要横跨整个A自变量,因为主效应是总和另一个自变量的两个水平而得到的自变量效果,所以对于这些自变量效应所下的结论要比一般单一变量实验得到的结果更具普遍性. 在右边的情况则完全不同。在A1的条件下,B1和B2的
24、表现有很大不同,但是在A2时,B1和B2的表现则相差无几。所以,一个自变量的影响程度随另一个自变量的水平而定,表明两因素具有交互作用。图中的线交叉通常表明存在交互作用。,2、随机区组设计,随机化区组设计是将被试按某种标准分为不同的组(区组),每个区组的被试接受全部实验处理,但不是区组内每个被试接受所有的实验处理。 随机化区组设计的目的在于使区组内的被试差异尽量缩小,而对区组之间的差异依据设计要求而定。每种处理出现在每个区组中,这时区组之间的差异并不影响在各处理平均数间的差异。,(1)随机化区组设计的原则,随机化区组设计的原则是同一区组内的被试尽量“同质”。 每一区组内被试的人数分配有3钟情况:
25、 一名被试作为一个区组。这时,每名被试(区组)均接受全部处理,在接受处理的顺序上要采用随机化的方法。 每个区组内被试的人数是实验处理数目的整倍数。 区组内的基本单元不是一名被试或几名被试,而是以一个团体为单元。,农民伯伯种白菜,实验 变量,区组变量,不同品种的白菜年产量?,区组,区组,区组,(2)随机区组设计的基本原理,把实验单位划分为若干区组区组是根据实验的要求来划分的,对于那些可能影响因变量,但又不是研究者所关注的变量都可以作为区组变量来考虑,以控制其对因变量的影响。基本假定:区组变量与实验变量无交互作用。,例 天气状况对“赛车”测试速度的影响,被试分配()-区组变量为被试特征变量,人,人
26、,被试分配() -区组变量为被试特征变量,n人,n人,被试分配(3)-区组变量为被试特征变量,个团体,个团体,被试分配()-区组变量为环境变量,被试分配(2)-区组变量为环境变量,被试分配(3)-区组变量为环境变量,(3)单因素随机设计的基本模型,区 组 变 量,实验变量,(4)数据分析,1、分析实验变量和区组变量的主效应.重点关注实验变量的主效应2、分析实验变量和区组变量的交互效应.如有交互效应,则区组变量设置不合理,进一步研究中应该将区组变量设为实验变量.,练习题 实验设计:一个研究要探讨文章的生字密度(4个水平:5:1,10:1,15:1,20:1 )对学生阅读理解的影响。被试32名。研
27、究假设阅读理解是不是随着文章中生字密度的增加而降低。 你会如何设计这个实验呢?,生字密度:5:1,10:1,15:1,20:1。因变量:阅读理解测验分数。被试:32名,经过前侧将学生智力分为8个区组,然后每个区组有4个同质被试,(4)多因素随机化区组设计 多因素随机区组设计的基本模式,特点 随机区组设计在消除实验误差方面是否成功? 这依赖于放在同一区组的被试者事实上在多大程度上是同质的,在无处理影响的条件下,他们在因变量方面表现的相对同质程度。因此,我们不应该以与实验本身要作出的测量无关的变量为基础去构造区组。,被试分配 32两因素试验设计。自变量a文章主题熟悉性两个水平,自变量b文字密度有三
28、个水平。区组:将24名被试按其听读理解分数分为4个区组,(5)随机区组设计的优缺点,优点:在实验处理之前,能将单位组间的变异从试验误差中分离出来,有效地降低了试验误差,因而试验的精确性较高。 缺点:实验者因分配被试而大大增加工作量。,澄清几个问题,.随机区组的被试分配 a1 a2 区组 b1 b2 b1 b2 1 1 4 7 10 2 2 5 8 11 3 3 6 9 12,假设该实验的被试一共是3个,就是说,一个被试为一个区组。 那么每个区组的这个被试全部接受实验的4个不同水平的处理。这个时候就需要平衡实验的顺序,防止一个人不短的被实验而出现的顺序效应,如何平衡,一般用“ABBA”或所谓的“
29、拉丁方”。 传统的观点认为上述“方式”-一个被试为一个区组的情况不叫区组,叫被试内设计,就是因为每个被试都接受了不同的实验处理,因此没有随机可言。,假设该实验的被试总个数为24个,每个区组的被试为8个。如何分配被试? 他可以有两种分配方式 1、将每组中的任意每2个被试随机接受一种处理,2*4=8 2、8人同时接受所有的处理,1*8=8 需要注意的三个问题: 1、一般都用第一种情况,第二种不用,因为区组内的这8个人本来就是理论上的同质的,所以只要把他们分开,随机接受不同的处理就能说明问题,这样可以省时,省钱,还能避免每个人由于重复测量导致的额外变量的增加。 2、它强调了区组内的被试随机接受不同的
30、实验处理,也因此叫随机区组。 3、它要求每个区组的被试单位应该是实验处理水平的整数倍。如8/4=2,第三种分配方式:当一个大团体(如学校)为一个区组的时候,而大团体中又有小团体的时候(如学校中的班级)。 通常让一个小团体接受一种处理。例如:ABC分别是不同的三个学校,他们各自为一个区组,那么A学校是区组一, A学校就要抽四个班级出来,每个班级随机接受一种实验处理。,.拉丁方设计,在拉丁方设计中,每一行或每一列都成为一个完全单位组,而每一处理在每一行或每一列都只出现一次,也就是说,在拉丁方设计中,试验处理数=横行单位组数=直列单位组数=试验处理的重复数。在对拉丁方设计试验结果进行统计分析时,由于
31、能将横行、直列二个单位组间的变异从试验误差中分离出来,因而拉丁方设计的试验误差比随机单位组设计小,试验精确性比随机单位组设计高。,拉丁方设计又叫平衡对抗设计(baIanced design)、轮换设计。这三个名称是从其模式、作用和方法三个不同的角度来说明这种设计的意义。,所谓平衡对抗设计,是指在实验中,由于前一个实验处理往往会影响后一个实验处理的效果,而该实验设计的作用就在于提供对实验处理顺序的控制,使实验条件均衡,抵消由于实验处理的先后顺序的影响而产生的顺序误差,因而也可称之为抵消法设计。 所谓轮换设计,是指在实验中,由于学习的首因效应,先实验的内容,被试容易记住;又因为学习的近因效应,对于
32、刚刚学过的内容,被试回忆的效果一般也较好。因此、在实验方法上,有必要使不同实验条件出现的先后顺序轮换,使情境条件以及先后顺序对各个实验组的机会均等,打破顺序界限。 所谓拉丁方设计,是指平衡对抗设计的结构模式,犹如拉丁字母构成的方阵。例如四组被试接受A、B、C、D四种处理,其实验模式为: 上述模式表可以看出,每种处理即表中的字母在每一行和每一列都出现了一次而且仅出现了一次。像这样的一个方阵列就称为一个拉丁方。要构成一个拉丁方,必须使行数等于列数,并且两者都要等于实验处理的种数。,例,为了研究5种不同温度对蛋鸡产蛋量的影响,将5栋鸡舍的温度设为A、B、C、D、E,把各栋鸡舍的鸡群的产蛋期分为5期,
33、由于各鸡群和产蛋期的不同对产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为单位组设置,以便控制这两个方面的系统误差。拉丁方设计步骤如下:选择拉丁方选择拉丁方时应根据试验的处理数和横行、直列单位组数先确定采用几阶拉丁方,再选择标准型拉丁方或非标准型拉丁方。此例因试验处理因素为温度,处理数为5;将鸡群作为直列单位组因素,直列单位组数为5;将产蛋期作为横行单位组因素,横行单位组数亦为5,即试验处理数、直列单位组数、横行单位组数均为5,则应选取55阶拉丁方。,把5种不同温度按第三个5位数34521顺序排列 即:A=3,B=4,C=5,D=2,E=1,也就是说,在拉丁方中的A表示第3种温度,B
34、表示第4种温度等,依次类推。括号内的数字表示温度的编号。由表12-8可以看出,第一鸡群在第个产蛋期用第2种温度,第二鸡群在第个产蛋期用第1种温度,等等。试验应严格按设计实施。,拉丁方设计的主要优点1、精确性高 拉丁方设计在不增加试验单位的情况下,比随机单位组设计多设置了一个单位组因素,能将横行和直列两个单位组间的变异从试验误差中分离出来,因而试验误差比随机单位组设计小,试验的精确性比随机单位组设计高。2、试验结果的分析简便 拉丁方设计的主要缺点 因为在拉丁设计中,横行单位组数、直列单位组数、试验处理数与试验处理的重复数必须相等,所以处理数受到一定限制。若处理数少,则重复数也少,估计试验误差的自
35、由度就小,影响检验的灵敏度;若处理数多,则重复数也多,横行、直列单位组数也多,导致试验工作量大,且同一单位组内试验动物的初始条件亦难控制一致。因此,拉丁方设计一般用于5-8个处理的试验。,实验设计: 现有16名营业员来接待衣着考究和衣着邋遢的顾客,分别用随机分配法、配对法、重复测量法三种分配被试的方法设计实验,考察营业员对不同衣着风格顾客的反应差异? 问题:列出被试,自变量,因变量,小结: 要想提高统计量提高拒绝虚无假设的可能性应该有效控制无关变量。 相关法(重复测量、匹配被试)的优越性就在于最大程度的控制了个体差异。 相关法匹配或重复测量可以用少量被试就可以获得独立组大量被试才能统计值,事半
36、功倍。但是各有利弊、权衡利用。,统计量=组间变异/误差变异,组间变异就是实验处理效果 误差变异主要是个体差异,.小样本设计,被试内设计的一种变式。实验时向人数较少的被试或单个被试呈现自变量的不同水平或处理方式。由于测验的被试人数很少,因此需要在相当经济和高度控制的实验中对每一个被试进行大量观察并记录。,. ABA 设计,较好地区分实验自变量(比如一种疗法)的效果和时间顺序等其他因素的效果。 研究举例:一位4岁儿童比尔看上去很正常很健康却很是喜欢哭泣,心理学家发现比尔哭泣的原因在于成人对他的行为的强化。 (1)基线:第一个阶段A,老师对比尔的哭表现出正常关注,每天哭5至10次。 (2) 引入处理
37、:第二阶段B,不理会哭声,对他的适应行为进行奖赏 (3)基线:第三个阶段A,老师对比尔的哭表现出正常关注, ,比尔哭声开始下降。,.多基线设计,1.内在逻辑:当一种行为或一个被试正在接受处理时,另一种行为或另一个被试仍处于基线条件下。如果这种未受处理的行为在自变量引进之前保持稳定,然后随自变量的变化而变化,则认定是自变量而不是一些碰巧在观察期内发生变化的其他因素导致了该行为的改变。,2.设计程序:找到一个或若干个与所要研究的行为(或被试)接近的行为(或被试),在不同时间内对它们引入同一自变量的处理(治疗),也就是不同的行为(或不同的被试)在引入自变量之前有长短不等的基线期,从而可以将自变量的影
38、响和时间的因素逐阶段地演示出来,以便于研究者最终确定被试行为变化的真正原因和自变量处理的真实效果。,多基线设计如图2-3 所示,小样本设计的优势:有助于探索性研究;有利于临床心理学与教育咨询等领域。 缺点:信度;效度。,(二)准实验设计,主要类型: 1.单组准实验设计 (1)时间序列设计 (2)相等时间样本设计 2.多组准实验设计 (1)不相等组实验组控制组前测后测设计 (2)不相等组实验组控制组前测后测时间序列设计 (3)修补设计,1.单组准实验设计,在心理学研究中,有时会因条件的限制和问题的性质而使研究无法采用控制组,从而选取准实验设计进行研究。,(1)时间序列设计,时间序列设计是指对一组
39、被试或个体进行一系列周期性测量,并在测量的时间序列中引进实验处理(X),然后观测引进实验处理后的一系列测量结果,并与引入实验处理X前的一系列测量结果相比较,研究插入实验处理前后测量结果的变化趋势,从而推断实验处理是否产生效果。,时间序列设计模式,系列前测,实验处理,系列后测,时间序列设计(举例) (simple interrupted time-series design),英国工业疲劳研究组 如果工作时间从每天的10小时缩短到8小时,生产率会出现什么样的变化。 研究者以每小时的平均产量作为因变量指标 。,时间序列设计举例,学习心理咨询前后学生学习兴趣和学习习惯。,时间序列设计可能的实验结果,
40、时间序列设计评价,时间序列设计可以较好地控制“成热”因素对内部效度的影响。 其次,该设计可以控制测验因素的干扰。 由于每名被试都要经过多次测验,并得到一系列测验结果这就能够降低由于只作一次测验而出现的有偏向性样本成绩的概率。同时,该设计有可能控制统计回归的因素。,综上所述,由于时间序列设计可以多次测量被试在处理前后的数据,因此通过观察处理x前后的变化趋势,也就可以判断处理x前后在整个实验过程中的作用。,缺点,首先,由于该设计研究是在没有控制组的情况下进行的,因而它不能控制与实验处理同时发生的偶发事件的影响,不能排除那些与自变过同时出现的附加变量的影响。 其次,测验与处理x的交互作用作为影响实验
41、外部效度的因素在该设计中不易受到充分控制。 再次,多次实施前测验往往会降低或增加被试对实验处理的敏感性,从而在被试身上产生作用而影响被试在实验处理后的成绩。,(2)相等时间样本设计,在心理研究中,与选择两等价样本组(实验组和控制组)相对应,当只有一组被试时,常使用两相等的时间样本,在其中的一个时间样本中不出现实验变量,而采用常规安排X0。,相等时间样本设计模式,相等时间样本设计举例,教师批改作业对学生学习成绩的影响。,相等时间样本设计评价,相等时间样本设计在控制影响内部效度的因素方面是完全有效的。 它能较好控制“历史”作用的影响; 其他影响内部效度的因素也同时被较好地控制。,缺点,相等时间样本
42、设计在控制影响外部效度的因素方面并不理想。 测验的反作用效果会影响该设计的外部效度。 实验安排的反作用效果会影响该设计的外部效度。 选择偏差与实验变量的交互作用可能会影响该设计的外部效度。 重复实验处理的干扰也会影响该设计的外部效度。,(3)修补设计,将两种非实验设计相结合而构成的一种准实验设计。 两类设计模式 分解样本前后测设计 两个不同模式的非实验设计的结合,分解样本前后测设计,A组 O1 X O2 B组 O3 X O4用于被试量大,允许同时施测,两个不同模式的非实验设计的结合,A组 X O1 B组 O2 X O3,2.多组准实验设计,在心理学研究中,为使实验结果尽量少受无关因索的干扰,使
43、实验结果具有较高的可靠性,在条件允许的情况下应该采用多组实验设计,即包括有实验组和控制组存在的实验设计。,(1)不相等组实验组控制组前测后测设计,不相等实验组控制组前测后测设计的特点是研究者不能按随机化原则和等组法来选择对等组,有时也不能随机安排哪个为实验组、哪个为控制组。,设计模式,举例,思维训练:两个班,一个班进行思维训练,另一个班不进行思维训练,评价,首先,由于增添了控制组,从而使该设计基本上控制了历史、成熟、测验等因素对实验的干扰。 其次,由于两组都有前测验,研究者可以了解实验处理实施前的初始状态,从而也就对选择因素有了初步的控制。,缺点,该设计没有使用随机化方法来分配被试或实验处理,
44、实验组与控制组是不对等的,因而选择与成熟、选择与实验处理的交互作用可能会降低该设计的效度。 又由于两组都使用前测验安排,因而其实验结果不能校直接推广到无前测的情境中去。,(2)不相等组实验组控制组前测后测时间序列设计,不相等实验组控制组前潦后测时间序列设计是在单组时间序列设计和不相等实验组控制组前测后测设计的基础上,组合而成的一种多组准实验设计。,设计模式,优点与缺点,优点:时间序列设计 + 不相等实验组前测后测设计。 缺点:测验的反作用效果,以及选择偏差与处理的交互作用可能会影响外部效度。,(三)非实验设计,1.单组后测设计 2.单组前测后测设计 3.固定组比较设计 4.事后回溯设计,1.单
45、组后测设计,在单组后测设计中,只有一个实验组,而对实验组只给予一次实验处理,然后通过测量得到一个后测成绩。,单组后测设计模式,举例,数学课外辅导讲座对学生数学学习成绩的影响。,评价,没有对照组,不能比较。没有前测也无法对之前成绩进行比较。同时,也没有考虑对机体变量、自变量及其他无关变量的控制,也很难排除历史、选择和成熟等内在因素所导致的。所以这种实验很难做出推断。,2.单组前测后测设计,单组前测后测设计是对单组后测设计的一种改进,它增加了在实验处理前的测验,但还是仅有一组实验组。,单组前测后测设计模式,举例,威待墨(J Witter) “七年级低成就学生态度和成就的咨询和辅导效应” 对18名学
46、生,25个态度等级量表(9点量表)(前、后测), 10个星期的咨询和辅导(处理)。,评价,优点:有前测,可以提供基线数据,结果具有可比性;全部被试既是实验者又是控制组,可以控制选择变量。 局限:最主要威胁是历史因素(中间时间可能有无关因素干扰),成熟也是(中间时间生理变化的影响),由于有前后测,练习效应也会影响。仪器、统计回归及测验与处理的交互作用,都会对效度造成影响,3.固定组比较设计,固定组比较设计又称静态组或整组比较设计,该设计采用实验组和控制组两组被试,但因这两组被试在实验处理前就已经形成,故它不能使用随机化的原则来选择被试。,设计模式,评价,优点:基本上能对历史因素进行控制。(时间上
47、两组同时进行),因为没有前测,所以可以控制练习效应和仪器因素的干扰。最后也能对成熟因素做到有限控制。 局限:无法控制选择因素(没有随机分配被试),选择与成熟的交互作用和选择与处理的交互作用混淆不清。 检验方法:独立样本T检验,U检验,中位数检验和卡方检验。,4.事后回溯设计,事后回溯设计是指所研究的对象是已发生过的事件。 在研究过程中,研究者不需要设计实验处理或操纵自变量,只需通过观察存在的条件或事实,将这种已自然发生的处理或自变量与某种结果或因变量联系起来加以分析,以便从中发现某种可能的简单关系。,设计模式,两类事后回溯设计,(1)相关研究设计 (2)准则组设计,(1)相关研究设计,相关研究
48、设计是在一个被试组内收集两个集合的数据,其中一个数据集合是观察到的结果,另一个则是被追溯的数据集合,研究的目的是确定这两个数据集合之间的关系(正相关、负相关和无关)。,相关研究设计模式,相关研究设计举例,吸烟与肺癌的关系,(2)准则组设计,准则组设计与相关研究设计相类似,是对已经发生的事件进行研究的一种非实验设计。 它要求研究者通过对所研究现象的被试的比较,确定某些被试(准则组)具有一种状态的特征,而另一些被试(非准则组)不具有这种状态的特征,然后去追溯可能存在的原因。,特点:有两个组,一个为准则组(具有一种状态特征,如肺癌),另一个为非准则组(不具有这种状态特征),然后去追溯可能存在的原因。
49、 研究者要追溯的产生准则组特征的原因,(二)准则组研究设计,准则组设计模式,准则组设计举例,影响教师教学效果的因素 准则组:教师有出色的教学效果(学生学习成绩高)。 非准则组:教师无出色的教学效果(学生学习成绩低)。 追溯原因:可能来自教学方法、对学生的训练、培养学生的学习习惯、教师的个性和业务水平等方面。,优点: a. 可以对自然条件下出现的事件或各种学习现象进行时间上的追溯,以了解产生这些现象的信息,即由什么原因、在什么样的条件下出现这种结果。 b. 特别适应于研究简单的因果关系的问题。 c. 可为提出研究假设提供充分的论据。这种假设以后可以通过更严格的实验方法来进行检验。 d. 在某种环境或特殊条件下,事后回溯设计比其它实验设计更为有用,这是因为其它实验设计所建立的研究需要人为的作用来引起。 由于条件限制,研究者在不可能采用严格的实验设计研究时,可考虑采用这种设计方案。,