1、第二章 心理实验中的变量,第一节 自变量和因变量 第二节 额外变量 第三节 基本变量的实例分析 第四节 多自变量和多因变量的实验,一、变量 指在数量上或质量上可变的事物的属性。(有两种或两种以上取值的事件或行为) 。,总述,第一节 自变量和因变量,二、自变量 1、定义:即刺激变量,它是主试选择控制的变量,它决定着行为或心理变化。主试选择自变量的目的在于用自变量来改变行为。 2、自变量的不同水平:自变量的不同强度引起的反应有差异时,则自变量处于不同的水平。当自变量的不同水平导致行为的变化时,我们就说行为是处于自变量的控制之下,或者说,自变量是有效的。,3、自变量的种类,(1)刺激特点的自变量:刺
2、激的不同特性引起被试的不同反应。 (2)环境特点的自变量:进行实验时环境的各种特点:如温度、噪音、观众多少等。 (3)被试特点的自变量:一个人的各种特点,如年龄、性别、左右利手等。对于此种自变量被试只能选择,不能改变。 (4)暂时造成的被试差别:任何能改变被试特征以使其和自然状态下有所不同,就可视为暂时性差别。,4、自变量的有效和无效,自变量的水平发生变化,而没有引起相应的行为变化。我们就认为自变量无效;反之,则认为自变量有效。 自变量无效有几种原因: (1)实验者错误地认为自变量很重要,但实际上它不重要,结果自变量不能造成行为的变化。 (2)实验者没有能够真正地操纵自变量。,5、自变量的量化
3、,在心理学实验中,物理学中描述事物的量度可以用来描述自变量的变化。 心理学实验中有许多自变量的变化不能用物理学的尺度来加以描述。 对于这些无法用物理学尺度描述的心理向度刺激,我们常常用主观的辨别力来加以量化。如果一组刺激或事件在某些特殊的反应向度上有一致性的主观差异量产生,则我们就认为将其量化了,例子:,(1) 这把椅子我是给了小明。 是否合语法? 非常符合语法 符合语法 不肯定 不符合语法 非常不符合语法,心理量表的优点,(1)量表可以作为将来研究的测量工具。 (2)量表可以在实验中作为因变量。 (3)量表可以把量表上不同值的各事件和刺激作为量化的自变量,以供后来的实验所用。,自变量如何控制
4、,自变量的操作性 定义,自变量的水平,思考:智力的操作定义如何下?智力“最经典”之操作定义:智力量表测出来的东西就是智力。是非焦点 操作定义的特征:操作定义的最大特征就是它的可观测性。另外还有如下特征: 在内容上,用具体的事物来说明变量或概念; 在方法上,用可直接感知、度量的方法进行定义; 在着重点上,着重于界定变量的外延和操作过程。,设置操作定义的原则和方法,对称性原则:操作定义与其抽象定义相对称,不能过宽或过窄。 独特性原则:操作定义必须使其具有区别于其他现象、事物的独特特征。,如何对变量进行操作化定义,方法与过程描述法:通过特定的方法或操作程序 例如,“饥饿”的定义:剥夺进食24小时个体
5、存在的状态。研究 “情绪状态”对记忆容量的影响。如何定义“情绪”?:通过观看不同类型的录像片诱发不同的情绪:悲剧、喜剧、恐怖片。 动态特征描述法:通过客体或事物所具有的动态特征。 例如,“聪明”可定义解决问题的正确性、运算速度或记忆准确性。 静态特征描述法:通过客体或事物所具有的静态特征。 例如,“聪明”可定义为知识渊博、词汇丰富。,因变量,1、定义:即被试的反应变量,它是自变量造成的结果,是主试测量和观察的行为变量。 未经处理转化的因变量是一种对行为的测量,而实验结论是根据因变量的测量结果间接推论得到的。,2、因变量的量化及种类,量化的层次: (1)质的量化(有无反应) (2)量的量化(反应
6、的程度)例1、解题时间作为因变量,但如果一个被试总是无法解出某个题目时怎么办? 例2、我们测定大白鼠从起点到出口所需的时间,但如果大白鼠不往前走怎么办? 例3、如果被试在回忆中把“不干净”写成了“肮脏”怎么办?,量化中的问题: (1)程度的界限划分。 (2)事先制定划分规则。,例4 有一位研究者做一个有关校对印刷错误的研究。 研究的自变量是印刷错误比率的高低,分为高(每5行1个错误) 、中(每10行1个错误) 、低(每20行1个错误)三组。 被试随机分成三组,要求被试尽快划出错字。因变量是遗漏错字的 数量。结果发现三组的平均值为5,4.9,5.1,它们之间没有显著 差异。由此研究者认为错误比率
7、和错误检出率无关。 我们对因变量的量化有没有问题?,如果实验条件的不同会使我们所关心的特定时间发生的机会不同时,则所得到数据必须换算以便把发生机会的差异考虑在内。,因变量的控制,反应控制,指导语示例,选择恰当的因变量指标,明确的操作定义 因变量指标必须满足可靠性 有效性 敏感性(避免量程限制),因变量的观测指标,心理实验中的因变量可从以下几个方面来选取:(1)反应速度:可用反应时或单位时间内完成某项作业的数量做指标。(2)反应的正确性:可用完成作业的正确率或错误率做指标。(3)反应的难度:可用被试所能通过的难度等级做指标。(4)反应的次数或几率:是指在单位时间内被试能做出某种反应的次数,或在不
8、同条件下产生某种反应的人数。如在心理物理学实验中,用反应几率规定阈限。(5)反应的强度:如情绪实验中的出汗量,皮肤电反射电阻变化的大小;如情绪刺激与按键强度。(6)口语记录:被试在实验时对自己心理活动进程所作叙述的记录,或在实验后,对主试提出问题所做回答的记录。(7)眼动模式(8)脑激活区的位置、强度与范围。以上分类来自实验心理学(杨志良,1998),(一)行为指标以被试的外在行为特征作为测评对象的指标。 行为发生的频率:在某一特定时间内或条件下,特定行为发生的次数。如助人行为、口吃与焦虑、按杠杆或啄键次数、 强度:如动物缩腿或伸腿的强度;按键强度(情绪);拍手强度(认可) 持续时间:指从行为
9、发生到行为结束所消耗的时间;如从事一项任务的时间(工作兴趣);婴儿跟踪刺激(喜欢程度):老鼠走迷宫时间(学习程度) 潜伏期(反应时):从接受刺激到对刺激做出反应所消耗的时间;认知心理学中推测心理过程的主要依据;也可用于社会心理研究:看到钱包到归还主人的时间(助人动机强度),从接受任务到开始从事任务(办事拖延的指标)。 正确率:主要用于学习、记忆、问题解决类研究;常与反应时同时使用。,(二)生理指标 1肌电(electromyographic, EMG):是指与肌肉纤维收缩有关的电位。主要用于情绪研究,如Surakka和Hietanen(1998)发现,真正的微笑和装出来的微笑有不同肌电活动模式
10、。 2. 皮肤电(Electrodermal, EDA): 皮肤电与汗腺分泌活动有密切关系, 而汗腺分泌活动通常能对情感和认知活动的变化做出反应。如Blair等人(1997)发现,精神错乱者对危险信号的的皮肤电反应明显比正常人低。 3.心血管指标: 包括心率、血压和血流量等指标。应激水平,心理负荷,新异刺激,脑成像。 4.呼吸:涉及动脉血氧水平、肺内二氧化碳水平、呼吸频率和呼吸深度等指标。 5.脑电:是指伴随大脑皮层和中脑结构大量神经元活动的电活动。 6.其他:内分泌指标、生化指标、眼动模式、功能性神经成像、脑磁图等,1. 自我报告主要指以自陈式量表得分作为评价指标的方法,总体属于心理学测量和
11、问卷调查法范畴。 2. 口语报告法:问题解决实验和临床心理实验的传统指标; 口语报告数据处理的一般程序:(1)将录音资料或录象资料及时转译成书面材料。(2)对书面材料进行编码,一般将整个心理过程分作几阶段或中心事件,然后再按编码系统对这些事件进行编码和分析。(3)对分析结果进行定性和定量分析,可用统计软件,问题行为图等。,(三)自我报告,实验的信度(因变量的信度),同一被试在相同实验条件下表现结果的一致性。,关于类比问题解决的研究,邓克肿瘤问题:假如你是医生,面临着一个胃内有恶性肿瘤的病人。在肿瘤上不能动手术。但是,肿瘤不切除,病人就会死去。有一种辐射能摧毁肿瘤。如果辐射以足够高的强度立刻到达
12、肿瘤,肿瘤会被摧毁。但不幸的是,当高强度的辐射经过机体的其他地方时,健康的组织同时也被摧毁。低辐射条件下,射线对健康肌体无害,但也不能对肿癌起作用。我们应该用什么类型的辐射去摧毁肿瘤同时又避免伤害健康的组织呢?(Gick和Holyoak,1980)。,吉克和霍利约克的研究(研究一),最早研究中,45个被试只有2个(4%)提出了“会聚解决法”。 他们想研究:当在辐射问题前先给出一个类似的问题及其解决办法时,是否会有更多的人能解决这个问题。即是否被试能从第一个问题中抽象出指导原则,然后运用到第二个中去。 基于这种想法,吉克和霍利约克提出了其他的“类比故事”。这些类比故事蕴涵着高效解决辐射问题的基本
13、原则。,类比故事指挥官故事,一支坦克部队的指挥官要向敌军司令部(要塞)发起攻击。如果用许多坦克,他赢的机会很大;但他的部队必须经过又窄又不牢仅能通过少数坦克的桥,因此只能用少量的坦克发起袭击,但易被敌方击退。为了取得胜利,这支坦克部队指挥官制订了一个让坦克分别通过每座小桥包围敌司令部的计划。这样,所有坦克都能立刻过桥攻击和占领敌司令部。,三种实验处理: 解决问题前没有阅读指挥官故事; 解决问题前阅读无关故事; 解决问题前阅读指挥官故事。 前两种条件下,实验结果,在解决辐射问题前没有阅读故事或阅读无关故事的被试仅有大约10是用最有效的方法解决问题的。在解决辐射问题之前阅读过类比故事,的被试约有7
14、5在时间限度内解决了问题。 由于几个实验都得出了这样的结果,因此可以说这一基本现象是经过反复验证过了的。显然,人们的问题解决能从类比中受益。,提示是否有助于解释类比推理问题?(研究二),吉克和霍利约克(1980) 思考了类比推理的过程。 他们让所有被试读类比故事,然后解决辐射问题。他们设置了两种条件: 提示条件:提示利用故事作为提示考虑怎样解决问题。 无提示条件:不提示被试刚读过的故事与他即将面临的问题解决任务之间存在的联系。 结果显示,提示确实是解决类比推理问题的一个重要因素。提示组92的被试解决了问题;无提示组仅有20。 可见,只给出类比是不够的,还必须引导被试在试图解决后一问题时要积极利
15、用它。 第30页,类比问题解决实验的信度问题,结果是真的吗?如果重做这个实验,还会得到与之相同的结果吗?,考察实验信度的方法,1.推断统计 2.实验验证,1.推断统计,推断统计用于确定两种条件的结果差别是由自变量还是随机因素造成的。如果不同实验条件下所得出的结果之间差异很大,而且这种差异由偶然因素导致的概率低于5%时,研究者可以排除偶然因素导致该结果的可能性,而认为结果是由自变量造成的。 吉克和霍利约克的实验中有无提示条件的结果,他们运用推断统计得出,两组间解决问题百分比的差异不是由偶然因素,而是由实验中是否有提示条件造成的。因此,我们可根据这个统计检验得出差异具有统计信度。,统计推断的问题,
16、“重复一次抵得上一千次t检验”。 尽管结论在统计上被认为是可信的,但由偶然因素(统计信度仍保留5的错误概率)、一些末被注意到的混淆因素、或者实验者误差所造成错误的可能性仍然存在。 例如,大多数聪明的被试碰巧被分到一种条件中。,2.实验验证,三种实验验证方法: 直接验证 系统验证 概念验证,直接验证,直接验证是指在尽可能保持原实验方法的情况下在实际中重复它。 例如:如果我们想要尽可能准确地重复吉克和霍利约克(1980)关于提示是否有助于类比迁移的实验,就构成对他们实验的直接验证。,系统验证,所谓系统验证,就是系统变化那些被认为与实验结果不相关的因素,考察是否会出现同样的实验结果。 也就是说,如果
17、原始实验中发现的某种现象是真的,那么,尽管重做中一些因素发生了变化,但它仍然该出现。 前面提到的吉克和霍利约克的研究中,研究二就可以看作是对研究一的系统验证。,概念验证,所谓概念验证,就是根据一个较为抽象的概念或者理论模型设计实验,验证实验结果。,吉克和霍利约克(1983)关于正迁移的条件的研究,他们想考察迁移量是否随着被试加工类比故事的方式的不同而发生变化。 实验材料:辐射问题和另一个别的问题;两个问题的类比故事; 实验设计: 控制条件:只呈现类比故事而不带任何指导语; 告诉被试概述故事而不要为了回忆测验而学习; 是否以言语或文字的形式给出被试这一故事所表达的道理和它的策略本质; 把图解和故
18、事一起呈现给被试; 实验结果:正迁移量没有发生变化。,进一步的研究,吉克相霍利约克(1983)发现,当被试学习两个类比故事并亲自描述其相似性(在问题前给出)时,产生的正迁移要比只是学习一个大得多。他们认为,被试学习两个类比故事,然后思考其相似性能产生好的内在观念(或用他们话说,因式),这一观念能自动地用于解决新问题。,尽管吉克和霍利约克(1983)的实验并非直接或系统地验证了他们早期得出被试难于自发应用类比解决问题的实验研究,但他们会聚出了一个相同的结论,即难于从类比来改善推理。 因此,这些后来做出的实验可被看作概念验证,尽管实验技术不是原实验中的重复,但在某种程度上他们验证了那种没有明确指导
19、的类推困难现象的本质。,小结:考察实验信度的方法,系统验证的另一个例子:动允性的研究,“动允性”一词由著名的知觉心理学家Gibson于1966年提出 。 理论家们普遍认为:动允性是动物个体与环境之间的一种交互作用,是环境的属性使得动物个体的某种行为得以实施的可能性。,动允性的含义不仅仅是“一个物体有什么用处”这么简单。 Warren用了一个“人走上楼梯”的例子来解释什么是动允性。当台阶的高度低于人的腿长的88%时,人就可以迈上楼梯;当台阶的高度高于人的腿长的88%时,人就无法迈步走上楼梯(只能用其他方式走上楼梯)。假设一个人腿长为1米,一阶台阶高度为0.5米,那么显然这个人是可以迈上这级台阶的
20、。 在由这个人和这阶台阶组成的“动物-环境系统”中,就含有“人迈上台阶”的动允性。一些理论家认为,动允性的实质就是可能性,实验一:动允性是否会在长时记忆中保持? 实验句:小刚是个喜欢恶作剧的孩子,等到他做好了弹弓,邻居家的玻璃窗户就危险了。 主人公:小明 目的:恶作剧 核心动允性:打碎邻居家玻璃窗户的可能性 动允性线索词:打碎 动允性相关词:弹弓 动允性无关词:孩子,实验顺序 实验句三道四则混合运算题所有实验句呈现完毕八道四则混合运算题再认判断(12个动允线索词、12个无关词、12个动允相关词和12个填充词),实验二的目的是考察在语篇的阅读理解过程中,动允性的提取是否快于属性的提取,并依此判断
21、动允性是否能够被直接提取。 实验程序 自定步速阅读真假词判断任务,背景句1:小刚在公园里玩沙子的时候,看到旁边有一个小男孩在玩气球。 背景句2:看着气球,小刚忽然想到了一个恶作剧。 背景句3:如果气球突然爆炸,一定能把男孩吓哭。 关键句:于是,他从兜里掏出了一根牙签(可能提取)/一块橡皮(不可能提取)。 目标词:捅破(动允性)/尖锐(属性)/可费(假词) 判断句:小刚想把气球弄爆。(正确),实验三的目的是在实验二的基础上进一步考察动允性与属性的关系,检验对属性的呈现是否有助于动允性的通达。,背景句1:小刚在公园里玩沙子的时候,看到旁边有一个小男孩在玩气球。 背景句2:看着气球,小刚忽然想到了一
22、个恶作剧。 背景句3:如果气球突然爆炸,一定能把男孩吓哭。 关键句:于是,他从兜里掏出了一根牙签。 提示句:他知道牙签的尖端是很锋利的(有相关属性提示)/ 他知道牙签是用来剔牙的(无相关属性提示)。 目标词:捅破 判断句:小刚想把气球弄爆。(正确),因变量的有效性即效度(validity),当自变量的确造成了因变量的变化,而不是其他的各种因素造成因变量的变化,我们就说这种因变量是有效的。 Thomas Cook & Donald Campbell (1976): internal validity: extent to which a study provides evidence of a
23、cause-effect relationship between the independent and dependent variables. construct validity: extent to which an experiment measures the theory behind the research. external validity: how well the findings of an experiment generalize to other situations or populations.,因变量的效度,当确实是自变量而不是其他因素引起了因变量的变
24、化时,我们认为因变量有效。 如果因变量的变化不是自变量造成的,而是由其它因素引起的,则这种因变量是无效的,或者说,实验产生了自变量混淆。 例:考察不同水平被试在一定时间内解决应用题的数量(因变量),并作为推知其数学能力的指标。如果题目难度很小,会有什么问题?,实验的内部效度 定义:指实验变量能被精确估计的程度。排除对实验结果产生干扰的额外因素,使研究者相信实验结果确实是由实验变量引起的,则实验具有内部效度;反之如果对于实验额外的因素控制不好,造成了与实验变量的混淆,影响了实验结果,则实验缺乏内部效度。,实验的内部效度,实验的内部效度是指实验中的自变量与因变量之间的因果关系的明确程度。 一项实验
25、的内部效度高,就意味着因变量的变化确系由特定的自变量引起的。 由于除了自变量以外,任何额外变量都可能对因变量产生影响,导致实验结果的混淆。这样我们就难以判定实验中自变量与因变量之间的关系的确定性。 因此,要使实验具有较高的内部效度,就必须控制各种额外变量。 在设计实验时,如果能考虑到以下六个方面的因素,将有助于提高实验的内部效度。,要使实验具有较高的内部效度,就必须控制各种额外变量。 例如:在加工水平效应中,被试、实验材料、测验方式都可能会影响对加工水平效应 在设计实验时,如果能考虑到以下六个方面的因素,将有助于提高实验的内部效度。,1.生长和成熟,除了实验中的自变量可能使个体行为发生变化外,
26、个体本身的生长和成熟也是使其行为变化的重要因素。特别是在以幼小的儿童为被试者而又采用单组前测后测实验的情况下,生长和成熟因素的影响就更大。 单组前测后测实验通常是实验处理之前先对被试者的某种行为作一次测量,实验处理后再以同样方法测量一次,两次测量之差即表示实验变量(即自变量)产生的效果。 很明显,这种设计忽略了前后两次测量之间被试者的生长和成熟因素,其实验效果易受生长和成熟因素的混淆,从而降低了内部效度。 解决的主要办法是增设同样条件的控制组进行比较。,2、前测的影响,在一般正常情况下,前后两次测量的结果会有一定的差异,后测的分数将比前测的高。这中间包括练习因素、临场经验、以及对实验目的的敏感
27、程度,从而提高了后测的成绩。特别是前后两次测量时间较近,这一因素的影响就更显著。,3、被试者的选择偏性,在对被试者进行分组时,如果没有用随机取样和随机分配的方法,在实验处理之前,他们在各方面并不相等或有偏性,从而造成实验结果的混淆,降低了内部效度。,4、被试者的缺失,如果是一项长期的实验,要保持原实验被试者的人数不变是相当困难的。即使开始参加实验的被试者样本是经过随机取样和随机分配的,但由于被试者的中途缺失,常常使缺失后的被试者样本难以代表原来的样本。这就降低了内部效度。,5、实验程序的不一致,在实验过程中,实验仪器、控制方式的不一致,测量程度的变化,实验处理的扩散等都可能混淆实验变量(即自变
28、量)的效果。实验者知道实验目的所产生的“实验者效应”以及被试者知道实验目的或其自己正被研究所产生的“霍桑效应”和“安慰剂效应”等都将混淆实验变量(即自变量)的效果,从而降低了内部效度。,6、统计回归,统计回归现象是,第一次测量平均值偏高者,第二次测量平均值有趋低的倾向(向常态分布的平均数回归);第一次测量平均值偏低者,第二次测量平均值有趋高的倾向(也向常态分布的平均数回归)。,影响实验外部效度的因素,实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。 以人的行为为对象所获得的实验结果,其推论法往往有相当的局限性。 例如:某些教学改革实验
29、的结果仅仅适用于城市条件的教学,而不适用于农村条件的教学,这样的研究外部效度就很低。 实验的外部效度主要受下列三方面的影响:,1、实验环境的人为性,实验是在控制条件下进行的,实验环境的人为性可能使某些实验结果难以用来解释日常生活中的行为现象。 实验室中的仪器设备会影响被试者的典型行为。 被试者参与实验的动机也会影响其行为表现。 而在实验室之外的日常生活中,就不会有这些因素的影响。因此,实验结果还不能完全等同于实验室之外的日常行为现象。,2、被试者样本缺乏代表性,从理论上讲,从事于实验的被试者必须具有代表性、必须从将来预期推论、解释同类行为现象的总体中进行随机取样。但实际上这是很难做到的。 因为
30、,如果总体很大,即使能够随机取样,但心理学实验的被试者通常是自愿的,所以也很难把被随机选上的人全都请来做实验。 如果总体是无限的(例如,“七岁儿童”就是一个无限的总体,其包括过去的、现在的、将来的所有七岁儿童),随机取样实际上是行不通的。这样的实验结果自然会降低其外部效度。,3、测量工具的局限性,实验者对实验变量(即自变量)和反应变量的操作性定义往往以所使用的测量工具的测量结果来加以考虑的。 例如,把成就动机作为一个因变量,实验者常以某种成就动机量表所测得的分数来界定并评定其强度。但成就动机的测量工具有各种不同的形式,所测量出的分数并不代表同一种成就动机及其强度。如果在实验时采用的是某一种成就
31、动机的量表,那么所得出的实验结果便不能推论到采用其他成就动机的量表的情况中去。,实验的内部效度和外部效度是相互联系、相互影响的。提高实验内部效度的措施可能会降低其外部效度,而提高实验外部效度的措施又可能会降低其内部效度。 这两种效度的相对重要性,主要取决于实验的目的和实验的要求。一般而言,在实验中控制额外变量的程度越大,则对因果关系的测量就越有效。因此,可以在保证实验内部效度的前题下,采取适当措施以提高外部效度。,例子,因变量的敏感性(避免量程限制),(1)高限效应:当要求被试完成的作业过于简单,使得被试在不同自变量水平上都获得很好的结果,并没有差别时,实验中就出现了高限效应。 (2)低限效应
32、:当要求被试完成的作业过于困难,使得被试在不同自变量水平上都获得很差的结果,并没有差别时,实验中就出现了低限效应。,多重因变量,例4、两种情形下要被试删除特定字母“T” 、“K” QWERTPOUKBCGKOYXT FNHNTHFNKFHNKHNFT 我们不限制3分钟,而是要求被试完成整张作业纸上的任务。这时我们就有两种反应测量:遗漏的T、K数目和完成的时间。 问题:哪一种反应测量更好呢?,因变量选择的标准:,(1)在一项实验中,如果两种量值之间存在着高度相关,那么两者都可以使用。 (2)如果其中一个量值对自变量的变化并不敏感,则应该选用另一个反应敏感的量值。 (3)如果两个因变量对自变量都有
33、高敏感性,但两者间没有相关,说明也许是自变量中有额外因素在起作用,或者自变量不是以同样的方式影响两种反应测量。,第二节 额外变量及其控制,一、额外变量(控制变量)及控制 1、定义:所谓额外变量是指在实验过程中除自变量之外任何能对因变量产生影响的变量,包括个体内外环境所产生的种种刺激、机体反应变量。由于这些变量与实验的主旨无关,所以统称为额外变量(Extraneous variables)。 因为因变量的变化,不但受到自变量的影响,也受到无关变量的影响,所以如何有效地控制无关变量,是决定实验结果是否确实可靠的一个极为重要的因素。因此,在一次实验中,当我们确定了自变量与因变量以后,就应该使实验的其
34、他条件保持恒定,只有这样,实验中的因果关系才能得到明确的说明,所以,额外变量就是在实验中应该加以控制的变量,因此又称为控制变量。,如果以数学方程式来表示因变量和自变量以及无关变量之间的关系,就是:因变量=f(自变量,无关变量1,无关变量2,,无关变量n)例如,研究智力与短时记忆的关系,可以用公式:STM=f(IQ) 表示。但是,除了智力之外,短时记忆还会受到被试年龄,性别,教育程度,环境因素等无关变量的影响。STM=f(IQ, EV1, EV2, EV3, EVn),对任何一项实验来说,需要控制的变量是极多的,比实验中我们能控制的多得多,但是,只要我们把足以影响因变量的一些主要因素控制住,实验
35、的结果就是可靠的。我们怎样决定哪些因素必须控制呢?这要求我们参照他人的研究以及我们的实验经验。,额外变量和自变量混淆,找出自变量和因变量的关系后,我们的目的是想要能下结论说某行为的改变是因为该自变量变化的关系。也就是说,实验的目的是要确认变化的原因。要做到这一点,我们必须避免所用的自变量与其他的自变量相混淆。 定义:如果我们所设定的自变量其发生量的改变时,另一个已知或潜在的自变量亦随之有量的改变,则这两个自变量的作用就发生了相互混淆。,2、案例,由于自然观察法特别容易受到干扰,我们就先来检查两个使用此法的研究。观察方法之所以容易出现此种错误,是因为自变量必须在事件的自然发展过程中有两个(或两个
36、以上)不同的水平,但在水平变化的同时也会有许多其他因素发生了改变。,例1:,说明1:可能因为在晚饭前观察的学生都是下午学习了一段时间的。而晚饭后观察到的学生则有一部分可能是下午没有学习的,因此,在下午是否学习这一变量已经与饥饿因素发生了混淆,我们不能得出“饥饿是主要原因”这一结论。 说明2:另一个可能与饥饿发生混淆的因素是注意因素,下午人的注意力可能本来就没有晚上集中。 说明3:还有一个可能与饥饿发生混淆的因素是学生学习的内容。下午学生可能看的是较枯燥的内容,而晚上学的可能是较为轻松的内容。,研究者通过观察发现,晚饭前在图书馆里学习的学生的专心程度没有晚饭后学习的学生的专心程度高。我们是否可以
37、认为:饥饿是导致这种差异的原因?,例2:,一个研究者发现某种动物中午的进食次数要多于在夜间进食的次数,于是我们是否可以认为光线是影响动物进食的主要因素?说明:不能这样认为。因为中午的温度和夜间的温度是不同的,因此温度是一个与光照发生混淆的因素。,两条关于易发生混淆的或然率规则:,(1)混淆现象最可能在同类变量间发生。当我们操纵一个作业变量时,则和另一个作业变量发生混淆的可能性最大;而被试者变量最容易和另一个被试变量相混淆。这条规则是十分重要的。 (2)在我们确定我们所操纵的变量没有受到同类别变量的混淆后,(若所用的设计是独立组设计)那么最可能的混淆来源于被试变量。,例3:,研究被试在自由回忆学
38、习中,学习的英文单词音节数越多,则越难学。研究中所用的音节数(自变量)有1音节,2音节和3音节(三个水平)。我们是否可以确认音节数是导致难学的因素?说明:单词的频率是一个非常重要的易混淆变量,因为音节越短的单词使用的频率越高。,例4:,研究者想知道题目之间休息的时间是不是影响进行数学运算(连减)准确性的因素。于是让一班、二班和三班的学生分别休息1、2、3分钟,结果发现休息时间与成绩无关,那么我们是否可以认为休息时间对数学作业无影响? 说明:不能这样认为,因为一、二、三班学生能力上的差异可能与休息因素发生了混淆。,心理教育研究中自变量混淆的情形,1、被试偏差 (1)被试反应性。 霍桑效应 安慰剂
39、效应 (2)社会赞许性:人们希望表现出符合社会期望的公众形象。 (3)观察者效应:观察者的存在所引起的效应。 (4)要求特征:对被试传递的实验假设信息的全部线索成了决定被试行为的显著因素,这样的线索就是实验情境中的要求特征。 (5)参与者期待 (6)取悦研究者与评价忧虑,2、研究者偏差和研究设计误差,(1)皮格马利翁效应:研究者的期待对被试的影响。 自我实现预言(self-fulfilling prophecy) (Rosenthal & Fode,1963)(2)单盲(single-blind trails)和双盲(double-blind trails) 光环效应:当评价者对一个人的积极或
40、消极整体评价影响到对某具体特点的评价时,就产生光环效应。 对比效应:观察者可能倾向于把自己作为评价他人个性的参考框架,这一倾向导致把与自己不同的人评价得比实际上与自己更加不同,把与自己相似的人评价得比实际更相似。,(3)同时期历史效应和地区历史效应。 同时期历史效应:指某一非实验因素影响在更大范围内影响到实验组。地区历史效应:指某一非实验因素影响到一个实验组而没有影响到其他实验组。,2、控制额外变量的方法,(1)消除法 控制无关变量最完美的办法就是简单地把它们从实验环境中消除。此法多适用于一些物理刺激因素的控制,例如,噪音,光线,等。 有一些额外变量,如实验的时间,实验的仪器,实验的主试,被试
41、的年龄,性别,教育程度,不能简单地加以消除,那么就要有另外的办法来加以控制。,(2)恒常法,对于不能消除的变量,我们可以使它在整个实验中保持恒定,即所有的被试都接受相同的无关变量,这种控制方法称为恒常法。由于这些无关变量在实验中都保持恒常,它们对接受自变量不同水平的每个被试,所能产生的影响都是一致的,所以不会影响通过自变量不同水平对因变量所造成的变化差异。对于一些被试变量,实验条件,可以采用此种方法。心理实验中常见的可恒定的方法: (1)采用同一地点,同一仪器,同一主试,同一时间段; (2)主试态度要保持恒定; (3)按同一实验程序或步骤进行实验; (4)选择智力、性别、年龄、教育程度相同的被
42、试。 例如,我们实验的时间安排在上午,可能会比下午的实验有更好的结果,因此我们可以通过将实验都安排在上午来消除时间这一因素可能产生的影响。,(3)平衡法,这种控制方法的目的,是让额外变量产生的作用在所有的实验组及控制组的效果都保持平衡。也就是说,每一组都受到这些额外变量变化的作用,但它们作用的大小在各组都是一样的。 例一:平衡各组“性别”变量的作用。 二十名被试,十二个男性,八个女性。分成两组进行实验。假设被试的性别可能会对因变量产生作用,所以,需要控制这个额外变量。,先把12名男性被试随机分为两组,再把8名女性被试随机分到两个组中,这样,在每一组内性别都有变化,这种变化有可能对因变量产生影响
43、,但是由于性别因素对两个组的影响效应都是一样的,因此这种作用就被平衡了。 平衡与恒常控制手段不同。采用恒常法,额外变量在组内以及组间皆无变化;采用平衡控制手段时,额外变量在组内是有变化的,但是变化所产生的作用在各组之间是相等的。,设计控制组来平衡额外变量对因变量的影响,如果研究者无法指认有些可能起作用的无关变量,可以采用适当的控制组,以达到平衡控制的目的。 实验者对实验组以及控制组,除了自变量的处理不同之外,对其他都一律同等地处理。如此,实验组和控制组在因变量上产生的差异都可以归诸于自变量不同所产生的作用。,平衡法设计模式,实验组1:S1,V1,V2,V3Vn R1实验组2:S2, V1,V2
44、,V3Vn R2控制组 : V1,V2,V3Vn R3R1-R3=R1,即自变量S1的效果;R2-R3=R2,即自变量S2的效果。,例如:研究接受持枪稳定性训练对射击准确性的作用。 实验组被试在接受训练之前先射击50发,之后进行训练,再测验50发。结果如下表:是否可以认为训练导致了成绩的提高?,解释:可能有其他因素:先射的50发;两周的时间间隔;或者其他一些可能无法了解的因素。为了排除其他因素的影响,必须采用控制额外变量的平衡手段。设计种种控制组来达到消除无关变量的影响。例如,为了消除时间和练习这两个主要无关变量的影响,我们可以设计两个控制组。,实验组和控制一组:如果X明显小于24,认为训练有
45、效。如果X不显著小于24,则训练无效。控制一和控制二组:如果X显著大于Y,说明训练前的那50发有效果,如果无差异,则说明不起作用。,(4)抵消平衡法(顺序误差的平衡),有些实验研究,被试需要在各种不同的实验条件下接受重复测验。在这种重复测量的设计(Repeated measurement design)中,被试会受到接受重复测量所产生的影响。这些混淆因素并非出现在测量之前,而是产生在重复测量的过程中。对此我们可以采用抵消平衡(counter-balancing)的手段来控制这类混淆变量。 这种控制手段主要用来平衡一组被试重复接受自变量各种水平的先后顺序所产生的无关影响。,平衡技术,平衡技术的应
46、用 完全的组内设计:把所有可能的顺序都排出来进行实验,以抵消练习或疲劳作用的影响。 不完全的组内设计:这种方法保证每个变量或自变量的特定水平都同等地出现在实验顺序的每一个位置。,ABBA平衡法,随机区组设计:实验中包含多个区组,每个区组中所包含的实验顺序是随机安排的。 随机区组设计包含对实验材料进行区组化的实验设计和对被试进行区组化的实验设计。,对实验材料进行区组化的实验设计举例,Sackheim,Gur和Saucy等使用组内设计研究人的两侧面孔在情绪表达强度上的差异。早期的研究者发现,被试能够准确地区分呈现给他们的人类的6种基本情绪(快乐、惊奇、恐惧、悲伤、愤怒、和厌恶)的照片。Sackhe
47、im和他的合作者利用一个人的一侧面孔和其镜像重新构成一张完整的面孔的照片。上图为三种实验材料。,对实验材料进行区组化的实验设计举例,给被试呈现如图所示的照片制成的幻灯片,要求被试利用7点量表评价每一张幻灯片的情绪的强度。每次呈现一张幻灯片,每张呈现10秒钟,然后给被试35秒钟进行评定。实验中的自变量为照片的形式(左侧构成,原始照片,和右侧构成),每位被试评价54张幻灯片:18张左侧构成照片,18张原始照片和18张右侧构成照片。,对实验材料进行区组化的实验设计举例,对实验材料进行区组化的实验设计举例,问题是,两种重新构成的照片在表现出的厌恶程度上是否相同。在本实验中,被试对左侧构成照片的厌恶强度
48、评价明显高于对右侧构成照片的厌恶强度评价。Sackheim等人用大脑半球的分化解释以上实验结果。通常,左半球控制身体的右侧,而右半球控制身体的左侧。因此,左侧构成照片反映的是右半球的控制,而右侧构成照片反映的是左半球的控制。对左侧构成照片情绪强度评价较高表明右半球在情绪的表达方面更为重要。,区组技术的引申,对被试进行随机区组: 将被试进行“同质”划分。 “同质”的被试进入同一个block,同一区组中的被试随机接受一种实验处理。 随机区组设计的目的:使区组内的被试差异量尽量缩小,避免被试的个体差异对实验处理产生的额外影响,而从提高实验的效度。,对被试进行随机区组分配的例子,研究者想考察三种背景音
49、乐(摇滚乐、爵士乐和古典音乐)对英语单词记忆的影响。研究者随机选择了45名大学生,问如何对被试进行随机区组分配?,事先对被试的英语基础、智商等进行评定,根据评定结果对被试进行配伍(区组划分),每个配伍组中被试是同质的。 每三人一个配伍,共15个配伍组。每个配伍组中的一个被试随机接受一种背景音乐的实验处理。,被试随机区组设计的人数分配,1、一名被试一个区组 2、每个区组内被试的人数是实验处理数目的整倍数。 3、区组内的基本单元是一个团体。 例如,以不同学校为实验区组,同一个学校的几个班(班级个数等于实验处理的个数)成为一个区组,每个班接受一种实验处理。 遵循的总原则:每一个区组接受所有的实验处理,每一种实验处理在不同区组中重复的次数也应该完全相同。,ABBA平衡法,是指每一种实验条件都以正反两种顺序呈现给被试。 练习效果的线性增长; 预期作用(anticipation effects),完全的组内设计:用平衡法时,接受所有实验处理,例如ABBA平衡,要接受ABBA顺序的处理。 不完全的组内设计:将被试在分成两组,一组接受AB,一组接受BA,每个被试相同处理只接受一次 。,对外国留学生进行识字教学的例子:不完全组内设计,