1、第五章 行为学习理论,主讲人:付宗国教育心理学,第五章 行为学习理论,第一节 行为学习理论概述 第二节 经典性条件作用理论 第三节 操作性条件作用理论 第四节 社会学习理论及行为主义新进展,一、桑代克试误联结主义理论 二、斯金纳操作性条件作用理论,第三节 操作性条件作用理论,实际问题思考“老师喊上课后安静坐着”,是否条件反射?是否经典条件反射?“看到交通信号灯,做出红灯停、绿灯行的反应”是否经典条件反射?以上两个事例与经典性即巴甫洛夫意义上的条件反射有何不同?,第三节 操作性条件作用理论,一、桑代克试误联结主义理论 桑代克(E. L. Thorndike)其人 美国心理学家,动物心理学的开创者
2、,心理学联结主义的建立者和教育心理学体系的创始人。 1896年开始以动物为对象进行学习方面的研究。 1898年发表了博士论文动物的智慧:动物联想过程的实验研究,提出了对学习问题的系统见解和理论。 1912年当选为美国心理学会主席。 1917年当选为国家科学院院士。 在20世纪最著名的100位心理学家中名列第9位。,第三节 操作性条件作用理论,桑代克 (1874-1949),巴甫洛夫:“现在我必须承认,在这条途径上走第一步的荣誉是属于桑代克的。他的实验先于我们的实验2、3年,并且他的书无论是在对一个艰巨工作的勇敢展望上,还是在他的结果的准确性上,都必须被认为是经典性的。”,一、桑代克试误联结主义
3、理论 动物学习实验,桑代克的迷箱(puzzle box),第三节 操作性条件作用理论,第三节 操作性条件作用理论,(学习曲线),一、桑代克试误联结主义理论 基本观点 学习的实质:形成刺激反应(SR)的联结 联结(connection):是指某种刺激(情境)仅能唤起某种反应,而不能引起其他反应。 二者之间是直接的因果关系,而无需思考、观念作媒介公式为:S R 人生下来就有许多原本联结(原始趋向),教育就是保存、消除、利导和改变它们 人心就是一个联结系统,第三节 操作性条件作用理论,一、桑代克试误联结主义理论 基本观点 学习的过程:盲目的尝试与错误(trial and error)直至成功的渐进过
4、程 每个刺激反应联结都是经由先是错误的反应多于正确的反应, 而后逐渐变为正确的反应多于错误的反应, 最后达到全部为正确反应的程度。经由此种历程的学习方式,称为试误学习。,第三节 操作性条件作用理论,一、桑代克试误联结主义理论 基本观点 人和动物遵循同样的学习规律 准备律(law of readiness)学习者在学习开始时的预备定势。学习者有准备而又给予活动时就感到满意;有准备而不给予活动时则感到烦恼;无准备而强制活动也感到烦恼。,第三节 操作性条件作用理论,一、桑代克试误联结主义理论 基本观点 人和动物遵循同样的学习规律 练习律(law of exercise)一个学会了的反应的重复将增加刺
5、激-反应之间的联结。应用率:一个联结的应用会增强这个联结的力量失用率:一个联结的失用(不练习)则会导致这一联结的减弱或遗忘即S-R联结受到练习和使用的越多,就变得越来越强(应用率);反之,变得越弱(失用律)。,第三节 操作性条件作用理论,一、桑代克试误联结主义理论 基本观点 人和动物遵循同样的学习规律 效果律(law of effect)如果一个动作跟随情境中一个满意的变化,在类似的情境中这个动作重复的可能性将增加;如果跟随的是一个不满意的变化,这个行为的重复的可能性将减少。可见,个体当前行为的后果对决定其未来的行为起着关键的作用。,第三节 操作性条件作用理论,一、桑代克试误联结主义理论 基本
6、观点 人和动物遵循同样的学习规律1930年后,桑代克对他的准备率和练习律作了修改,把它们看做效果律的从属性原则(附律)。,第三节 操作性条件作用理论,一、桑代克试误联结主义理论 指导教育实践 准备律指导人们注意学习开始时的心理状态,适时地提供学习; 效果律指导人们使用一些具体奖励,如小红花、口头表扬等; 练习律指导人们对所有学生进行大量的重复练习和操作。他对教师的总的劝告是“集中并练习那些应结合的联结,并且奖励所想要的联结。”,第三节 操作性条件作用理论,一、桑代克试误联结主义理论 与巴甫洛夫理论之异同 同把学习看作是形成刺激和反应的联结异 巴甫洛夫:认为学习是通过刺激和反应的相继出现进行的,
7、先前刺激、环境决定行为桑代克:学习是通过行为受奖励而进行的,行为之后的刺激(后果)决定行为,第三节 操作性条件作用理论,二、斯金纳操作性条件作用理论,第三节 操作性条件作用理论,斯金纳其人 美国心理学家,新行为主义的代表人物,行为主义大师,行为主义心理学的集大成者。 发明斯金纳箱,提出操作性条件作用理论。 坚持行为科学可以改造教育,甚至改造社会。 1950年当选为国家科学院院士,1958年获美国心理学会颁发的杰出科学贡献奖,1968年获美国总统颁发的最高科学荣誉国家科学奖。 在20世纪最著名的100位心理学家中名列首位。,B. F. Skinner (19041990),二、斯金纳操作性条件作
8、用理论 经典实验,第三节 操作性条件作用理论,Skinner Box(1938),二、斯金纳操作性条件作用理论 基本思想和特色 继承和完善了桑代克的迷箱实验和效果律概念,明确提出了操作性条件作用理论,并使之对教育实践产生了巨大作用。 描述性研究,对行为的客观描述,预测和控制学习理论所要做的是查明引起反应概率变化的条件。所以心理研究者的任务就是给予已知的刺激,观察学习者的反应,从而探究学习的规律。操作行为主义,极端的客观、实证主义单被试设计(single-subject design),第三节 操作性条件作用理论,二、斯金纳操作性条件作用理论 基本概念 操作性条件作用(Operant condi
9、tioning)亦称工具性条件作用(instrumental conditioning)斯金纳所描述的条件作用形式。指有机体的操作性行为因有强化或无强化的伴随而相应增加或降低重复出现的概率。或者说,有意行为因其后果而增强或减弱的学习。,第三节 操作性条件作用理论,当你穿了一件新衣服,受到别人更多的称赞,你是否会经常穿那件衣服呢?当你讲完一个笑话,却没有人笑,你是否以后还会讲这个笑话呢?,操作性条件作用的事例,操作性条件作用的事例,311寝室的同学都十分喜欢看足球,世锦赛期间他们凑钱买了一台二手电视机。因为电视机质量的原因,有时候在看到最精彩的时候,电视突然没有图像了,他们非常着急,有人甚至会愤
10、怒地用力拍打电视机的外壳。然而,就在这时,电视机突然恢复了正常。以后,如果再发生类似情况,大家很可能会再拍打电视机,同学们就可能会养成一种“拍打”的习惯。,身边事例:,1、李江减少了投保龄球前的踏步数,他现在的命中率和全中率更高了。2、小明在课堂上看小说,老师严厉地批评了他,他再也没在课堂上看小说了。3、张平抄袭王刚的作业,老师同样给了他高分,他此后就经常抄别人的作业了。,二、斯金纳操作性条件作用理论 基本概念 应答性行为 vs.操作性行为 respondent behavior:由已知的刺激引起的,有机体被动地对环境刺激作出的反应。又称引发反应(elicited response)。被动性、
11、不随意性、由先前刺激直接引发 operant behavior:有机体自身发出的反应,与任何已知刺激物无关。又称为自发反应(emitted response)。是有机体作用于环境而产生一定结果的行为。主动性、随意性、由后继刺激控制,第三节 操作性条件作用理论,应答性或操作性行为?,金鸡报晓 眨眼反射 老马识途 肠胃蠕动 吮奶反射 喜怒哀乐 小狗识字 望梅止渴 跑步跨栏 体操表演 打呼噜 演绎推理 听写单词 听歌、跳舞,二、斯金纳操作性条件作用理论 基本概念 条件作用:S型 vs. R型 S型 ( Stimulation):针对的是应答性行为。是刺激(S)反应(R)的联结,反应由刺激引起。强化与
12、刺激直接关联。 R型(Reaction):针对的是操作性行为。是操作(R)强化(S)的过程,重要的是跟随操作后的强化(即刺激)。强化与反应直接关联。在学习情境中,操作性行为和操作性条件作用更有代表性。,第三节 操作性条件作用理论,经典性条件作用与操作性条件作用的区别,二、斯金纳操作性条件作用理论 操作性与经典性条件作用的关系 区别 无条件刺激的明确性不同。经典条件反射的无条件刺激物十分明确,而操作性条件反射的无条件刺激物不明确,一般认为是机体自身的一些因素促使机体操作动作的。 反应方式不同。在形成经典性条件作用时,个体是被动地接受刺激,反应是先天的;在形成操作性条件作用过程中,个体是自由活动的
13、,通过自身的主动操作来达到目的。 强化的方面不同。在经典性条件作用中,强化是同刺激有关,并出现在反应之前;而在操作性条件作用中,强化只同反应有关,而且出现在反应之后。,第三节 操作性条件作用理论,经典性条件作用为刺激替代型条件作用,而操作性条件作用为反应替代型条件作用,经典性条件作用是应答性行为的学习,而操作性条件作用是操作性行为的学习,二、斯金纳操作性条件作用理论 操作性与经典性条件作用的关系 联系 都是在一定环境作用下建立条件反射。 都需要强化,不强化就消退;在消退后又都会自然恢复。 都存在泛化和分化。 操作性条件作用对理解复杂的心理现象有进一步的意义,它是对经典性条件作用的一个很重要的补
14、充。 在现实生活中,一个复杂的反射活动,往往既包含有经典性条件作用又包含有操作性条件作用。,第三节 操作性条件作用理论,二、斯金纳操作性条件作用理论 基本概念 操作性条件作用(Operant conditioning)亦称工具性条件作用(instrumental conditioning)斯金纳所描述的条件作用形式。指有机体的操作性行为因有强化或无强化的伴随而相应增加或降低重复出现的概率。或者说,有意行为因其后果而增强或减弱的学习。,第三节 操作性条件作用理论,二、斯金纳操作性条件作用理论 强化理论 操作性条件作用的一般原则 任何反应如果随之紧跟强化刺激,这个反应都有重复出现的趋向。任何能提高
15、操作反应率的刺激都是强化刺激。,第三节 操作性条件作用理论,二、斯金纳操作性条件作用理论 强化理论 强化(reinforcement)和强化物(reinforcer) 强化:行为之后的某些刺激或事件导致行为重复发生的概率增加。 强化物:行为之后能增加行为发生概率的刺激或事件 强化的偶然性或依随性,“偶联”(contingencies of reinforcement)迷信行为,鸽子的迷信,第三节 操作性条件作用理论,刺激,二、斯金纳操作性条件作用理论 强化理论 正强化、负强化和惩罚 正强化(positive reinforcement) :行为之后呈现或增加某些刺激,使行为重复发生的概率增加(
16、表扬、奖励、微笑、奖金)。施所欲负强化(negative reinforcement) :行为之后消除或减少某些刺激,使行为重复发生的概率增加(完成作业快可以不做家务)。去所恶,第三节 操作性条件作用理论,二、斯金纳操作性条件作用理论 强化理论 正强化、负强化和惩罚 惩罚 (punishment):行为之后使行为重复发生的概率降低的刺激或事件 型惩罚:刺激出现或增加,降低行为发生概率(批评、训斥、罚站)。施所恶 型惩罚:刺激消失或减少,降低行为发生概率(不许看电视、不能外出)。去所欲,第三节 操作性条件作用理论,强化与惩罚的种类,强化与惩罚的种类,例题,某某如果坐在教室后面,并倒在座位后面,就
17、不会被提问。他不喜欢回答问题,所以就更频繁地倒在座位后面。从行为主义看来,他的倒在座位后面的行为是:a. 正强化b. 负强化c. 惩罚d. 塑造,例题:,某某是个臭名远扬的校园恶霸,但他也很有绘画的天赋。一次,教师当众表扬他的画,但这使他感到耻辱,从此再也不画画。是什么后果改变了他的画画行为? a. 正强化 b. 负强化 c. 呈现惩罚 d. 移除惩罚,练习,老师如何在教学中运用强化理论? 作业潦草是儿童不良行为,对于一次作业工整就加盖一个小红花,连续3次小红花,就加盖一个“一级棒”的大印章,连续2次“一级棒”就奖励小卡通画并上光荣榜,这是一种_的方式.所谓积极/正强化是由于某一刺激的加入增进
18、了某一操作反应发生概率的作用。,试根据斯金纳的理论,简述正强化、负强化、惩罚三者之间的区别。 (1)正强化与负强化都是提高反应发生概率,但正强化是通过呈现愉快刺激的方式来实现这一效果,而负强化则是通过撤销厌恶刺激的方式来实现这一效果。 (2)正强化与惩罚都是通过呈现刺激来实现效果,但正强化呈现愉快刺激,惩罚呈现厌恶刺激;正强化的目的是提高反应发生概率,惩罚则是降低反应发生概率。 (3)负强化与惩罚都有可能涉及厌恶刺激,但负强化是撤销厌恶刺激,惩罚是呈现厌恶刺激;负强化的作用是提高行为发生概率,惩罚则是降低行为发生概率。,思考,负强化是教师给学生消极的关注吗? 负强化是消极行为增加吗? 负强化是
19、一种比较温和的惩罚吗? 表扬会是惩罚吗? 训斥会是强化物吗?,使用惩罚要谨慎!,要慎用惩罚,这只能作为辅助手段,因为它会产生一些问题: 惩罚会成为学生粗野行为的榜样 使学生对实施惩罚的人产生消极情感 惩罚的效果一般不能持久,一旦停止惩罚,效果很难迁移到同样行为发生的其他环境 惩罚一般告诉学生什么是不可以的,但没有告诉学生怎么做,换个视角看孩子的错误,二、斯金纳操作性条件作用理论 强化理论 一级强化物(primary reinforcer)和二级强化物(secondary reinforcer),第三节 操作性条件作用理论,一级强化物和二级强化物,二、斯金纳操作性条件作用理论 强化理论 普雷马克
20、原理 用高频的活动作为低频活动的强化物,或者说用学生喜爱的活动去强化学生对不喜爱的活动的参与。 (祖母法则)( David Premack,1965)如:“吃完青菜才可以吃火腿。”“你必须吃完水果才能出去玩。” 每个人都有一个强化等级,第三节 操作性条件作用理论,思考:普雷马克原理的运用 例:必须先,然后才注意: 不可颠倒使用 运用要有节制 慎选强化物 注意行为质量,在家庭教育中,这一原则多在家,二、斯金纳操作性条件作用理论 强化理论 强化程式((reinforcement schedule) 反应受到强化的时机和频次。 分为: 连续式(continuous)间隔式(intermittent、
21、partial)间隔强化程式:时间和比率,固定和可变,第三节 操作性条件作用理论,强化程序分类及其效果,扇贝效应(scallop effect),强化程序分类及其效果,扇贝效应(scallop effect),强化程式的适当运用 一般来说,按比率强化的行为出现频率要高于按时距强化的行为;而变比率变时距的强化效果又优于定时距定比率的强化效果。训练一个新行为的形成,则连续强化的效率最高。理想的做法是:在条件反应形成期采用连续强化,在维持期采用断续强化,尤其是变比率变时距强化,教学应注意: (1)教新任务时,要进行即时强化,不要进行延缓强化;(2)在任务的早期阶段应对每一个正确的反应都进行强化,随学
22、习的进行逐渐转变为间隔强化;(3)不要一开始就要求做到十全十美,要朝正确的方向逐渐引导,增强学生的行为。,二、斯金纳操作性条件作用理论 操作性条件作用的其他规律 泛化:所习得的行为、技能或概念从一个情境迁移到其他情境。 分化(辨别):知觉到先前刺激的差异并针对差异作出不同反应。 先前刺激,线索(cue) 消退:消除强化从而消除或降低某个行为。 维持:行为的持续。自然强化,抵消消退,第三节 操作性条件作用理论,先行事件的作用 Role of Antecedents,提示线索(cue)或先行刺激(antecedent stimulus):表明哪些行为将受到强化或惩罚,如提前告知学生作品的评价标准,
23、分化(辨别)(discrimination):利用提示线索(cues)了解行为强化的最佳时机,如学生知道何时向老师提出合理要求,教师察觉课堂上学生的面部表情,二、斯金纳操作性条件作用理论 新行为的塑造(shaping)通过小步子强化来帮助学习者形成新行为的方法。 链式塑造:将任务分成许多小步子,一步一步越来越接近目标,完成每一步时都给予强化。其步骤为:(1)终点行为;(2)起点行为;(3)步调划分;(4)即时反馈与强化。 逆向链式塑造:就是“倒序”地习得复杂的行为。先从最接近目标的地方开始。,第三节 操作性条件作用理论,行为塑造,怎样训练一只老鼠跳舞,开始可以将食物与一个“卡搭”声配对,使这种
24、声音成为一种次级强化物。当老鼠动来动去时,卡搭声比食物较容易执行。 当老鼠向上看时,用卡搭声给予酬赏(强化)。 只有当它确实向上伸展它的头时才给卡搭声强化。 只当它用两只后脚站立时才给强化。 你奖励它向右踏步,再奖励它向左踏步。 完成了上述步骤后,你就有了一只会跳舞的老鼠了。,行为塑造的步骤:,选择目标。(终点行为) 了解学生目前能做什么或知道什么。(起点行为) 找出学生所在环境中的潜在强化物。(强化物) 将终点行为分解成有序的步骤,步调大小因学生的能力而异。(步调划分) 即时反馈学生的每步行为,使学生由起点行为逐渐向终点行为接近。(即时反馈),2018/11/17,64,二、斯金纳操作性条件
25、作用理论 程序教学 基于操作性条件反射和积极强化的原理而设计的教学模式,并设计了教学机器。 程序化教学的原则小的步子积极反应自定步调低的错误率及时反馈与强化 程序化教学的设计 直线式程序 分支式程序,第三节 操作性条件作用理论,二、斯金纳操作性条件作用理论 程序教学 评价 适合能力高且个性独立的学生,也特别适合那些差等生的自学需要。 但它基本上是一种自学程序,缺少学生与教师之间的互动。,第三节 操作性条件作用理论,二、斯金纳操作性条件作用理论 评价 贡献: 斯金纳发现了操作性条件反射现象,打破了传统行为主义的“没有刺激,就没有反应”的错误观点; 揭示出的强化规律客观可靠,对人类的行为管理和学生
26、学习过程的控制和激励有重要的参考价值; 总之,斯金纳克服了桑代克、华生等联结派学说解释学习现象的局限,扩展了联结派的眼界,加深了人们对行为习得机制的理解,使人们能成功地预测、控制和塑造、矫正行为; 程序教学理论对于今天的CAI教学产生深远的影响。,第三节 操作性条件作用理论,二、斯金纳操作性条件作用理论 评价 局限: 只注重描述行为,不注重解释行为;只注重外部反应和外部行为结果而不探讨内部心理机制。他把内部过程看成是一个“黑箱”; 由于种种因素的影响,其“程序教学理论”的实践效果并没有预期 的那么好; 把人的学习与动物学习等同起来,简单归结为操作性条件反射,过于偏狭; 不注重人学习的内部机制和过程,将人等同于学习机器。,第三节 操作性条件作用理论,第五章 行为学习理论,第一节 行为学习理论概述 第二节 经典性条件作用理论 第三节 操作性条件作用理论 第四节 社会学习理论及行为主义新进展,非常感谢!,