幼儿学习与发展
上QQ阅读APP看书,第一时间看更新

第7章 幼儿学习理论(2)

自然恢复(spontaneous recovery)

经过一段时间条件刺激总不出现,条件反射基本消退之后。如果随后再次呈现条件刺激,条件反射又会重新出现,我们就说条件反射在消退之后又自然恢复了。条件反射自然恢复后不会持续很长时间,除非再次出现条件刺激。条件刺激和非条件刺激的同时出现使条件反射得到全面的恢复。

泛化(generalization)

泛化指的是和条件刺激相似的刺激引起了条件反射。狗一旦建立起条件反射,听到节拍器每分钟嘀嗒嘀嗒地敲70次就分泌唾液,有时当节拍器敲击的速度变快或变慢,甚至钟表或计时器的嘀嗒声也能使它分泌唾液。新的刺激和条件刺激的相似性越小,泛化出现的可能性就越小。

辨别(discrimination)

辨别是和泛化互补的过程。当狗学会对条件刺激作出反应而对其他类似的刺激不作出反应时,辨别就出现了。要训练辨别能力,实验人员可以在条件刺激出现时呈现无条件刺激,而在其他类似的刺激出现时不呈现无条件刺激。例如,假定条件刺激是节拍器每分钟发出70次嘀嗒声,那么一出现这种声音就呈现无条件刺激,而出现其他节律(如每分钟50或90次)的嘀嗒声就不出现无条件刺激。

高级条件反射(higher-order conditioning)

刺激物一旦变成了条件刺激,就可以起到无条件刺激的作用,这个过程就叫作高级条件反射。如果狗一听到节拍器发出每分钟70次的嘀嗒声就作出分泌唾液的条件反射,那么节拍器就可以作为引起高级条件反射的无条件刺激。让新的中性刺激(如蜂音器)响几秒钟,紧跟着出现节拍器的嘀嗒声。试验几次后,狗一听到蜂鸣声就分泌唾液,此时,蜂鸣声就变成了第二级的条件刺激物。

高级条件反射是一个十分复杂、不易理解的过程。这个概念从理论上探讨是很有意思的,有助于解释一些社会现象(如测验失败)为什么可以引起条件性的情绪反应,如紧张和焦虑。在年纪较小时,失败也许只是一个中性事件,然后会逐渐地与家长、老师的批评联系起来。批评是引起焦虑的无条件刺激。通过条件反射,失败就能引起焦虑。与情境有关的线索也可以成为条件刺激。因此,当学习者走进即将举行测验的教室或当老师宣布不久就要进行考试时,学习者就会感到非常焦虑。

资料卡

情绪的条件反射

经典条件反射理论可用来解释某些机能失调的行为。刚入幼儿园的幼儿可能都会产生与新的经历有关的恐惧。在学年刚开始的时候,幼儿园教师可以安排一些活动,使幼儿对这些最初的恐惧减少一些敏感。教师可以安排几次入园前的参观活动,让幼儿有机会见到自己的老师和同学,见到自己的教室和写有自己名字的座位。开学头几天,教师还可以开展一些有意思但相对来说比较平静的活动,如让幼儿了解自己的老师、同学、教室和教学楼等。幼儿可以先游览教学楼,然后回到自己的教室,在教室里画画,和同学们谈谈自己所看到的一切。教师可以把幼儿带到办公室见园长、园长助理、校医和顾问等,让他们玩名字游戏,在游戏中幼儿先作自我介绍,然后设法回忆其他同学的名字。

这些活动属于非正规的脱敏方法。对一些幼儿来说,和幼儿园有关的线索都能引起焦虑。有意思的活动能够引起愉快的情绪,这些愉快的情绪和焦虑是互不相容的,把有意思的活动和有关幼儿园的线索联系起来,就可以减少后者所引起的焦虑。

(资料来源:戴尔·H.申克,《学习理论》,江苏教育出版社,2012)

二、斯金纳的操作性条件反射学习理论

斯金纳(B.F.Skinner,1904-1990),美国著名的行为主义心理学家,新行为主义的代表人物斯金纳早年立志成为一名作家,但遗憾的是早年他在写作方面的努力备受打击。然而在他有幸拜读了巴甫洛夫写的《条件反射》(Conditioned Reflexes)和华生写的《行为主义》(Behaviorism)以后,他开始对心理学产生了浓厚的兴趣。以巴甫洛夫经典条件反射理论和桑代克学习理论为基础,于1937年他提出了对当代心理学产生了深远影响的操作性条件反射原理,其相关的思想在今天的教育心理学,特别是儿童心理干预与矫正中依旧被广泛的应用。

同大多数的行为主义心理学家一样,斯金纳的操作性条件反射理论也是建立在大量动物实验的基础上。为进行动物实验,斯金纳设计了符合其操作条件作用学习理论的仪器,即“斯金纳箱”(Skinner box)。它是一个大约0.3米高的立方体箱子,箱子内设有一个杠杆装置和一个食物盘,如果里面的动物按压杠杆,就会有食物落入盘中。斯金纳把一只饥饿的白鼠放入箱中,白鼠在饥饿的刺激下不停地活动,产生一系列的行为反应(R),其中偶然出现的按压杠杆的行为会为它带来少量食物(S),白鼠吃完食物后继续活动。偶然按压杠杆得到食物的反应-刺激会继续发生,这种在行为之后出现的刺激对行为本身是一种强化。白鼠在一次次获得食物刺激的奖励下,逐渐学会主动地按压杠杆来获取食物。这就是一个操作性条件反射形成的过程。

在20世纪30年代初,斯金纳发表了一系列论文,报道了他用动物做实验所获得的研究结果。在研究中他发现了操作性条件反射的各种成分。

斯金纳认为学习是“复杂情境中各种反应的重新组合”;条件反射是指由强化引起行为的加强。条件反射存在两种形式,一种是S型,另一种是R型。S型条件反射是巴甫洛夫的条件反射,其特征是强化(无条件)刺激和另一个(条件)刺激成对出现。这种条件反射使人们对引起有机体反应的刺激给予了重视。对刺激作出的反应就是人们熟知的反应性行为。

S型条件反射虽然能解释条件性情绪反应,然而,人的大多数行为在刺激一出现时就出现了,而非由刺激机械地引起。反应受结果控制,不受先前刺激的控制。斯金纳把这种行为称为R型条件反射,目的是要强调反应方面。从它作用于环境产生某种效果来看,这种行为是操作性的。

我们可能认为操作性行为是在“做中学”,事实上,我们在行为的过程中有许多学习正在发生着。与反应性行为(它在条件反射形成之前不会出现)不同,操作性行为出现的概率永远不等于零,因为必须作出反应才可能获得强化。强化改变了反应出现的可能性或频率。操作性行为作用于它们所在的环境,由于强化,它们出现的可能性会变大或者变小。

强化(reinforcement)起到使反应增强的作用,即提高了反应的效率,或者说使反应更有可能发生。强化物或强化刺激(reinforcing stimulus)指的是任何在反应之后出现的使反应增强的刺激或事件。强化物(奖励)的定义以他们产生的效果为基础,而非取决于意识、意图和目标这类心理过程。强化物不能事先确定,而必须由它们产生的效果来定,强化物是根据具体的情境来说的,它们只适合于某个时间某种情况下的个体。

正强化(positive reinforcement)包括反应之后出现一个刺激或把一些东西加入某个情境中,使该反应今后在该情境中出现的可能性提高的各种情况。正强化物(positive reinforcer)指的是反应之后出现的,使该反应今后在该情境中出现的可能性提高的刺激物。

负强化(negative reinforcement)是在反应之后取消某个刺激或从情境中抽走某些东西,他提高了该反应在该情境中出现的可能性。负强化物(negative reinforcer)指的是反应之后被取消的,使该反应今后在该情境中出现的可能性提高的刺激物。一些刺激物常常起到负强化物的作用,如强光、噪音、批评、讨厌的人、低分数等,因为移去这些事物的行为可以产生强化作用。正、负强化物都能产生同样的效果,即当刺激出现时,提高某个反应的出现频率。

诸如食物、水、住所之类的刺激物叫作一级强化物,因为它们是基本的生存条件。二级强化物是通过和一级强化物形成联结而变成条件的刺激物。通过和牛奶(一级强化物)形成联结,婴儿最喜欢奶瓶成为二级强化物。和不止一个强化物形成联结的二级强化物叫做一般性强化物。

惩罚(punishment)降低了今后对刺激作出反应的可能性。惩罚包括撤销正强化物和反应之后出现负强化物两种情况。惩罚压制反应,但无法使反应消除,当惩罚取消了,被惩罚的反应还可能恢复。惩罚的效果是十分复杂的。

资料卡

替代惩罚的方法

一是改变能够引起消极行为的辨别性刺激。例如,坐在教师后面的学生经常会调皮捣蛋,教师可以改变辨别性刺激,让这个违纪的学生移到前面的位子上去。

二是让不希望出现的行为继续表现,直到行为者满足为止。例如家长可以让孩子一直发脾气直到孩子疲劳为止。

三是用不理会的方法消除不希望出现的行为,这种方法对小的违纪行为很奏效。

四是把不相容的行为与正强化物建立条件反射。教师表扬富有成效的学习习惯,这有助于学生建立这些习惯的条件反射。

这种替代惩罚的方法的最大优点是让学生知道怎样做才是对的。

普雷马克原理(Premack principle)认为,提供价值较高的活动机会能够强化从事价值较低的活动。在这里,要根据在没有强化的情况下作出反应的数量或花在活动上的时间来定义“价值”。如果所安排的相倚活动的情况是第二个(相倚)事件的价值高于第一个(工具性)事件的价值,那么第一个事件发生的概率预计会提高(奖励假说)。如果第二个事件的价值低于第一个事件的价值,那么第一个事件发生的可能性应该降低(惩罚假说)。

由于强化物的价值会变化,所以这个顺序不是永远不变的。任何强化物,如果经常使用,都会导致饱和(satiation),使反应的可能性下降。应用普雷马克原理的教师需要定期观察学生,询问他们喜欢做的事情,以便检查他们的偏好。在制订计划时,最关键的一个环节就是预先确定在情境中哪个强化物可能最有效。

强化的安排指的是确定什么时候给予强化。

1.连续强化程式。指的是对每一个正确的反应都给予强化。在学习技能时,这种安排是有必要的。学生们在作出每个反应之后都得到有关他们工作正确性的反馈,连续的强化有助于确保学生不去学习各种错误的反应。

2.定时强化程式。使用定时强化程式,只对动物在固定时间间隔作出的第一个正确反应进行强化。例如,只有间隔3分钟的反应才会受到强化。在定时间隔的开始,动物反应很慢或根本就没有反应。在快接近时间间隔的末尾时,动物逐渐提高了反应的速度,显然它是预期到强化时刻的到来,这类反应在累计记录中形成一种模式,被称作定时扇贝。

3.定比强化程式。通过定比强化程式,动物作出的每一个第N次反应都会受到强化,在定比强化程式中,动物在受到强化之前必须作出一定数量的反应。

4.不定时强化程式。通过不定时强化程式,动物在不定的时间间隔结束时反应会受到强化。也就是说,它不同于定时强化程式有一个固定的时间间隔,相反,在不定时强化程式中,动物也许会在接受一次强化后即刻受到强化,也可能在其他一个不确定的时间受到强化。这种程式消除了定时强化程式中的扇贝效应,并产生了一个稳定的、适度的高反应率。

5.不定比强化程式。通过定比强化程式,动物在作出一定量的反应,如5个后会受到强化;用不定比强化程式,动物平均每5个反应会受到强化,因此,动物也许会连续2次受到强化,也可能作10次或15次反应都没有强化。

总的来说,连续强化对消退产生的抵制最小,并在训练期间产生的反应率最低。所有的部分强化程式都比连续强化对消退的抵制更大,并在训练期间有更高的反应率。一般而言,不定比强化程式产生的反应率最高,其后依次为定比强化程式、不定时强化程式、定时强化程式,最后是连续强化程式。

资料卡

行为塑造与矫正

通过操作性条件反射进行行为改变的基本方法是塑造(shaping),要塑造行为,教育工作者应该遵循以下步骤:

1.确定学生现在能做什么事情(起点行为)。

2.确定理想的行为。

3.识别学生所在环境中的潜在强化物。

4.把终点行为(第二步)分解成可以按顺序掌握的细小步骤。

5.经过不断的强化每一个接近终点的行为,使学生由起点行为逐渐向终点行为靠近。

塑造就是通过不断地纠正反馈,在行动中学习。

(资料来源:戴尔·H.申克,《学习理论》,江苏教育出版社,2012)