还记得斯金纳箱里那只贪吃的小老鼠吗?上一期我们一起学习了关于operant conditioning(经典条件反射)的基本概念,还了解了reinforcement(强化)和punishment(惩罚)。在这一期推送中,我们将更细致地区分它们的不同类型。
本文目录
1.Positive Reinforcement V.S. Negative Reinforcement
2.Positive Punishment V.S. Negative Punishment
3.Primary Reinforcement V.S. Secondary Reinforcement
01、 Positive Reinforcement 正强化V.S. Negative Reinforcement 负强化
单从字面意思来看,positive reinforcement这个概念的存在好像还挺合理的;但在看到negative reinforcement的时候,你是否一脸问号???“负”和“强化”放在一起怎么看起来这么奇怪和矛盾?
首先需要明确的是,无论是哪种reinforcement,它终究是reinforcement,也就是行为导致的结果一定是令人开心的,以及最终我们做这件事情的频率是会增加的(被reinforce)。 然后,其实positive和negative指的就是达到同样的上述目的的两种不同方式。
Positive reinforcement指的是通过给予某些令人快乐的事物使特定行为出现的频率增加,而negative reinforcement指的是通过移除、拿走某些令人不快的事物使特定行为出现的频率增加。
想想看,positive有“+”的意思,可以和“增添、给予”联系在一起;negative有“-”的意思,可以和“拿走、移除”联系在一起,这样就很好记啦! 幼儿园和小学低年级的老师常常会奖励表现好的同学小红花,孩子们得到了小红花很开心,从而更努力地好好表现,这是positive reinforcement的一个例子。
再举一个negative reinforcement的例子:为了激励同学们认真复习,在期末考试中取得好成绩,小黄老师大手一挥,“期末数学满分的同学寒假就不用写那10(+N…)张卷子了!”由于写作业(对大多数同学来说)并不是什么令人感到愉快的事情,小黄老师通过减免作业的方式可以激励同学们努力学习数学,使“学习数学”这一行为的频率增加。(O.S.数学根本不可能满分;O.S. * 2 数学满分的学霸大概率会以写卷子为乐,减了也没区别hhh)
02、Positive Punishment正惩罚V.S. Negative Punishment负惩罚
对positive & negative reinforcement这两个概念的理解完全可以迁移到positive & negative punishment上来。分析思路是非常相似的: 首先,无论是哪种punishment,行为导致的结果一定是令人不快的,以及最终我们做这件事情的频率是会减少的(被抑制)。
Positive 和negative依然指的是达到同一目的的两种不同方式,前者与“增添、施加”有关,后者与“移除”有关。在查看下面表格中的具体定义之前,先请你尝试推测一下positive & negative punishment的含义。
再举两个例子帮助大家理解:
当小明同学因为在考试时忘记写自己的名字而被老师罚抄时,老师就运用了positive punishment的方法,老师将“罚抄”这个令人不快的后果施加在小明身上,促使小明以后越来越少忘记在考卷上写名字。
而闯红绿灯、乱停车被罚款、吊销驾照则属于negative punishment的应用,通过从违反交通规则的司机身上拿走钱、拿走驾照警醒他们,使他们违反交通规则的行为越来越少发生。
【考点提示】
Positive/Negative reinforcement/punishment这四个概念常常会混合在一起考察(出题人故意的,就知道我们很容易混淆它们!),比如在选择题中,题目常常会描述一种情形,请你判断这体现了四个概念中的哪一个。
不要慌,只要掌握清楚它们的概念,再配合接下来这个解题步骤,你就能百发九十九中:
让我们借助这个步骤做个小练习~
题目:Emilie stretches to avoid a sports injury. Does the situation describe positive reinforcement (PR), negative reinforcement (NR), positive punishment (PP), or negative punishment (NP)?
解题步骤:
Step 1:区分行为和后果 ——在题目给出的情形中,行为是 “Emilie stretches”, 行为导致的后果是 “avoid a sports injury”;
Step 2:判断positive/negative—— 在后果 “avoid a sports injury” 这一表述中,“avoid”一词告诉我们是sports injury这个事物被remove了,因此应该是negative;
Step 3:判断reinforcement/punishment ——“avoid a sports injury”是一个令人愉快还是令人不快的结果呢?不受伤当然是好事啦!这是一个令人愉快的结果,Emilie拉伸这一行为会被促进,出现的频率增加,所以应该是reinforcement。
综上所述,the situation describes negative reinforcement (NR). 所以,只要耐心地一步一步进行判断,最后就一定会得出正确的结果,切勿心急跳步噢!
03、Primary Reinforcement 一级强化 V.S. Secondary Reinforcement 二级强化
在解决完前面容易混淆的概念们后,最后primary 和 secondary reinforcement的区分就简单多了。 Primary reinforcer指的是那些自身就带有奖励(rewarding)性质的强化物,那些生物天生就喜欢和需要的东西,包括水、食物、温暖等。
而secondary reinforcer本身是中性的,我们天生既不喜欢也不讨厌它们,只是随着经验的不断积累,我们逐渐知道了它们的奖励性质, 从而喜欢它们,比如钱、好成绩、赞扬等;毕竟,钱要是不能用来买吃的用的,其实对我们来说就是废纸一张。
Generalized reinforcer是一种特殊的secondary reinforcer,这种强化物充当着一般等价物的角色,它可以被用来交换其他的物品;money是最最典型的例子,其他的例子还包括学校里可以用来换小礼品的印章、贴纸。 Token economy(代币制)是一种建立在generalized reinforcer之上的系统,它的主要目的是调整人们的行为,学校、监狱、精神病医院等常常会应用这种系统。
一些老师会给小朋友们做一张收集贴纸或印章的小本本,每次小朋友行为表现良好,就会在小本本上盖一个大红花或者“你真棒(๑•̀ㅂ•́)و✧”之类的印章,收集到一定数目的印章后就可以兑换礼物。通过利用token economy,老师可以促进小朋友们的良好行为,老师和小朋友们都很开心,两全其美。
04、 (伪)Primary Punishment V.S. Secondary Punishment
有同学也许会奇怪在最开始的树形图中为什么没有包含primary/secondary punishment。其实这两个概念是存在的,和primary/secondary reinforcement的区别十分相似。但因为AP心理不怎么考察它们,这里就不多赘述啦。
结 语
对operant conditioning的学习可以帮助你识别生活中对其广泛的应用,比如老师将学习目标分解成一个个小的知识点讲解、给予强化,又比如打游戏时每通过一个关卡就可以收获奖励、促使你有继续玩的欲望。
希望你可以利用这一概念和相关的原理帮助你更好地学习、生活,并警惕自己被利用的可能性~ 本期的内容就到这里啦!你可以利用下面的思维导图,给自己复述一遍重点概念,再举一些生活中的例子强化理解,检测一下自己的掌握情况~