在關(guān)于狗乞食行為的例子中,狗在做出乞食反應(yīng)后,伴隨著一些愉快的事情(得到肉塊),所以會(huì)使其反應(yīng)增多。相似地,如果你學(xué)習(xí)后取得了好成績(jī),你就會(huì)繼續(xù)努力或更加努力地學(xué)習(xí)。在這一過(guò)程中,愉快的后果使反應(yīng)更可能發(fā)生,這叫正強(qiáng)化。
正負(fù)強(qiáng)化物和懲罰物
但也存在另一種類(lèi)型的強(qiáng)化——負(fù)強(qiáng)化(negative reinforcement),它涉及去除一些不愉快事物的過(guò)程。例如,如果有人總是嘮叨讓你學(xué)習(xí),當(dāng)你聽(tīng)從時(shí)就不再嘮叨,你的學(xué)習(xí)行為可能會(huì)增加——因?yàn)槟阆氡苊獗粐Z叨:同樣,吃藥會(huì)緩解病痛,在校園里刻意選擇走某條路就是為了避免碰見(jiàn)那個(gè)粗魯?shù)娜耍际秦?fù)強(qiáng)化發(fā)生的情況。
這種正負(fù)的區(qū)分也可用于懲罰:出現(xiàn)一些行為后,會(huì)發(fā)生一些不愉快事件(正懲罰),或者一些愉快事件被去除(負(fù)懲罰)。例如,如果你的朋友取笑你是個(gè)書(shū)呆子(正懲罰),或如果學(xué)習(xí)使你沒(méi)時(shí)間和朋友在一起(負(fù)懲罰),你可能就會(huì)停止學(xué)習(xí)。
正負(fù)強(qiáng)化和正負(fù)懲罰之間的區(qū)別常常是引起學(xué)生產(chǎn)生混淆的原因,它擾亂了許多聰明的大腦。如果你理解了“正”“負(fù)”與“好”“壞”無(wú)關(guān),就能更快地掌握這些術(shù)語(yǔ)。
它們是指是否呈現(xiàn)某物或拿走某物。在強(qiáng)化程序中,應(yīng)把正強(qiáng)化物看作某種增加或獲得的東西(你可以畫(huà)一個(gè)“+”號(hào)),負(fù)強(qiáng)化則是避免或逃離某種不愉快的事物(可以畫(huà)一個(gè)“—”號(hào))。
在這兩種情況下,反應(yīng)都變得更可能發(fā)生。還記得小艾伯特通過(guò)經(jīng)典條件反射學(xué)會(huì)恐懼老鼠時(shí)發(fā)生了什么嗎?在他學(xué)會(huì)恐懼后,逃離當(dāng)前可怕的情境時(shí),爬走的行為被強(qiáng)化了。逃離或避免某種不愉快事物帶來(lái)的負(fù)強(qiáng)化,可以解釋為什么如此多的恐懼可以長(zhǎng)久持續(xù),在避免一種可怕物體或情境的同時(shí),也切斷了所有消除恐懼的機(jī)會(huì)。
人們常常混淆負(fù)強(qiáng)化是可以理解的,這是因?yàn)槎叨及挥淇齑碳ぁ5牵趹土P中,你遭受了不愉快刺激,而在負(fù)強(qiáng)化中,不愉快刺激則被去除掉了。
為了正確理解這些術(shù)語(yǔ),應(yīng)當(dāng)記。簯土P(無(wú)論正負(fù))減少了反應(yīng)發(fā)生的可能性,而強(qiáng)化(無(wú)論正負(fù))則增加了這種可能性。
在現(xiàn)實(shí)生活中,懲罰和負(fù)強(qiáng)化常常同時(shí)存在。如果你使用項(xiàng)圈來(lái)教狗跟隨主人,那么猛拉項(xiàng)圈就是對(duì)它走到你前面去的懲罰,而放松項(xiàng)圈就是對(duì)狗在你旁邊的負(fù)強(qiáng)化。
你可以通過(guò)休息一會(huì)兒來(lái)正強(qiáng)化你對(duì)這些材料的學(xué)習(xí),當(dāng)你已經(jīng)掌握了這些材料時(shí),焦慮降低就將對(duì)你的學(xué)習(xí)產(chǎn)生負(fù)強(qiáng)化。但是,我們希望你不會(huì)對(duì)自己說(shuō)“我永遠(yuǎn)也會(huì)不了”或“這太難了”來(lái)懲罰你的努力。
操作性條件反射的原理
研究者進(jìn)行了數(shù)以千計(jì)操作性條件反射的研究,其中許多都是以動(dòng)物為被試進(jìn)行的。一種受歡迎的研究工具是斯金納箱(Skinner box),它有一種裝置,當(dāng)動(dòng)物做出期望反應(yīng)時(shí)就給它食物或水,當(dāng)做出不期望的反應(yīng)時(shí)就給它電擊。
在現(xiàn)在的版本中,電腦會(huì)記錄反應(yīng)并生成一張圖,表明反應(yīng)隨時(shí)間而增加的次數(shù)。
在斯金納(Skinner,1938)的早期學(xué)術(shù)生涯中,他使用斯金納箱經(jīng)典地證明了操作性條件反射。他將先前學(xué)會(huì)了通過(guò)食物釋放裝置吃東西的老鼠放在箱中,因?yàn)闆](méi)有食物,老鼠表現(xiàn)出典型的行為,倉(cāng)皇四竄、到處嗅聞,偶爾會(huì)碰到地板和墻。非常偶然地,它壓到了墻上的杠桿,一粒美味鼠食立即掉在食盤(pán)中。
然后老鼠又四處亂竄,再次偶然地碰到杠桿,得到食物。再經(jīng)過(guò)幾次這樣碰到杠桿得到食物的重復(fù),它的行為就開(kāi)始減少隨機(jī)性,能夠更協(xié)調(diào)地按壓杠桿。最后,斯金納使老鼠學(xué)會(huì)了盡可能快地按壓杠桿。
消退
就像經(jīng)典條件反射那樣,在操作性條件反射中,消退(extinction)是導(dǎo)致先前習(xí)得反應(yīng)消失的程序。在操作性條件反射中,保持反應(yīng)的強(qiáng)化物被去除或不能得到時(shí)就會(huì)發(fā)生消退。起初,可能會(huì)出現(xiàn)反應(yīng)爆發(fā),但隨后反應(yīng)就會(huì)漸漸變?nèi),最終則會(huì)消失。
設(shè)想一下,若你在售貨機(jī)里投入一枚硬幣,卻什么也沒(méi)得到,你也許會(huì)投入另一枚硬幣,甚至兩枚,但隨后你就可能會(huì)停止嘗試。第二天,你也許還會(huì)投入一枚硬幣,這是自然恢復(fù)的例子。但最終,你會(huì)放棄那臺(tái)機(jī)器。你的反應(yīng)已經(jīng)消退了。
刺激泛化和分化
就像經(jīng)典條件反射那樣,在操作性條件反射中也可能發(fā)生刺激泛化2(stimulus generaliza-tion)。也就是說(shuō),反應(yīng)可能會(huì)泛化到在最初的學(xué)習(xí)情境中沒(méi)有出現(xiàn)的但在某種程度上類(lèi)似于最初刺激的刺激。
例如,通過(guò)訓(xùn)練已經(jīng)學(xué)會(huì)啄圓形的鴿子,也會(huì)啄有點(diǎn)橢圓的圖形。但是,如果你想訓(xùn)練這種鳥(niǎo)辨別這兩種形狀,你就應(yīng)同時(shí)呈現(xiàn)圓形和橢圓,每次鴿子啄圓形時(shí)就給出強(qiáng)化物,啄橢圓時(shí)就不給強(qiáng)化物,最后它就會(huì)產(chǎn)生刺激分化(stimulus discrimination)的反應(yīng)。
事實(shí)上,鴿子已經(jīng)獲得了特殊的辨別能力,它們甚至學(xué)習(xí)了區(qū)別凡·高(Van Gogh)和馬克·夏卡爾(Marc Chagall)的油畫(huà)(Watanabe,2001),然后,呈現(xiàn)這兩位畫(huà)家的其他兩幅作品,它們也能區(qū)分開(kāi)。
有時(shí),動(dòng)物或人只有在其他一些刺激存在時(shí),才能學(xué)會(huì)對(duì)刺激反應(yīng),這種刺激叫作辨別刺激。
這種辨別刺激提示了反應(yīng)是否會(huì)得到獎(jiǎng)勵(lì)。對(duì)于斯金納箱中的鴿子來(lái)說(shuō),燈光可以作為啄圓形的辨別刺激。燈亮?xí)r,啄的行為會(huì)得到獎(jiǎng)勵(lì);燈滅時(shí),啄的行為是徒勞的。人類(lèi)的行為被許多辨別刺激所控制,如語(yǔ)言(營(yíng)業(yè)時(shí)間是9點(diǎn)到5點(diǎn))和非語(yǔ)言的(交通信號(hào)燈、門(mén)鈴、電話鈴、別人的面部表情)。為了有效生活并與他人相處,我們都學(xué)會(huì)了如何在辨別信號(hào)呈現(xiàn)時(shí)做出正確反應(yīng)。按程序?qū)W習(xí)
通常來(lái)說(shuō),當(dāng)一種反應(yīng)剛開(kāi)始形成時(shí),如果每次反應(yīng)都得到強(qiáng)化,學(xué)習(xí)得最快,這種程序叫作連續(xù)強(qiáng)化。但是,一旦反應(yīng)變得確實(shí)會(huì)發(fā)生,如果用間隔(部分)強(qiáng)化程序,反應(yīng)就不太可能消退,這種程序只對(duì)一些反應(yīng)進(jìn)行強(qiáng)化。
在斯金納(Skinner,1956)的研究中,偶爾會(huì)發(fā)生食球短缺的情況,斯金納被迫降低了強(qiáng)化物的發(fā)放頻率,卻意外地發(fā)現(xiàn)了這個(gè)事實(shí)。
在間隔強(qiáng)化程序中,一些間隔程序只在一定次數(shù)反應(yīng)后,給出強(qiáng)化物;另一些間隔程序只對(duì)上次強(qiáng)化物出現(xiàn)一定時(shí)間后做出的反應(yīng)進(jìn)行強(qiáng)化。這影響了行為的頻率、形式和時(shí)機(jī)。
間隔強(qiáng)化有助于解釋為什么人們常常喜歡“幸運(yùn)”帽、護(hù)身符和宗教儀式。一個(gè)擊球手摸了一下耳垂,然后打出了一記本壘打,從那時(shí)起,他每次走向本壘時(shí)都要摸一下耳垂。一個(gè)學(xué)生考試用紫色筆得了A,此后她每次考試都用紫色筆。
這些儀式會(huì)繼續(xù)下去,因?yàn)橛袝r(shí)它們會(huì)很偶然地帶來(lái)強(qiáng)化物(擊中球、好成績(jī)),所以它們不會(huì)消退。
斯金納(曾通過(guò)在實(shí)驗(yàn)室中制造了8只“迷信的”鴿子證明了這種現(xiàn)象。他操縱鴿籠,即使鴿子一動(dòng)不動(dòng),也讓食物每15秒送達(dá)一次。鴿子常常在活動(dòng),所以當(dāng)食物來(lái)了時(shí),每只動(dòng)物都可能正在做著什么,這種正在做著的行為被食物的送達(dá)所強(qiáng)化。
行為當(dāng)然完全是偶然被強(qiáng)化的,但仍然很可能再次發(fā)生,這樣就被再次強(qiáng)化。在很短時(shí)間內(nèi),6只鴿子一直在練習(xí)某種儀式性的行為——逆時(shí)針轉(zhuǎn)圈,上上下下地輕輕點(diǎn)頭,或者搖著頭走來(lái)走去。
這些活動(dòng)都由于強(qiáng)化物的出現(xiàn)而具有很大的效果;這些鴿子表現(xiàn)出“迷信行為”。它們似乎認(rèn)為是自己的動(dòng)作帶來(lái)了食物。
現(xiàn)在要集中注意了,因?yàn)橄旅媸顷P(guān)于操作性條件反射所要了解的最有用的東西。如果你想在習(xí)得后能持久地保持某種反應(yīng),那么就應(yīng)該使用間隔強(qiáng)化,而非連續(xù)強(qiáng)化。
如果你的倉(cāng)鼠哈里用鼻子推彈球,你連續(xù)給它強(qiáng)化,隨后你突然停止了強(qiáng)化,哈里就會(huì)很快停止推球。因?yàn)閺?qiáng)化的改變是巨大的,從連續(xù)強(qiáng)化到根本沒(méi)有強(qiáng)化,哈里能很容易辨別出這種改變。但是如果你只是經(jīng)常強(qiáng)化哈里的行為,變化就不會(huì)這樣顯著,你那饑餓的倉(cāng)鼠將會(huì)繼續(xù)應(yīng)答一段時(shí)間。
被間隔強(qiáng)化的鴿子、老鼠和人,在停下休息之前,特別是強(qiáng)化物出現(xiàn)的時(shí)機(jī)有變化時(shí),已經(jīng)在實(shí)驗(yàn)室中沒(méi)有強(qiáng)化的情況下應(yīng)答了幾千次。動(dòng)物有時(shí)會(huì)為了不可預(yù)測(cè)的、不常出現(xiàn)的一點(diǎn)食物而如此努力地完成任務(wù),它們消耗的能量比從獎(jiǎng)賞中獲得的食物還多。從理論上講,它們實(shí)際上能一直工作到死!
因此,如果你想消除自己或別人的某種反應(yīng),你就要小心,不要對(duì)它進(jìn)行間隔強(qiáng)化。如果你想通過(guò)忽略它來(lái)消退非期望行為,你必須完全一致地去避免強(qiáng)化(你的注意),如孩子的哭鬧、朋友的午夜電話、父母的煩人建議。
否則,別人會(huì)學(xué)會(huì),如果他或她一直哭叫、打電話或提建議的時(shí)間足夠長(zhǎng),他們最終會(huì)得到獎(jiǎng)賞。從行為主義的觀點(diǎn)來(lái)看,人們犯的最普遍的錯(cuò)誤就是,他們間歇地獎(jiǎng)勵(lì)他們想要消除的反應(yīng)。
來(lái)源:教育相先生