Artwork

内容由鏡好聽提供。所有播客内容(包括剧集、图形和播客描述)均由 鏡好聽 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal
Player FM -播客应用
使用Player FM应用程序离线!

打開史金納的箱子:行為主義大師史金納與操作制約學習【謝伯讓|大腦好好玩 S04 EP02】

16:07
 
分享
 

Manage episode 306309095 series 2890208
内容由鏡好聽提供。所有播客内容(包括剧集、图形和播客描述)均由 鏡好聽 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal

第四季第一集的《大腦好好玩》裡,主持人謝伯讓介紹到將「古典制約學習」在人類身上發揚光大的心理學家華生(John Watson)。這一集的節目,則要介紹開創行為主義重要理論「操作制約學習(operant conditioning)」的心理學家史金納(B.F. Skinner)。

這位美國行為主義的大師,是如何從美國教育心理學之父桑代克(Edward Thorndike)的三項學習定律延伸設計實驗,嘗試驗證「操作制約學習」理論?而「操作制約」的學習現象,又是如何透過「強化(​​reinforcement)」與「處罰(punishment)」兩大操作要素,影響動物與人類的學習結果?

本集重點:

04:55 桑代克的三項學習定律

10:31 操作制約學習理論基本概念介紹

延伸閱聽:

《動物好好玩》第二季 EP02|哪種鳥比鸚鵡還會模仿?緝毒犬如何學會找毒品?談動物的學習能力:https://mirrorvoice.com.tw/podcasts/124/2127

謝伯讓的腦科學世界:https://www.facebook.com/pojanghsieh

【本集節目是由鏡好聽製作播出的《大腦好好玩第四季》】

每隔週四上線全新一集

開啟小鈴鐺、按下追蹤,持續關注最新節目

製作人:余韋達

後製:孫藝庭

圖片:Shutterstock

鏡好聽全新改版上線!想聽愛聽就在鏡好聽,訂閱《鏡好聽》並下載 APP 收聽,只給你最好的聲音。

| 立即訂閱《鏡好聽》:https://www.mirrorvoice.com.tw/mirrorvoice-plus

| 免費下載《鏡好聽》APP:https://mirrormediafb.pros.is/LY67K

| 追蹤《鏡好聽》Facebook:https://facebook.com/mirrorvoice2019

| 追蹤《鏡好聽》Instagram:https://instagram.com/mirror_voice

| 合作、節目建議歡迎來信:voiceservice@mirrormedia.mg

節目內容全文:

在上一集的節目中,我們介紹了美國行為主義心理學家華生(John Watson),這位華生,可以說是帕伐洛夫古典制約學習理論在美國的繼承人。而今天,我們則要繼續介紹美國的另一位行為主義大師史金納(B.F. Skinner)。

史金納和華生雖然都是行為主義心理學家,但是兩者最大的差異就是,史金納並沒有延續帕伐洛夫的古典制約研究典範,而是自己開創出了另外一種制約典範,我們現在稱之為操作制約(operant conditioning),那我們待會,就會針對這個典範來做仔細介紹。

在介紹操作制約學習之前,我們先再來回顧一下帕伐洛夫和華生的古典制約學習。我們現在已經知道,古典制約(classical conditioning),這種制約學習,就是在學習兩個刺激之間的關聯性,好讓我們可以預期某個即將到來的事件,以便提前做出反應。

那操作制約又是什麼呢?操作制約(operant conditioning),就是當我們做出某一個行為之後,我們可以根據這個行為的後果,來改變我們以後的行為。比方說,如果做出一個行為之後會得到獎賞,那這個行為就會被強化,但是如果做出一個行為之後會得到懲罰,那這個行爲就會被弱化,這種學習方式,就叫做操作制約學習,也就是根據行為操作的結果來進行學習。

至於操作制約學習現象最開始是如何被發現的呢?關於操作制約的最早發現者,可以追溯到20世紀初期的一位美國心理學家桑代克(Edward Thorndike)。這位桑代克,算是美國的「教育心理學之父」,而且應該也是早期美國最多產的、論文數量最豐富的一位心理學家,他在研究生涯之中,就發表了超過500篇的論文和書籍,而他也是美國國家科學院中第一位入選院士的心理學家。

桑代克當年非常關心的一個問題就是,包括人類在內的各種動物,到底是怎麼學會新事物或新技能的?

・桑代克的迷籠

為了研究這個問題,桑代克就設計了一種叫做「迷籠」的道具,迷宮的迷,籠子的ㄌ籠,英文是(puzzle box)。所謂的迷籠,就是一個裡面藏有機關的籠子,如果動物想要逃脫這個籠子來取得籠子外的食物,那就得要自己去學會如何觸碰和操控籠子中的機關才行。

桑代克在當年的一項迷籠實驗中,就是把貓放在迷籠中,然後去觀察貓是如何學會逃出迷籠的。結果發現,貓在迷籠中的解謎方式,似乎和人類的行為不太一樣。大家可以想像一下,如果是人類被關在密室中玩密室脫逃遊戲,那通常人類應該是會先觀察、再推理、然後產生洞見來解謎逃脫。但是貓卻不是這樣,桑代克發現,迷籠中的貓,並不是透過單純的觀察機關、然後再用推理產生洞見,貓的解謎方式,似乎就只是單純的「試誤法」而已,也就是直接嘗試錯誤然後找出答案,英文叫做Trial-and Error。

也就是說,貓會在籠子中隨意觸碰事物,然後碰巧有幾次就剛好觸碰到機關,在觸碰到機關後,門就開啟、並獲得獎勵食物,最後貓就記住自己碰巧開門的動作。

如果我們觀察貓的反應時間,也就是每次花了多久才能逃脫,我們就可以看到,隨著練習次數越多,貓的逃脫時間也會變得越來越快。由此可見,貓的確有在這樣的試誤法中學習到如何逃脫迷籠。

・桑代克的三項學習定律

好,桑代克根據這些實驗結果,就提出了他的三項學習定律,分別是準備律、練習律、以及效果律。

桑代克學習定律的第一項,就是「準備律」(Law of Readiness)。所謂的準備律,就是說,個體一定要在準備就緒的時候,學習才會有效。比方說,在桑代克的實驗裡面,貓可能必須要是有逃生慾望的貓、或是肚子餓的貓,牠必須要有想逃脫籠子的慾望、或是出去籠子外面吃東西的慾望,如此一來,才能學得會逃脫籠子。要不然,如果你把一隻吃飽、且本來就喜歡躲在籠子裡的貓放進籠子的話,牠基本上是不會有動機想去學習如何逃出籠子的。

同樣的,人類的學習也是一樣,只有當學習者在生理上、心理上、情緒上、和動機上都準備就緒的時候,學習才可能出現。比方說,生理和心理上如果發展還不成熟,那當然不可能學得會。至於情緒和動機方面,如果有強烈的情緒和動機,基本上就會學得比較快。這個現象在學校中其實也很常見,例如當學生的學習動機很強時,我們通常就可以觀察到比較好的學習結果。

第二定律:練習律(Law of Exercise)

再來,桑代克學習定律中的第二個定律就是練習律(Law of Exercise),練習律其實非常的簡單易懂,所謂的練習律就是,常常重複練習的,就比較容易被習得。那我們現在知道,不管是在動物或是人類身上,重複的練習可以說是學習的關鍵。不管是在動作的學習、或是知識的學習、還是概念的學習都一樣,最有效的學習方式,通常就是不斷透過動作去練習,或是不斷重複地去聆聽、並且以不同角度去接觸和思考。

第三定律:效果律(Law of Effect)

最後,也是最重要的就是第三個定律,效果律(Law of Effect)。所謂的效果律,指得就是,個體的行為會根據其結果而產生改變。也就是說,如果一個行為馬上產生效果,那我們很快就可以學會該行為和效果的關聯性,並藉此來改變我們的行為。比方說,如果一個行為馬上獲得獎賞,那我們就會強化該行為,但是如果一個行為馬上獲得懲罰,那我們就會弱化該行為。

好,那我們為什麼要介紹桑代克的三個學習定律呢?這是因為,桑代克的理論,後來對史金納產生了很大的影響。史金納當年在得知桑代克的發現之後,馬上就開始思索一些問題。

比方說,第一的問題就是,我們有沒有辦法透過更嚴謹的方式,來系統性的研究動物如何學習自己的行為後果?第二個問題是,透過這種學習方式,動物究竟可以學會的東西有多少?第三個問題則是,行為與獎勵之間的時間間隔關係,對於學習有什麼影響?

那我們現在就先來看看第一個問題,也就是該怎麼研究動物如何學習自己的行為所產生的後果。關於動物可以透過行為的結果來學習的現象,史金納很快就提出了自己的理論和實驗方法。在理論方面,史金納提出了三項關係論(Three Term Contingency)。

那這三項關係論中的三項是哪三項呢?這三項,分別是先行物、行為和結果。先行物,也就是先行在前的事物,英文是(antecédence),它指的就是環境中的一些具有區辨力的線索,這些線索,可能會讓我們的行為的結果變得不一樣。

我們直接舉例的話,就是假設有一隻狗喜歡跳上沙發,那這隻狗在透過試誤法之後發現,每次主人不在家的時候,只要自己一跳上沙發就可以非常享受,但是只要主人在家,那麼跳上沙發就會被趕走然後處罰。

在這個例子中,先行物,就是主人在不在家,行為就是跳上沙發,結果就是享受沙發或是被處罰。而這種由先行物、行為、和結果所構成的三項關係,就是我們在日常生活中學習很多事物時的重要關鍵。

・史金納盒子(Skinner’s Box)

再來,除了理論之外,史金納也透過實驗的方式,找到了許多關於學習的法則。他最有名的實驗方式,就是使用所謂的史金納盒子(Skinner’s Box)。所謂的史金納盒子,就是他設計出來的一種實驗盒子,透過這個盒子,史金納把小動物放在盒子中,然後呈現聲音和光線等各種刺激,並且同時給予食物獎勵或電擊處罰。最後透這些刺激和賞罰的組合,他就可以觀察動物學習的法則。

經由這樣的實驗方法,史金納有了許多新的發現,其中最重要的發現之一,就是操作制約學習(operant conditioning)。所謂的操作制約,就是當我們做出某一個行為之後,我們可以根據這個行為的後果,來改變我們以後的行為。如果結果很好,我們就會繼續做這樣的行為,而如果結果不好,我們就不會再做一樣的行為。

比方說,如果你在餐廳打工時發現,不經意的微笑竟然讓你多拿了很多小費,那你以後可能就會刻意的微笑來賺取更多小費。又比方說,當你在學習新技能、像是騎腳踏車的時候,如果剛好某個姿勢讓你可以維持平衡很久,那你就會傾向繼續維持同一個姿勢來保持平衡。

那這其中的原理就在於,如果做出一個行為會得到獎賞,那這個行為就會被強化,但是如果做出一個行為會得到懲罰,那這個行爲就會被弱化,這種學習方式,就叫做操作制約學習,也就是根據行為操作的結果來進行學習。

好,那各位眼尖耳利聽眾聽到這邊,應該就已經注意到,操作制約中最關鍵的兩個要素,其實就是強化(reinforcement)和處罰(punishment)。那我們現在就逐一來看看這兩個要素到底扮演了什麼角色。

首先我們先看強化(reinforcement)。強化,就是在行為發生之後,環境中的一些變化,會讓這個行為受到正面的獎勵。而強化,又會根據獎勵的形式而區分成兩種,分別是,正向強化和負向強化(positive reinforcement和negative reinforcement)。

正向強化,就是透過給予一些對方喜歡的東西來進行強化,比方說,如果動物喜歡溫暖,那我們就可以在動物做出你想要他做出的行為之後,給予溫暖的光照來當作獎勵。

至於負向強化,則是移除對方不喜歡的事物,比方說,你可以在動物做出你想要他做出的行為之後,移出環境中一些他所不喜歡的事物。例如動物如果不喜歡光,那就移除光照。如果不喜歡噪音,那就移除掉噪音。

好,剛剛看到的是強化(reinforcement),現在來看看處罰(punishment)。處罰,就是在行為發生之後,環境中的一些變化,會讓這個行為受到負面的抑制。那處罰也跟剛剛的強化一樣,可以根據負面抑制的形式而區分成兩種,這兩種形式分別是,正向處罰和負向處罰(positive punishment和negative punishment)。

正向處罰,就是你可以透過「加入」一些對方不喜歡的東西,來達到抑制行為的效果,例如體罰、責罵,就是正向處罰。那負向處罰,則是你可以「移除」一些對方喜歡的東西,來達到抑制行為的效果。例如不准下課、不准放假,就是負向處罰。

所以我們可以看到,正向和負向的定義,並不是好或壞,也不是想要或是不想要。正向的定義,就是加入一些東西;負向的定義,就是移除一些東西。如果你加入對方喜歡的,就是正向強化,如果加入對方不喜歡的,就是正向處罰。如果移除對方喜歡的,就是負向處罰,如果移除對方不喜歡的,就是負向強化。

操作制約的這四種型態,其實都可以在史金納的動物實驗盒中看到,比方說,如果我們在老鼠按壓按鈕的時候「給予」食物,那就是正向強化。如果我們在老鼠按壓按鈕的時候「給予」電擊,那就是正向處罰。那如果我們在老鼠按壓按鈕的時候「移除」噪音,那就是負向強化。至於負向處罰,在史金納的動物實驗盒中比較少見,但是我們可以想像,如果我們在老鼠按壓按鈕的時候「移除」氧氣,那就會是負向處罰。

所以我們再強調一次,只要是給予東西,就是正向。給予喜歡的,就是正向強化。給予不喜歡的,就是正向處罰。相對的,只要是移除事物,就是負向。移除討厭的,就是負向強化,移除喜歡的,就是負向處罰。

  continue reading

457集单集

Artwork
icon分享
 
Manage episode 306309095 series 2890208
内容由鏡好聽提供。所有播客内容(包括剧集、图形和播客描述)均由 鏡好聽 或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品,您可以按照此处概述的流程进行操作https://zh.player.fm/legal

第四季第一集的《大腦好好玩》裡,主持人謝伯讓介紹到將「古典制約學習」在人類身上發揚光大的心理學家華生(John Watson)。這一集的節目,則要介紹開創行為主義重要理論「操作制約學習(operant conditioning)」的心理學家史金納(B.F. Skinner)。

這位美國行為主義的大師,是如何從美國教育心理學之父桑代克(Edward Thorndike)的三項學習定律延伸設計實驗,嘗試驗證「操作制約學習」理論?而「操作制約」的學習現象,又是如何透過「強化(​​reinforcement)」與「處罰(punishment)」兩大操作要素,影響動物與人類的學習結果?

本集重點:

04:55 桑代克的三項學習定律

10:31 操作制約學習理論基本概念介紹

延伸閱聽:

《動物好好玩》第二季 EP02|哪種鳥比鸚鵡還會模仿?緝毒犬如何學會找毒品?談動物的學習能力:https://mirrorvoice.com.tw/podcasts/124/2127

謝伯讓的腦科學世界:https://www.facebook.com/pojanghsieh

【本集節目是由鏡好聽製作播出的《大腦好好玩第四季》】

每隔週四上線全新一集

開啟小鈴鐺、按下追蹤,持續關注最新節目

製作人:余韋達

後製:孫藝庭

圖片:Shutterstock

鏡好聽全新改版上線!想聽愛聽就在鏡好聽,訂閱《鏡好聽》並下載 APP 收聽,只給你最好的聲音。

| 立即訂閱《鏡好聽》:https://www.mirrorvoice.com.tw/mirrorvoice-plus

| 免費下載《鏡好聽》APP:https://mirrormediafb.pros.is/LY67K

| 追蹤《鏡好聽》Facebook:https://facebook.com/mirrorvoice2019

| 追蹤《鏡好聽》Instagram:https://instagram.com/mirror_voice

| 合作、節目建議歡迎來信:voiceservice@mirrormedia.mg

節目內容全文:

在上一集的節目中,我們介紹了美國行為主義心理學家華生(John Watson),這位華生,可以說是帕伐洛夫古典制約學習理論在美國的繼承人。而今天,我們則要繼續介紹美國的另一位行為主義大師史金納(B.F. Skinner)。

史金納和華生雖然都是行為主義心理學家,但是兩者最大的差異就是,史金納並沒有延續帕伐洛夫的古典制約研究典範,而是自己開創出了另外一種制約典範,我們現在稱之為操作制約(operant conditioning),那我們待會,就會針對這個典範來做仔細介紹。

在介紹操作制約學習之前,我們先再來回顧一下帕伐洛夫和華生的古典制約學習。我們現在已經知道,古典制約(classical conditioning),這種制約學習,就是在學習兩個刺激之間的關聯性,好讓我們可以預期某個即將到來的事件,以便提前做出反應。

那操作制約又是什麼呢?操作制約(operant conditioning),就是當我們做出某一個行為之後,我們可以根據這個行為的後果,來改變我們以後的行為。比方說,如果做出一個行為之後會得到獎賞,那這個行為就會被強化,但是如果做出一個行為之後會得到懲罰,那這個行爲就會被弱化,這種學習方式,就叫做操作制約學習,也就是根據行為操作的結果來進行學習。

至於操作制約學習現象最開始是如何被發現的呢?關於操作制約的最早發現者,可以追溯到20世紀初期的一位美國心理學家桑代克(Edward Thorndike)。這位桑代克,算是美國的「教育心理學之父」,而且應該也是早期美國最多產的、論文數量最豐富的一位心理學家,他在研究生涯之中,就發表了超過500篇的論文和書籍,而他也是美國國家科學院中第一位入選院士的心理學家。

桑代克當年非常關心的一個問題就是,包括人類在內的各種動物,到底是怎麼學會新事物或新技能的?

・桑代克的迷籠

為了研究這個問題,桑代克就設計了一種叫做「迷籠」的道具,迷宮的迷,籠子的ㄌ籠,英文是(puzzle box)。所謂的迷籠,就是一個裡面藏有機關的籠子,如果動物想要逃脫這個籠子來取得籠子外的食物,那就得要自己去學會如何觸碰和操控籠子中的機關才行。

桑代克在當年的一項迷籠實驗中,就是把貓放在迷籠中,然後去觀察貓是如何學會逃出迷籠的。結果發現,貓在迷籠中的解謎方式,似乎和人類的行為不太一樣。大家可以想像一下,如果是人類被關在密室中玩密室脫逃遊戲,那通常人類應該是會先觀察、再推理、然後產生洞見來解謎逃脫。但是貓卻不是這樣,桑代克發現,迷籠中的貓,並不是透過單純的觀察機關、然後再用推理產生洞見,貓的解謎方式,似乎就只是單純的「試誤法」而已,也就是直接嘗試錯誤然後找出答案,英文叫做Trial-and Error。

也就是說,貓會在籠子中隨意觸碰事物,然後碰巧有幾次就剛好觸碰到機關,在觸碰到機關後,門就開啟、並獲得獎勵食物,最後貓就記住自己碰巧開門的動作。

如果我們觀察貓的反應時間,也就是每次花了多久才能逃脫,我們就可以看到,隨著練習次數越多,貓的逃脫時間也會變得越來越快。由此可見,貓的確有在這樣的試誤法中學習到如何逃脫迷籠。

・桑代克的三項學習定律

好,桑代克根據這些實驗結果,就提出了他的三項學習定律,分別是準備律、練習律、以及效果律。

桑代克學習定律的第一項,就是「準備律」(Law of Readiness)。所謂的準備律,就是說,個體一定要在準備就緒的時候,學習才會有效。比方說,在桑代克的實驗裡面,貓可能必須要是有逃生慾望的貓、或是肚子餓的貓,牠必須要有想逃脫籠子的慾望、或是出去籠子外面吃東西的慾望,如此一來,才能學得會逃脫籠子。要不然,如果你把一隻吃飽、且本來就喜歡躲在籠子裡的貓放進籠子的話,牠基本上是不會有動機想去學習如何逃出籠子的。

同樣的,人類的學習也是一樣,只有當學習者在生理上、心理上、情緒上、和動機上都準備就緒的時候,學習才可能出現。比方說,生理和心理上如果發展還不成熟,那當然不可能學得會。至於情緒和動機方面,如果有強烈的情緒和動機,基本上就會學得比較快。這個現象在學校中其實也很常見,例如當學生的學習動機很強時,我們通常就可以觀察到比較好的學習結果。

第二定律:練習律(Law of Exercise)

再來,桑代克學習定律中的第二個定律就是練習律(Law of Exercise),練習律其實非常的簡單易懂,所謂的練習律就是,常常重複練習的,就比較容易被習得。那我們現在知道,不管是在動物或是人類身上,重複的練習可以說是學習的關鍵。不管是在動作的學習、或是知識的學習、還是概念的學習都一樣,最有效的學習方式,通常就是不斷透過動作去練習,或是不斷重複地去聆聽、並且以不同角度去接觸和思考。

第三定律:效果律(Law of Effect)

最後,也是最重要的就是第三個定律,效果律(Law of Effect)。所謂的效果律,指得就是,個體的行為會根據其結果而產生改變。也就是說,如果一個行為馬上產生效果,那我們很快就可以學會該行為和效果的關聯性,並藉此來改變我們的行為。比方說,如果一個行為馬上獲得獎賞,那我們就會強化該行為,但是如果一個行為馬上獲得懲罰,那我們就會弱化該行為。

好,那我們為什麼要介紹桑代克的三個學習定律呢?這是因為,桑代克的理論,後來對史金納產生了很大的影響。史金納當年在得知桑代克的發現之後,馬上就開始思索一些問題。

比方說,第一的問題就是,我們有沒有辦法透過更嚴謹的方式,來系統性的研究動物如何學習自己的行為後果?第二個問題是,透過這種學習方式,動物究竟可以學會的東西有多少?第三個問題則是,行為與獎勵之間的時間間隔關係,對於學習有什麼影響?

那我們現在就先來看看第一個問題,也就是該怎麼研究動物如何學習自己的行為所產生的後果。關於動物可以透過行為的結果來學習的現象,史金納很快就提出了自己的理論和實驗方法。在理論方面,史金納提出了三項關係論(Three Term Contingency)。

那這三項關係論中的三項是哪三項呢?這三項,分別是先行物、行為和結果。先行物,也就是先行在前的事物,英文是(antecédence),它指的就是環境中的一些具有區辨力的線索,這些線索,可能會讓我們的行為的結果變得不一樣。

我們直接舉例的話,就是假設有一隻狗喜歡跳上沙發,那這隻狗在透過試誤法之後發現,每次主人不在家的時候,只要自己一跳上沙發就可以非常享受,但是只要主人在家,那麼跳上沙發就會被趕走然後處罰。

在這個例子中,先行物,就是主人在不在家,行為就是跳上沙發,結果就是享受沙發或是被處罰。而這種由先行物、行為、和結果所構成的三項關係,就是我們在日常生活中學習很多事物時的重要關鍵。

・史金納盒子(Skinner’s Box)

再來,除了理論之外,史金納也透過實驗的方式,找到了許多關於學習的法則。他最有名的實驗方式,就是使用所謂的史金納盒子(Skinner’s Box)。所謂的史金納盒子,就是他設計出來的一種實驗盒子,透過這個盒子,史金納把小動物放在盒子中,然後呈現聲音和光線等各種刺激,並且同時給予食物獎勵或電擊處罰。最後透這些刺激和賞罰的組合,他就可以觀察動物學習的法則。

經由這樣的實驗方法,史金納有了許多新的發現,其中最重要的發現之一,就是操作制約學習(operant conditioning)。所謂的操作制約,就是當我們做出某一個行為之後,我們可以根據這個行為的後果,來改變我們以後的行為。如果結果很好,我們就會繼續做這樣的行為,而如果結果不好,我們就不會再做一樣的行為。

比方說,如果你在餐廳打工時發現,不經意的微笑竟然讓你多拿了很多小費,那你以後可能就會刻意的微笑來賺取更多小費。又比方說,當你在學習新技能、像是騎腳踏車的時候,如果剛好某個姿勢讓你可以維持平衡很久,那你就會傾向繼續維持同一個姿勢來保持平衡。

那這其中的原理就在於,如果做出一個行為會得到獎賞,那這個行為就會被強化,但是如果做出一個行為會得到懲罰,那這個行爲就會被弱化,這種學習方式,就叫做操作制約學習,也就是根據行為操作的結果來進行學習。

好,那各位眼尖耳利聽眾聽到這邊,應該就已經注意到,操作制約中最關鍵的兩個要素,其實就是強化(reinforcement)和處罰(punishment)。那我們現在就逐一來看看這兩個要素到底扮演了什麼角色。

首先我們先看強化(reinforcement)。強化,就是在行為發生之後,環境中的一些變化,會讓這個行為受到正面的獎勵。而強化,又會根據獎勵的形式而區分成兩種,分別是,正向強化和負向強化(positive reinforcement和negative reinforcement)。

正向強化,就是透過給予一些對方喜歡的東西來進行強化,比方說,如果動物喜歡溫暖,那我們就可以在動物做出你想要他做出的行為之後,給予溫暖的光照來當作獎勵。

至於負向強化,則是移除對方不喜歡的事物,比方說,你可以在動物做出你想要他做出的行為之後,移出環境中一些他所不喜歡的事物。例如動物如果不喜歡光,那就移除光照。如果不喜歡噪音,那就移除掉噪音。

好,剛剛看到的是強化(reinforcement),現在來看看處罰(punishment)。處罰,就是在行為發生之後,環境中的一些變化,會讓這個行為受到負面的抑制。那處罰也跟剛剛的強化一樣,可以根據負面抑制的形式而區分成兩種,這兩種形式分別是,正向處罰和負向處罰(positive punishment和negative punishment)。

正向處罰,就是你可以透過「加入」一些對方不喜歡的東西,來達到抑制行為的效果,例如體罰、責罵,就是正向處罰。那負向處罰,則是你可以「移除」一些對方喜歡的東西,來達到抑制行為的效果。例如不准下課、不准放假,就是負向處罰。

所以我們可以看到,正向和負向的定義,並不是好或壞,也不是想要或是不想要。正向的定義,就是加入一些東西;負向的定義,就是移除一些東西。如果你加入對方喜歡的,就是正向強化,如果加入對方不喜歡的,就是正向處罰。如果移除對方喜歡的,就是負向處罰,如果移除對方不喜歡的,就是負向強化。

操作制約的這四種型態,其實都可以在史金納的動物實驗盒中看到,比方說,如果我們在老鼠按壓按鈕的時候「給予」食物,那就是正向強化。如果我們在老鼠按壓按鈕的時候「給予」電擊,那就是正向處罰。那如果我們在老鼠按壓按鈕的時候「移除」噪音,那就是負向強化。至於負向處罰,在史金納的動物實驗盒中比較少見,但是我們可以想像,如果我們在老鼠按壓按鈕的時候「移除」氧氣,那就會是負向處罰。

所以我們再強調一次,只要是給予東西,就是正向。給予喜歡的,就是正向強化。給予不喜歡的,就是正向處罰。相對的,只要是移除事物,就是負向。移除討厭的,就是負向強化,移除喜歡的,就是負向處罰。

  continue reading

457集单集

所有剧集

×
 
Loading …

欢迎使用Player FM

Player FM正在网上搜索高质量的播客,以便您现在享受。它是最好的播客应用程序,适用于安卓、iPhone和网络。注册以跨设备同步订阅。

 

快速参考指南