打開史金納的箱子：行為主義大師史金納與操作制約學習【謝伯讓

内容由鏡好聽提供。所有播客内容（包括剧集、图形和播客描述）均由鏡好聽或其播客平台合作伙伴直接上传和提供。如果您认为有人在未经您许可的情况下使用您的受版权保护的作品，您可以按照此处概述的流程进行操作https://zh.player.fm/legal。

知識好好玩 « »
打開史金納的箱子：行為主義大師史金納與操作制約學習【謝伯讓｜大腦好好玩 S04 EP02】

2+ y ago 16:07

MP3•单集首页

在第四季第一集的《大腦好好玩》裡，主持人謝伯讓介紹到將「古典制約學習」在人類身上發揚光大的心理學家華生（John Watson）。這一集的節目，則要介紹開創行為主義重要理論「操作制約學習（operant conditioning）」的心理學家史金納（B.F. Skinner）。

這位美國行為主義的大師，是如何從美國教育心理學之父桑代克（Edward Thorndike）的三項學習定律延伸設計實驗，嘗試驗證「操作制約學習」理論？而「操作制約」的學習現象，又是如何透過「強化（reinforcement）」與「處罰（punishment）」兩大操作要素，影響動物與人類的學習結果？

本集重點：

04:55 桑代克的三項學習定律

10:31 操作制約學習理論基本概念介紹

延伸閱聽：

《動物好好玩》第二季 EP02｜哪種鳥比鸚鵡還會模仿？緝毒犬如何學會找毒品？談動物的學習能力：https://mirrorvoice.com.tw/podcasts/124/2127

謝伯讓的腦科學世界：https://www.facebook.com/pojanghsieh

【本集節目是由鏡好聽製作播出的《大腦好好玩第四季》】

每隔週四上線全新一集

開啟小鈴鐺、按下追蹤，持續關注最新節目

製作人：余韋達

後製：孫藝庭

圖片：Shutterstock

鏡好聽全新改版上線！想聽愛聽就在鏡好聽，訂閱《鏡好聽》並下載 APP 收聽，只給你最好的聲音。

| 立即訂閱《鏡好聽》：https://www.mirrorvoice.com.tw/mirrorvoice-plus

| 免費下載《鏡好聽》APP：https://mirrormediafb.pros.is/LY67K

| 追蹤《鏡好聽》Facebook：https://facebook.com/mirrorvoice2019

| 追蹤《鏡好聽》Instagram：https://instagram.com/mirror_voice

| 合作、節目建議歡迎來信：voiceservice@mirrormedia.mg

節目內容全文：

在上一集的節目中，我們介紹了美國行為主義心理學家華生（John Watson），這位華生，可以說是帕伐洛夫古典制約學習理論在美國的繼承人。而今天，我們則要繼續介紹美國的另一位行為主義大師史金納（B.F. Skinner）。

史金納和華生雖然都是行為主義心理學家，但是兩者最大的差異就是，史金納並沒有延續帕伐洛夫的古典制約研究典範，而是自己開創出了另外一種制約典範，我們現在稱之為操作制約（operant conditioning），那我們待會，就會針對這個典範來做仔細介紹。

在介紹操作制約學習之前，我們先再來回顧一下帕伐洛夫和華生的古典制約學習。我們現在已經知道，古典制約（classical conditioning），這種制約學習，就是在學習兩個刺激之間的關聯性，好讓我們可以預期某個即將到來的事件，以便提前做出反應。

那操作制約又是什麼呢？操作制約（operant conditioning），就是當我們做出某一個行為之後，我們可以根據這個行為的後果，來改變我們以後的行為。比方說，如果做出一個行為之後會得到獎賞，那這個行為就會被強化，但是如果做出一個行為之後會得到懲罰，那這個行爲就會被弱化，這種學習方式，就叫做操作制約學習，也就是根據行為操作的結果來進行學習。

至於操作制約學習現象最開始是如何被發現的呢？關於操作制約的最早發現者，可以追溯到20世紀初期的一位美國心理學家桑代克（Edward Thorndike）。這位桑代克，算是美國的「教育心理學之父」，而且應該也是早期美國最多產的、論文數量最豐富的一位心理學家，他在研究生涯之中，就發表了超過500篇的論文和書籍，而他也是美國國家科學院中第一位入選院士的心理學家。

桑代克當年非常關心的一個問題就是，包括人類在內的各種動物，到底是怎麼學會新事物或新技能的？

・桑代克的迷籠

為了研究這個問題，桑代克就設計了一種叫做「迷籠」的道具，迷宮的迷，籠子的ㄌ籠，英文是（puzzle box）。所謂的迷籠，就是一個裡面藏有機關的籠子，如果動物想要逃脫這個籠子來取得籠子外的食物，那就得要自己去學會如何觸碰和操控籠子中的機關才行。

桑代克在當年的一項迷籠實驗中，就是把貓放在迷籠中，然後去觀察貓是如何學會逃出迷籠的。結果發現，貓在迷籠中的解謎方式，似乎和人類的行為不太一樣。大家可以想像一下，如果是人類被關在密室中玩密室脫逃遊戲，那通常人類應該是會先觀察、再推理、然後產生洞見來解謎逃脫。但是貓卻不是這樣，桑代克發現，迷籠中的貓，並不是透過單純的觀察機關、然後再用推理產生洞見，貓的解謎方式，似乎就只是單純的「試誤法」而已，也就是直接嘗試錯誤然後找出答案，英文叫做Trial-and Error。

也就是說，貓會在籠子中隨意觸碰事物，然後碰巧有幾次就剛好觸碰到機關，在觸碰到機關後，門就開啟、並獲得獎勵食物，最後貓就記住自己碰巧開門的動作。

如果我們觀察貓的反應時間，也就是每次花了多久才能逃脫，我們就可以看到，隨著練習次數越多，貓的逃脫時間也會變得越來越快。由此可見，貓的確有在這樣的試誤法中學習到如何逃脫迷籠。

・桑代克的三項學習定律

好，桑代克根據這些實驗結果，就提出了他的三項學習定律，分別是準備律、練習律、以及效果律。

桑代克學習定律的第一項，就是「準備律」（Law of Readiness）。所謂的準備律，就是說，個體一定要在準備就緒的時候，學習才會有效。比方說，在桑代克的實驗裡面，貓可能必須要是有逃生慾望的貓、或是肚子餓的貓，牠必須要有想逃脫籠子的慾望、或是出去籠子外面吃東西的慾望，如此一來，才能學得會逃脫籠子。要不然，如果你把一隻吃飽、且本來就喜歡躲在籠子裡的貓放進籠子的話，牠基本上是不會有動機想去學習如何逃出籠子的。

同樣的，人類的學習也是一樣，只有當學習者在生理上、心理上、情緒上、和動機上都準備就緒的時候，學習才可能出現。比方說，生理和心理上如果發展還不成熟，那當然不可能學得會。至於情緒和動機方面，如果有強烈的情緒和動機，基本上就會學得比較快。這個現象在學校中其實也很常見，例如當學生的學習動機很強時，我們通常就可以觀察到比較好的學習結果。

第二定律：練習律（Law of Exercise）

再來，桑代克學習定律中的第二個定律就是練習律（Law of Exercise），練習律其實非常的簡單易懂，所謂的練習律就是，常常重複練習的，就比較容易被習得。那我們現在知道，不管是在動物或是人類身上，重複的練習可以說是學習的關鍵。不管是在動作的學習、或是知識的學習、還是概念的學習都一樣，最有效的學習方式，通常就是不斷透過動作去練習，或是不斷重複地去聆聽、並且以不同角度去接觸和思考。

第三定律：效果律（Law of Effect）

最後，也是最重要的就是第三個定律，效果律（Law of Effect）。所謂的效果律，指得就是，個體的行為會根據其結果而產生改變。也就是說，如果一個行為馬上產生效果，那我們很快就可以學會該行為和效果的關聯性，並藉此來改變我們的行為。比方說，如果一個行為馬上獲得獎賞，那我們就會強化該行為，但是如果一個行為馬上獲得懲罰，那我們就會弱化該行為。

好，那我們為什麼要介紹桑代克的三個學習定律呢？這是因為，桑代克的理論，後來對史金納產生了很大的影響。史金納當年在得知桑代克的發現之後，馬上就開始思索一些問題。

比方說，第一的問題就是，我們有沒有辦法透過更嚴謹的方式，來系統性的研究動物如何學習自己的行為後果？第二個問題是，透過這種學習方式，動物究竟可以學會的東西有多少？第三個問題則是，行為與獎勵之間的時間間隔關係，對於學習有什麼影響？

那我們現在就先來看看第一個問題，也就是該怎麼研究動物如何學習自己的行為所產生的後果。關於動物可以透過行為的結果來學習的現象，史金納很快就提出了自己的理論和實驗方法。在理論方面，史金納提出了三項關係論（Three Term Contingency）。

那這三項關係論中的三項是哪三項呢？這三項，分別是先行物、行為和結果。先行物，也就是先行在前的事物，英文是（antecédence），它指的就是環境中的一些具有區辨力的線索，這些線索，可能會讓我們的行為的結果變得不一樣。

我們直接舉例的話，就是假設有一隻狗喜歡跳上沙發，那這隻狗在透過試誤法之後發現，每次主人不在家的時候，只要自己一跳上沙發就可以非常享受，但是只要主人在家，那麼跳上沙發就會被趕走然後處罰。

在這個例子中，先行物，就是主人在不在家，行為就是跳上沙發，結果就是享受沙發或是被處罰。而這種由先行物、行為、和結果所構成的三項關係，就是我們在日常生活中學習很多事物時的重要關鍵。

・史金納盒子（Skinner’s Box）

再來，除了理論之外，史金納也透過實驗的方式，找到了許多關於學習的法則。他最有名的實驗方式，就是使用所謂的史金納盒子（Skinner’s Box）。所謂的史金納盒子，就是他設計出來的一種實驗盒子，透過這個盒子，史金納把小動物放在盒子中，然後呈現聲音和光線等各種刺激，並且同時給予食物獎勵或電擊處罰。最後透這些刺激和賞罰的組合，他就可以觀察動物學習的法則。

經由這樣的實驗方法，史金納有了許多新的發現，其中最重要的發現之一，就是操作制約學習（operant conditioning）。所謂的操作制約，就是當我們做出某一個行為之後，我們可以根據這個行為的後果，來改變我們以後的行為。如果結果很好，我們就會繼續做這樣的行為，而如果結果不好，我們就不會再做一樣的行為。

比方說，如果你在餐廳打工時發現，不經意的微笑竟然讓你多拿了很多小費，那你以後可能就會刻意的微笑來賺取更多小費。又比方說，當你在學習新技能、像是騎腳踏車的時候，如果剛好某個姿勢讓你可以維持平衡很久，那你就會傾向繼續維持同一個姿勢來保持平衡。

那這其中的原理就在於，如果做出一個行為會得到獎賞，那這個行為就會被強化，但是如果做出一個行為會得到懲罰，那這個行爲就會被弱化，這種學習方式，就叫做操作制約學習，也就是根據行為操作的結果來進行學習。

好，那各位眼尖耳利聽眾聽到這邊，應該就已經注意到，操作制約中最關鍵的兩個要素，其實就是強化（reinforcement）和處罰（punishment）。那我們現在就逐一來看看這兩個要素到底扮演了什麼角色。

首先我們先看強化（reinforcement）。強化，就是在行為發生之後，環境中的一些變化，會讓這個行為受到正面的獎勵。而強化，又會根據獎勵的形式而區分成兩種，分別是，正向強化和負向強化（positive reinforcement和negative reinforcement）。

正向強化，就是透過給予一些對方喜歡的東西來進行強化，比方說，如果動物喜歡溫暖，那我們就可以在動物做出你想要他做出的行為之後，給予溫暖的光照來當作獎勵。

至於負向強化，則是移除對方不喜歡的事物，比方說，你可以在動物做出你想要他做出的行為之後，移出環境中一些他所不喜歡的事物。例如動物如果不喜歡光，那就移除光照。如果不喜歡噪音，那就移除掉噪音。

好，剛剛看到的是強化（reinforcement），現在來看看處罰（punishment）。處罰，就是在行為發生之後，環境中的一些變化，會讓這個行為受到負面的抑制。那處罰也跟剛剛的強化一樣，可以根據負面抑制的形式而區分成兩種，這兩種形式分別是，正向處罰和負向處罰（positive punishment和negative punishment）。

正向處罰，就是你可以透過「加入」一些對方不喜歡的東西，來達到抑制行為的效果，例如體罰、責罵，就是正向處罰。那負向處罰，則是你可以「移除」一些對方喜歡的東西，來達到抑制行為的效果。例如不准下課、不准放假，就是負向處罰。

所以我們可以看到，正向和負向的定義，並不是好或壞，也不是想要或是不想要。正向的定義，就是加入一些東西；負向的定義，就是移除一些東西。如果你加入對方喜歡的，就是正向強化，如果加入對方不喜歡的，就是正向處罰。如果移除對方喜歡的，就是負向處罰，如果移除對方不喜歡的，就是負向強化。

操作制約的這四種型態，其實都可以在史金納的動物實驗盒中看到，比方說，如果我們在老鼠按壓按鈕的時候「給予」食物，那就是正向強化。如果我們在老鼠按壓按鈕的時候「給予」電擊，那就是正向處罰。那如果我們在老鼠按壓按鈕的時候「移除」噪音，那就是負向強化。至於負向處罰，在史金納的動物實驗盒中比較少見，但是我們可以想像，如果我們在老鼠按壓按鈕的時候「移除」氧氣，那就會是負向處罰。

所以我們再強調一次，只要是給予東西，就是正向。給予喜歡的，就是正向強化。給予不喜歡的，就是正向處罰。相對的，只要是移除事物，就是負向。移除討厭的，就是負向強化，移除喜歡的，就是負向處罰。

457集单集

#鏡好聽