基礎心理學理論之操作制約

Operant Conditioning

--

Photo by Priscilla Du Preez on Unsplash

Operant conditioning(操作制約)是行為學派的理論,其重點在於一個行為會否重復發生的機會率會受著這個行為帶來的後果好壞而影響。一個行為如果帶來了壞後果,那麼你不再會做這個行為,反之一個行為如果帶來好結果,你就會常常做這個行為。

四種改變行為的模式

Operant conditioning 會有4種基本情況分別是positive reinforcement(正面強化), negative reinforcement(負面強化), positive punishment(正面懲罰), 和negative punishment(負面懲罰)。Positive reinforcement: 你的行為得到直接獎勵,所以再發生該行為的機率會上升。例如你用功讀書,得到好成績受到老師讚許,這種讚許會令你繼續更用功讀書。Negative reinforcement: 你的行為令你不再受到懲罰,所以再發生該行為的機率上升。例如你因爲做運動後,不再受到情緒困擾了,這種好結果會令你繼續運動。Positive punishment: 你的行為令你得到直接的懲罰,所以以後再發生這種行為的機率下降。例如你因為亂過馬路而被車撞過,你以後也不再敢亂過馬路了。Negative punishment: 你的行為令你本來擁有的好東西消失了,所以再發生該行動的機率下降。例如你因爲頂撞父母,你的游戲機被沒收了,所以你以後不太敢再頂撞父母。

Operant conditioning 對塑造行為很有幫助,日常生活中動物訓練用的技巧也是基於這個理論。在你日常工作上,如果你表現良好,不妨獎勵一下自己(positive reinforcement ),因為它可以強化你的勤奮呢。

獎勵頻率

我們現在知道透過獎勵,能夠增加行為頻率,但如何獎勵也會影響著改變行為的有效性。獎勵頻率的控制主要在兩個方面,一個是時間間隔(interval),一個就是基於你做了多少次動作才獎勵一次(ratio)。

如果獎勵是基於做動作後一個固定的時間就施加的話,這種獎勵模式叫fixed interval (固定時距),常見的例子就是一個人每工作30天就發一次薪水。如果獎勵是基於做動作後,在不定時的情況就施加的話,這種獎勵模式叫variable interval (不定時距)。例如你剛剛申請了一份工作,你在檢查電郵時不知道要多久才能得到公司的回應,這種不确定性會增加你檢查電郵的頻率。如果不談獎勵的話,突擊測驗也是一種不定時距, 由於學生不知道隔多久就會有一次測驗,所以學生溫習的行為會增加。

如果獎勵是基於做了一個固定數目的動作後施加的話,這種獎勵模式叫fixed ratio (固定比率)。例如你在工廠工作,每做成了10件成品就會得到薪水。如果獎勵的施加是基於一個不固定數目的動作的話,這種獎勵模式叫variable ratio…

--

--

Dr. Lo, Ph.D.(H.K.), CPsychol (BPS)
Dr Lo Psychology 達樂心理

Ph.D. in Psych (H.K); Chartered Psychologist (BPS); Founder of Dr Lo Psychology 達樂心理 (IG: @drlo.psychology @drlo.purpose.coaching))