引用或轉貼請註明譯文出處,請尊重著作權
塑形法如何發展學習能力
(How Shaping Develops Learning)
作者:英國響片訓練師凱依‧羅倫斯(Kay Laurence)
譯者:黃薇菁(Vicki)
譯文出處:『動物的事‧響片訓練』部落格
編輯的話:「塑形法」(shaping)是利用一連串小步驟建立行為的科學用語,塑形法讓你能夠創造行為,從無到有,不利用肢體控制或糾正,利用到動物自然學習的能力。如果你是塑形新手,你可能需要讀讀塑形法的介紹以及凱倫布萊爾的塑形十大定律(見《別斃了那隻狗》一書)。
自由塑形(Freeshaping)提供一個窗口,讓我們一窺訓練對象的思路歷程,我們看得到訓練對象如何逐步作出接近解答的選擇,也看得到牠們何時已窮途末路。
如果讓我觀察塑形狗兒行為的訓練,我能看出這隻狗的記性。狗兒受到塑形的行為或許和某物件有關,接著牠為了取食而遠離物件,於是物件不再存在牠的視野,有些狗兒完全明白它的位置在哪裡,邊吃邊轉過身朝它走去。有些狗則完全沈浸於享受美食的片刻,全然忘記那個物件,這些記性不佳的狗兒回神後常以惹人憐愛的表情望向訓練者:「我知道我剛做了某件事,但是我現在完全不記得它是啥。」通常狗兒出現這種『剛剛我是做到哪裡咧?』的現象後,即出現一高一低挑動眉毛的犬類特殊技能,在棕眉的黃金雪達犬身上很容易觀察到這個動作。
「維持成功」
狗兒腦子裡「維持成功」的能力隨著增強史(reinforcement history,譯註:即曾獲增強的次數)的增加而強化。當狗兒碰觸磚塊的行為被增強的次數越多,牠們取食後回到這個行為的速度越快,事實上有些狗兒邊吃東西就會邊做出這個行為──我以此評估牠是否已確切了解當時的塑形要求,它也顯示提高要求標準的難易度。食物奬勵的給予位置對於塑形的過程及進展速度具有極大影響,你能夠使訓練對象發展出記憶能力,或者使牠超乎能力地學習。
行為過頭
我在多數塑形練習(不管訓練狗或人)常觀察到一種「響片響後仍繼續行動」(going through the click)的過程,舉例來說,我們有時會玩Genabacab遊戲(譯註:探索響片訓練的互動遊戲),由一人塑形另一人碰觸某物件,訓練者抓時間點很準,在對方手指稍微輕觸物件時便按下響片,但是若是狗兒的話牠們會繼續把那個物件推一推、滾一滾或咬起來。再舉一例,例如塑形狗兒以前腳搭上圓錐或踏上第一階樓梯,當牠聽到響片聲後牠仍繼續推動圓錐或跑上樓梯,幾乎所有例子中,訓練者或訓練對象都不是響片訓練的新手,這些行為顯示,牠們明白「響片標定行為」的概念,因而完成了這些行為。
問問訓練者我們就會知道狗兒明白「響片響時的行為是正確的」,那麼牠們為何持續行動?對於狗兒和訓練者而言,響片聲並非終結行為,它似乎標定了某項意圖之下的行為。
如果我們讓狗兒持續發展這項行為,它將越發強烈──推得更用力,或更快跑上樓梯──顯示響片聲使訓練對象聯結到的行為並不是訓練者所要的行為。
當訓練對象提供了「大體行為」(gross behavior),我們身為塑形者的義務是微調教導方式,如果這個大體行為與所要行為無關,這次訓練可能就必須突然間結束,引人挫折。
許多迷你迷你的小小步驟
我們經常利用某個為時不長的行為捕捉另一個行為。數以百計的行為都是大體行為的迷你版本,利用響片停止行為的作用雕塑行為──舉起前腳碰圓錐的動作是揮揮腳的初期動作,趴下時壓低肩膀的動作是敬禮的開始,用根趾頭碰某項物件的行為是推動、翻面、滾動、拾起或旋動這個物件的啟始動作,迷你行為讓我們能夠改變行為發展方向或發展的速度。我們『定格』小小行為的能力使訓練對象能夠傾聽到更精確的訊息。
當你開始教導訓練對象傾聽響片聲,遞送奬勵的動作必須中斷牠繼續完成大體動作的進程,如果有隻狗很想弄壞房裡另一頭的某個物件,早點按下響片同時毫無延遲地迅速把食物送到狗兒後方,這樣就可以停止牠發展出不樂見的行為。
終止行為的是奬勵,而不是響片
以人類(遲鈍)的眼睛看來,響片聲出現時人似乎就丟出了食物,起初幾次按響片給賞時這不會是個問題,當狗兒聽見響片聲,假如牠的眼角餘光瞄到遞送食物的手迅速丟出食物,牠就會定住不動,剛開始牠可能不會理會手的動作,但很快地,你會看到牠靠近物件時注視著遞送食物的那隻手,接下來的測試就是在按下響片後停一秒再送出食物,看看牠在響片聲出現時是否停止動作。
我偏好在行為發生地點幾步之外的地方給予食物,目的是讓牠可以重新動作,讓我能夠監看類似動作,比較行為的進展。
昆斯學習到「停一下下」
有次響片研習會上我主持了一個微塑形講座,我的訓練對象是隻很棒的七個月可麗牧羊犬(rough collie),名叫昆斯。訓練目標是教牠把前腳搭在講台旁四步階梯的第一階上,這是必要的導盲犬行為,導盲犬會停在這個姿勢,等待人給予訊號再上樓梯。
昆斯知道現在牠是目光焦點,只想「上台」去,在牠眼裡看不到階梯,更別提第一階了!當牠接近講台時,牠聽到響片,便飛奔到我腿上(七個月大的牠還不太明白自己長大了!)。
如果你不斷教導狗兒聽到響片時跑來找你的手領賞,牠在聽到響片後會朝著你的方向激動起來,你可以在按響片後直接把食物遞到狗兒所在的位置,但是如果想避免牠在響片聲出現後持續行動,這個作法仍不夠迅速,於是響片將增強意圖,而你若試圖加快直接餵食的動作,你得極為小心,不要無意間讓狗兒留意到這個動作,因而把它和響片聲起了聯想。
我對昆斯的作法是,在我再度用到響片之前,我得先做一些把食物丟到牠身後的大動作,讓牠發展出概念,了解我給予食物的方式。
這對牠是相當新的概念,只重復了幾次,接著當牠接近講台階梯時我再度按下響片,我當時利用了一個「響片視覺訊號」打斷這個行為,讓它與響片聲同時出現。
七個月的牠還不太能控制自己的身體動作,完全是大刺刺的作風,由「意圖」驅使,我家狗肯恩有時仍會回到這種模式,「意圖」熱情地打招呼,對於我較能接受的打招呼方式,此時牠的認知通常會蒸發人間,只剩下『意圖』這麼做的意念。
約經過四次一分鐘的訓練後,我們成功塑形昆斯把前腳搭在階梯上,牠的身體仍然因為想飛奔上台的意念而表現興奮,但是在響片聲出現後牠可以稍微停著一兩秒不動,這對牠年輕的心靈是個很棒的練習──不只讓牠更留意到響片出現的確切時間和自己的行為,也讓牠學會在響片聲和取食之間稍微停一下下。
塑形是學習人生的課題
我堅決相信塑形最大的好處是使訓練對象得以發展,它不只是在誘導無效時用來獲得行為的訓練方法,學習被塑形的概念好比學習人生的必要技能,以因應各種無可預期的突發狀況──這對一隻七個月大的狗兒尤其重要!
對於習慣被增強意圖的狗兒,我們需要找到不同策略才能定格當下的動作,你同樣可以利用食物的轉移方式,但是它只有在訓練對象擁有想要奬勵的高度動機時才能生效。我曾經使壞,設計了一套方法,讓訓練對象必須在我把奬勵放入罐內或給別人之前就去拿食物,這作法有些處罰性質,但是它使狗兒在聽到響片聲後專心一意──牠去拿奬勵的反應得快一些,否則它就會消失。
反過來看,增強意圖也可能不錯
有個很像我家狗梅波說話的小小聲音指出:「等一下,按到意圖的動作也可能有其用處。」我最早開始塑形梅波時明白了這一點,為了刺激牠的想像,我在地上放了數個有趣的物件(當時牠九個月大,一心以自我為主),當牠注視某項物件我就會按下響片,她領了賞後就直接跑回那項物件,如果叫牠先舉前腳揮揮,然後當牠注視凳子時按下響片,牠就一定會朝著凳子過去再用前腳點它一下。
我極確信這便是黃金雪達犬的思路流程,也相信牠所注視的東西就是牠心中所想的東西,響片所按到的並不完全是牠來到物件面前時要進行特定行為的意念,但是我們可以因此而省略許多塑形步驟。
我確信你們當中有許多人對自己的狗也有類似的體認,我認為狗兒理解人類意圖的能力比我們理解牠們的強,不過我還是很想探索這個領域。
我們可能用另一個標定訊號確認意圖嗎?
沒有留言:
張貼留言
本網誌不接受留言
注意:只有此網誌的成員可以留言。