PRAVIDLA SHAPINGU PODLE KAREN PRYOR

Karen Pryor popsala ve své knize „Svého psa nestřílejte“ (Don't Shoot the Dog) deset základních pravidel shapingu, která popisují základní postupy při učení a formování nových triků a chování. Toto desatero by mělo patřit k základním prvkům a pravidlům tréninku pomocí shapingu, ale i výcviku vůbec. Tento seznam pravidel je pro Vás samozřejmě inspirací a je jen na Vás, zda si ho na základě vašich poznatků poupravíte nebo doplníte o další zásady.

 

  1. Raise criteria in increments small enough so that the subject always has a realistic chance of reinforcement.
    /Při zvyšování kritérií postupujte po malých krůčcích tak, aby měl pes vždy reálnou šanci na úspěch. /

Lidé se všeobecně snaží věci uspěchat a tak to funguje i ve výcviku. Vzpomeňme si však na nás, když jsme byli ve škole a učili se číst nebo počítat. Nejprve jsme se naučili poznávat jednotlivé jednociferné číslice a jejich posloupnost, pak přišlo na řadu sčítání a odečítání těchto číslic, pak dvojciferných, a tak dále, což je samozřejmě mnohem těžší než počítání s jednocifernými čísly. Ale jelikož jsme měli základ ze sčítání a odečítání jednociferných čísel, nebyl to pro nás až tak velký problém. Pokud by ale učitelka chtěla, abychom ihned počítali s vícecifernými čísly, problém by to pro nás asi byl. Stejné je to i s písmeny.

Je tedy jasné, že pokud postupujete po malých krůčkách, dostanete se k cíli mnohem rychleji, než když děláte velké kroky, které by zvíře těžko chápalo.

Důležité je si nejprve rozmyslet a rozvrhnout jednoduché kroky tak, aby nás dovedly k cíli a těch se držet.

Mně samotné se občas stane, že jsem nadšená, když Terrynka rychle chápe, co po ní chci a já se tak přestanu držet mého plánu a několik kroků vynechám. Nejednou se mi pak ale stalo, že najednou nechápala, co po ní vlastně chci. Zklamání a frustrace z neúspěchu pak přišla z obou stran (u mě skleslá nálada, „proč to nejde“ a u Terrynky z nemožnosti dostat odměnu)

Jestli jste ale zvolili správné kroky a postupujete podle nich, poznáte podle toho, že zvíře má 80% úspěšnost při vykonávání daného cviku (provede 4 z 5 nebo 8 z 10 opakování daného cviku). Zvolili jste tedy vhodnou obtížnost a je možno postoupit k následujícímu, těžšímu, krůčku.

  1. Train one aspect of any particular behavior at a time. Don't try to shape for two criteria simultaneously.
    /Trénujte vždy jen jeden aspekt chování (jedno kritérium) a nesnažte se o dvě a více kritérií dohromady./

Tenhle problém vídám především u začínajících psovodů, kteří se snaží o přesný a rychle vykonaný cvik. Pro příklad zvolím jednoduchý cvik lehni, kde chceme, aby pes lehnul ze stoje (ne, že si napřed sedne), rychle, přesně a nakonec se nevyvalil na bok. Pes si ale napoprvé před lehnutím sedne, ale poté cvik vykoná. Ale vy to neodměníte a zkusíte mu dát druhou šanci. Pes si tentokrát lehne bez mezisedu, ale vyvalí se na bok. I tento pokus je pro nás neúspěšný. Zkusíme to tedy ještě jednou, ale pes už je natolik frustrován, že ještě nedostal odměnu, takže si sice lehne, ale pomalu. Opět špatně. Ale protože je pro nás „špatně“ pokaždé něco jiného, pes proto nedokáže určit „co, je vlastně špatně, kde dělá tu chybu“. Splnění požadovaného cviku je tak pro něj v podstatě nemožné. Požadovaného výsledku dosáhnete tedy tím, pokud si cvik rozfázujete a budete učit jednotlivá kritéria zvlášť, tedy nejprve správný pohyb při lehání (tzn. pokrčení všech čtyř končetin, bez mezisedu), pak rychlost a poté setrvání ve správné pozici.

  1. During shaping, put the current level of response on a variable ratio schedule of reinforcement before adding or raising the criteria. /Měňte rozvrh odměňování před přidáním, nebo zvýšením kritéria./

Tomuto se říká „nepravidelný rozvrh odměn“. Je však důležité, jestli je chování již vytvořené, nebo je teprve učeno. V prvním případě pes chápe, co po něm chceme, takže budeme odměňovat nepravidelně, ale ne nahodile. To zvířeti dává menší jistotu, vede k většímu úsilí (zvíře nikdy neví, co dostane a kdy, tak to radši zkusí), neúspěch zvíře tak snadno neodradí (zkusí to znovu) a chování, které má naučené, nemůže tak rychle vyprchat. Naopak v případě, že chování teprve učíme, dáváme odměny vždy, aby zvíře pochopilo, co po něm chceme. Pokud se psovi některý cvik velmi podaří, můžeme zařadit i tzv. bonusy.

  1. When introducing a new criterion, or aspect of the behavioral skill, temporarily relax the old ones.
    /Při zavádění nového kritéria dočasně vypustíme z hlavy ta stará./

Tohle se označuje jako tzv. "rozvlnění kritérií". Jako příklad znovu použiju povel a naučení cviku lehni. V okamžiku, kdy naučíte vašeho psa plnit povel s vámi určeným kritériem, například lehá si hezky a rovně celým tělem bez mezisedu a bez vyvalování, přistoupíte k učení dalšího kritéria, tedy aby si lehal rychle. Nyní byste měli začít odměňovat ne každé lehnutí, ale každé rychlejší lehnutí (a tuto rychlost se snažit zvyšovat) a to i tehdy, když se pes vrátí k tomu, že bude lehat například s mezisedem.

V tu chvíli se snažte odměnit každé průměrné a rychlejší lehání (a s tím, jak se bude pes zlepšovat, tuto hranici posouvejte) i za cenu toho, že si pes bude lehat s mezisedem. Věřte, že až pochopí, co po něm chcete a o co vám vlastně jde, okamžitě si na předchozí kritérium vzpomene.

  1. Stay ahead of your subject: Plan your shaping program completely so that if the subject makes sudden progress, you are aware of what to reinforce next.
    /Buďte vždy o krok napřed před svým psem. Pečlivě si naplánujte jednotlivé kroky tréninku tak, abyste při nečekaně rychlém pokroku nebyli zaskočeni, ale mohli plynule pokračovat v odměňování./

Pokud mám v plánu naučit svojí Terrynku nějaké nové chování, nebo nový trik, vždy si dopředu rozvrhnu, co a jak budu cvičit. Tím však nemyslím jen v ten daný okamžik (v té jedné lekci), ale v rozsahu celého cviku. Nejednou se mi totiž stalo, že Terrynka mi náhle nabídla chování, které jsem čekala o několik kroků dál a já v tom překvapení nestačila správně zareagovat a chování neodměnila a pak vlastně ani nevěděla jak pokračovat (prostě mi narušila plány J). Pokud by mi tedy nabídla chování, které by se mi líbilo (např. otáčení na targetu doleva), i když by to nebyl zrovna ten krok, který jsem chtěla, tak je důležité, abych ho včas označila za správné, odměnila a rychle přešla na výcvik, kdy po ní budu požadovat chování, které mělo přijít až o několik kroků dál. V té chvíli ale musím vědět, co po ní vlastně budu chtít a jak budu ve výcviku pokračovat. Pokud bych ustrnula na místě a příliš dlouho zůstávala u chování, které mi Terrynka bude nabízet (tj. otáčení na targetu doleva) a přitom si teprve vymýšlela, jak postupovat dál, Terrynka by si tento krok zafixovala, nebo by se při výcviku začala nudit a než bych promyslela jak dál, měla bych problém toto chování dále rozvíjet.

  1. Don't change trainers in midstream. You can have several trainers per trainee, but stick to one shaper per behavior.
    /Neměňte trenéra uprostřed výuky. Můžete vystřídat několik trenérů během výcviku, ale nikdy jej neměňte během učení konkrétního chování. Co jeden začne, musí také dokončit./

Neříkám, že není možné, aby jedno a to samé zvíře cvičilo více trenérů, ale je dobré, aby každý pracoval na jiném cviku. Pokud tedy pracujete se psem a snažíte se ho něco naučit, dodělejte cvik do finální podoby a teprve pak zkuste zapojit další osoby. Každý z nás máme jinou intonaci hlasu, jiné držení těla, používáme jiná gesta a máme odlišné nároky. To vše může psovi motat hlavu a on by se tak v podstatě učil s každým trenérem daný cvik znovu.

  1. If one shaping procedure is not eliciting progress, find another. There are as many ways to get behavior as there are trainers to think them up.
    /Když jedna konkrétní metoda nefunguje, zkuste jinou. Je mnoho způsobů, jak dosáhnout požadovaného chování./

Pokud Vás napadne, že tím mám na mysli, abyste to zkusili „po zlém“, tak se mýlíte.

Jde vlastně o to, zkusit vymyslet trošku jiný postup, nebo snížit jednotlivé kroky či upravit kritéria. Pokud Vám totiž výcvik nejde, je to Vaše vina, nikoli zvířete.

 

Možná jste zvolili špatnou cestu, anebo nedokážete zvolenou metodiku správně použít. Při shapingu (tvarování), ale i při luringu (navádění), je často mnoho různých způsobů, které vedou ke stejnému cíli a je jenom na vás, který způsob je pro Vás ten pravý a který Vám nejlépe sedne. Zatímco pro někoho je jeden způsob ten, který chápe nejlépe a nejlépe mu vyhovuje, pro druhého to může být naopak.  

  1. Don't interrupt a training session gratuitously; that constitutes a punishment.
    /Nepřerušujte lekci bezdůvodně, pes to chápe jako trest. Po skončení tréninku psa nějakým způsobem odměňte (hračka, pamlsek, procházka, ...)./

Pokud se během výcviku zapovídáte s trenérem nebo vám zazvoní telefon a vy ho zvednete, v podstatě psa trestáte, protože seberete psovi něco, co chce (negativní trest), tedy možnost získat další odměnu. Pro psa je toto velmi frustrující, protože ačkoli se snaží, je trestán. Já to řeším tak, že i během hovoru s jiným člověkem, se se psem přetahuji nebo mu házím míčky. Stejně tak řeším i konec výcvikové lekce, po které následuje obrovská hra, pamlsky nebo procházka.

  1. If behavior deteriorates, "Go back to kindergarten." Quickly review the whole shaping process with a series of easily earned reinforcers.
    /Když se chování zhoršuje, vraťte se o krok (klidně projeďte znovu všechna předešlá kritéria) zpět. Opakování s vysokým počtem odměňování mohou "nakopnout" psa zpět a poté snadněji vymyslí další krok./

Mnohdy je těžké poznat, že výcvik nejde tak dobře, přestože nám se pořád ještě zdá, že to jde tak, jak jste si představovali. Jde o nepatrné věci, které vám mohou uniknout a člověk si mnohdy ani neuvědomí, že v určitém chování ustrnul nebo dělá sekvenci cviků monotónně a stejně.  Z tohoto důvodu je dobré vést si tréninkový deník, ke kterému se můžete kdykoli vrátit a zjistit tak, jestli a kde děláte chybu. Právě zápisky v deníku Vám pomohou vyhnout se chybě či analyzovat vzniklý problém a napravit jej.

  1. End each session on a high note, if possible, but in any case quit while you're ahead.
    /Snažte se zakončit každou lekci nějakým úspěchem nebo alespoň pokrokem, nikdy ji neukončujte ve chvíli, kdy se pes zasekne nebo se zhoršuje./

To přísloví znáte všichni – „v nejlepším se má přestat“. Když se nám konečně začne ve výcviku dařit a my jsme přišli na to, jak psovi vysvětlit určité chování a on chápe, co po něm chceme, tak si chceme tu chvíli užít a my cvik opakujeme zas a znova. Je to normální. Kvůli tomu si ale neuvědomíme, že jsme měli skončit ve chvíli, kdy začal jít výkon psa dolu. Pokud skončíte s výcvikem ve chvíli, kdy se vám výkon úplně nelíbí, budete rozmrzelý a Váš pes na vás tu změnu nálady jistě pozná. A přesně s tím příště začnete. Pokud ale překonáte touhu pokračovat ve výcviku dál a skončíte v nejlepším, kdy pes předvádí nejlepší výkon, tak příště v tom nejlepším zase začnete. Nezapomeňte si na konci lekce se psem pohrát, jen tak se bude na další výcvik s vámi těšit J

 

RNDr. František Šusta na svém semináři doplnil těchto deset pravidel ještě o další. A jelikož necvičí pouze psy, ale hlavně a především divoká zvířata (zvířata v zoo), jde to s úspěchem použít i na ně.

10. Pracujte takovým tempem, aby Vám zvíře stíhalo rozumět

11. Ale také dostatečně rychle, aby nestíhalo dělat nic jiného

Když Vám učitel ve škole vyložil látku, kterou jste rychle pochopili, ale ostatní spolužáci nikoli, tak se učitel musel k výkladu neustále vracet. Pro Vás to v tu chvíli začalo být nudné a nezáživné, poslouchat to zase a znova, takže jste si pravděpodobně našli jinou zábavu. Tak to funguje i u psů. Pokud bude výcvik příliš pomalý, začne se pes nudit a vymýšlet něco jiného, nebo Vám bude nabízet určitý krok, ve kterém jste setrvali příliš dlouho.

12. Při zachycování nového chování se musíte ujistit, že nezachycujete projev nějaké nálady (zejména agrese)

Na toto pravidlo myslete vždy!!!! Pokud budete v domnění, že odměňujete vámi požadované chování odměňovat například i lehké zavrčení, bude tento projev a toto chování posíleno, což se v budoucnu může projevit zvýšením tohoto chování, zvýšením agresivity, které může vyústit i v napadení.