Wanneer we een nieuwe oefening gaan trainen, leert de hond welk gedrag een beloning oplevert. Als hij begrijpt wat er van hem wordt verlangt, zal hij het gedrag vaker gaan vertonen (dit wordt ook wel bekrachtiging genoemd). De hond leert het snelst als hij voor ieder goed uitgevoerde oefening een voor hem waardevolle beloning krijgt. Wat de hond als een waardevolle beloning ervaart heeft te maken met het karakter van de hond, maar moet ook passen bij de motivatie op dát moment. De ene hond gaat uit zijn dak voor een balbeloning en de andere hond gaat voor voer. Gedurende de training is het belangrijk dat de waarde van elke beloning in de gaten gehouden wordt.

Over trainen gesproken, de juiste beloning wisselt

Geschreven door Marieke van der Burgt en Eline, Teygeler, gepubliceerd in Onze Hond december 2018

De trainer moet zich afvragen wat de hond precies belonend vindt; gaat het bijvoorbeeld bij de bal om het rennen (jagen) achter de bewegende bal, of gaat het de hond om het kauwen als hij de bal in zijn bezit heeft? Een voerbeloning kan uit de hand gegeven worden, maar een voerbeloning ‘gooien en vangen’ of ‘in het gras gooien en zoeken’ zijn variaties die honden kunnen motiveren.

Het afwisselen van soorten beloningen houdt de hond vaak gemotiveerd. Het altijd gebruiken van dezelfde beloning kan voor de ene hond saai worden, terwijl het voor de andere hond prima is. Inzicht in de bekrachtiger, de echte beloning die de herhaling van het gedrag motiveert, is belangrijk als je goed wilt trainen.

Over trainen gesproken – De kracht van aangeleerde beloningen

Bij het aanleren van nieuw gedrag is de timing van het geven van de beloning belangrijk. Deze moet namelijk gegeven worden op het moment of direct na het gewenste gedrag. In veel gevallen is het moeilijk om een hond direct het lekkers te geven tijdens de uitvoering van het gewenste gedrag, bijvoorbeeld als de hond uit positie komt bij het aannemen van de beloning of als hij verder bij je vandaan is.

Een aangeleerd beloningssignaal is hiervoor een oplossing. Zo’n signaal wordt ook wel een brugprikkel genoemd. Hierbij leg je het gewenste gedrag vast door middel van dit signaal en wordt de echte beloning later gegeven. Een bekende aangeleerde bekrachtiger is de clicker. De clicker maakt altijd hetzelfde geluid waardoor de clicker een handig hulpmiddel om het correcte gedrag van de hond te kunnen belonen.

Beloningswoordje versus clicker

Sommige trainers gebruiken liever een beloningswoordje om het juiste gedrag te bekrachtigen, net als bij de clicker gevolgd door een beloning. Enkele veelgebruikte woordjes zijn ‘yes’, ‘good’ of ‘click’. Het gebruik van zo’n woordje is anders dan het veel gehoorde ‘braaf’. De beloningswoordjes moeten namelijk eerst aangeleerd worden als voorspeller voor de échte beloning gegeven wordt. Alhoewel zowel de clicker als beloningswoordjes gebruikt kunnen worden als aangeleerde beloning, is er wel een verschil. Onderzoek toont aan dat het brein van de hond minder goed reageert op het horen van stemmen en dat het beter reageert vocale geluiden zoals tikgeluiden.

Een clicker zal dus een sterkere reactie kunnen geven en dus een krachtigere brugprikkel zijn in vergelijking tot een beloningswoordje. Overigens zijn er ook honden waar juist om deze reden beter voor een beloningswoordje gekozen kan worden; de clicker wekt dan teveel opwinding op wat weer storend kan werken in de training.
Of dat nu het geluid van een clicker is, een fluitje of een aangeleerd woordje, het werken met een aangeleerde beloning is erg zinvol in de training omdat het de timing van belonen duidelijker maakt.

Over trainen gesproken – De échte Jackpot

De Jackpot is een onverwachte, hoog gewaardeerde beloning die zo af en toe wordt gebruikt wanneer een hond een belangrijke stap in de eerste stappen van een training maakt. De intentie van de trainer is om de hond informatie te geven dat deze specifieke gedraging goed onthouden moet worden, waarmee de kans op herhaling vergroot wordt. De hond ontvangt niet één brokje, maar meerdere brokjes in één keer. De kracht van de Jackpot ligt vooral in de onverwachte verrassing. Een Jackpot markeert het ‘super-gedrag’, waardoor de kans vergroot dat dit gedrag herhaald wordt. Om deze functie te kunnen behouden, moet het super-gedrag gemarkeerd worden door een primaire bekrachtiger (bijvoorbeeld voer) en niet door een aangeleerde bekrachtiger zoals de clicker.

Wanneer we eerst het super-gedrag clicken en meteen een hele hand voer geven, is het super-gedrag al beloond met de waarde van de click, en de click is geassocieerd met 1 voertje. De hond krijgt dan geen informatie over de waarde van het super-gedrag. Overigens kan dit gebruik een hond wel motiveren, maar de essentie van de Jackpot om de hond te leren dat dit specifiek gedrag zich onderscheid van de andere gedragingen, gaat hiermee wel verloren.
De Jackpot wordt door trainers verschillend toegepast in de praktijk. Wanneer een Jackpot wel frequent in de training wordt gebruikt, dan gaat de hond deze super-beloning verwachten en kunnen alle andere beloonde oefeningen met één brokje teleurstellend zijn voor de hond en gedurende de training demotiveren.

Superbeloning?

Het gebruik van de Jackpot lijkt op de trainingsmethode waarbij gewone beloningen met superbeloningen worden afgewisseld om de hond te stimuleren zijn gedrag (low-value reinforcer versus high-value reinforcer). Het gebruik van beide technieken heeft een risico; omdat de beloning verschilt kan dit juist een variëteit veroorzaken in het getrainde gedrag; waarbij er in de uitvoering wisselende intensiteit wordt getoond. Dat kan een nadeel zijn bij het trainen van gedragingen waarin je juist een consistente precieze gedraging wil trainen.

Een ander beschreven nadeel van het trainen met een Jackpot, is dat het verrassende element de flow van de training verstoort, waardoor de hond erna minder gefocused is op de taak. Vanwege de nadelen wordt het gebruik van de Jackpot dan vaak gekoppeld aan het einde van de training; stoppen met een super-reactie en dit meteen belonen met de Jackpot. Onderzoek heeft overigens nog niet aangetoond dat het gebruik van de Jackpot het leerproces bij de hond versnelt ten opzichte van het normaal belonen van goede reacties.

Afbouwen van de beloning – over trainen gesproken

Afhankelijk van het doel waarom een bepaald gedrag is aangeleerd, is het vaak gewenst om de beloning af te bouwen. Bij de meeste examens of wedstrijden is het bijvoorbeeld niet toegestaan om de hond tijdens de oefeningen te belonen. Eigenaren vinden het ook vaak niet gewenst als de hond zijn hele leven beloond moet worden voor een bepaalde oefening. Echter wanneer er helemaal gestopt wordt met de beloning, kan het gedrag gaan uitdoven en zal de hond na verloop van tijd stoppen met de uitvoer van het gedrag. Blijven belonen is dus wel belangrijk. De andere kant van het verhaal is dat als er te vaak beloond wordt de motivatie van de hond ook kan verminderen. De hond is immers gewend aan de beloning die hij altijd krijgt. De hond niet elke keer meer belonen wordt variabel belonen genoemd en stimuleert juist om het gedrag te blijven vertonen.

De frequentie van het belonen wordt daarom bij een volleerde oefening afgebouwd naar een soort van onderhoudsbelonen. Hierbij is het doel dat de hond het aangeleerde gedrag op hetzelfde niveau blijft uitvoeren. Dit is makkelijker ‘gezegd dan gedaan’. Wanneer een beloning te snel wordt afgebouwd, zal de hond zijn motivatie verliezen en het gedrag minder goed of niet meer gaan uitvoeren. Het is dus van belang dat de training goed wordt geëvalueerd. Wordt het aangeleerde gedrag constant uitgevoerd of is er een variatie of zelfs afname van het gedrag? Wanneer er een variatie of afname is, dan zal de manier van de beloning moeten worden bijgesteld en zal er bijvoorbeeld vaker moeten worden beloond of er moet gekozen worden voor een sterkere beloning.

Over trainen gesproken – timing van cue of commando

Een commando of cue is een signaal die voor de hond betekent dat hij het daarbij behorende gedrag kan gaan vertonen. De hond heeft een associatie gelegd met een woord wat wij zeggen, of met een gebaar die we maken. In een goed doorlopen training weet de hond dat hij alleen een beloning kan ontvangen voor het aangeleerde gedrag wanneer hij het commando heeft gehoord/gezien. Het commando is een uniek signaal wat betekenis heeft. Als we een hond een bepaalde gedraging aanleren, is het meestal niet zinvol om meteen een commando te geven; de hond weet nog niet wat er van hem verwacht wordt. In de meeste gevallen wordt ervoor gekozen om een commando toe te voegen als de hond het te trainen gedrag ‘doorheeft’. In deze fase van het trainen van gedrag kunnen er op verschillende momenten een cue gegeven worden.

Onderzoek toont aan dat het vooraf geven van het signaal het meest efficiënt werkt; immers het commando moet ook een voorspeller worden. Soms wordt in de aanleerfase gekozen om het signaal tijdens de uitvoering van het gedrag te geven. Dit kan overigens wel werken maar geeft vaker problemen vanwege de processen overschaduwen of blokkeren. Voor de meest efficiënte manier van trainen is het vooraf geven van het signaal de beste route. Uiteraard kunnen er uitzonderingen zijn, zoals bij aan te leren gedrag wat niet is uit te lokken (het onder commando zetten van uitschudden van natte vacht bijvoorbeeld).

Wil je meer weten over trainen?