Exemples pratiques de renforcements
Cet article est la partie [part not set] de 6 du dossier Apprentissage associatif et non-associatif

L’article précédent a présenté les notions de renforcement positif et négatif. Voici quelques exemples de leur utilisation au sol et monté.

Manipuler le cheval au sol

Lorsqu’un cheval exécute de façon répétée un comportement indésirable, plutôt que de l’expliquer de manière anthropomorphique (cheval colérique, vindicatif, dominant, soumis, etc.), mieux vaut tenter d’identifier le renforcement (parfois involontaire) qui favorise l’apparition de ce comportement. En effet, il est important de garder à l’esprit qu’un cheval aura tendance à répéter un comportement si celui-ci lui permet d’éviter un inconfort ou d’obtenir une récompense. Ainsi, l’apparition de comportements indésirables sera d’autant plus probable qu’une pression inattendue et intense sera appliquée.

Voici quelques exemples pratiques :

Injection à l’aide d’une seringue

L’insertion d’une aiguille (stimulus) peut amener le cheval à réagir (réponse) de façon défensive modérément (mouvement des muscles du cou, tête secouée, etc.) ou fortement (cabré). Si l’un de ces comportements permet le retrait de l’aiguille (R-), il y a de fortes chances que ce même comportement réapparaisse à la prochaine injection. Ainsi, en utilisant un apprentissage associatif, on peut apprendre au cheval à exécuter un comportement plus adapté plutôt qu’un comportement défensif potentiellement dangereux pour le cheval et le manipulateur. Dans le cas présent, le comportement attendu est l’immobilité. Pour l’obtenir, le manipulateur peut mimer la seringue en tapotant avec son doigt sur le cou du cheval et continuer cette pression tant que le cheval bouge. Dès que le cheval s’immobilise, le manipulateur doit immédiatement arrêter de tapoter le cheval. Ainsi, au fil des répétitions de cet exercice, le cheval apprend que le comportement qui permet d’arrêter la pression est l’immobilité. Au fur et à mesure des répétitions, le manipulateur peut faire varier la durée de la pression ou la nature du stimulus (remplacer le doigt par une seringue sans aiguille par ex.) pour se rapprocher au plus près des conditions réelles d’une injection.

Utilisation d’une tondeuse électrique

Contrairement au cas précédent, le stimulus n’entraîne pas de douleur chez le cheval. On utilise alors un apprentissage non-associatif (habituation) et un R- pour réguler la réponse comportementale (immobilité). Pour habituer le cheval à la tondeuse, il ne faut en aucun cas arrêter la tondeuse lorsque le cheval exécute des comportements d’évitement sinon ces derniers sont renforcés. Au contraire, lorsque le cheval bouge, il faut continuer à utiliser la tondeuse de la même manière sans interruption. Si aucun des comportements d’évitement du cheval n’arrête la tondeuse, le cheval va s’habituer à la tondeuse et arrêter de bouger. Ceci fonctionne bien avec des chevaux n’ayant jamais été tondus, et en particulier pour la tonte du thorax et de l’abdomen. La situation devient plus complexe lorsque que la tondeuse s’approche de la tête et des oreilles. Quand la tondeuse s’approche de ces zones (stimulus), le cheval peut y échapper avec un mouvement brusque (réponse) et arrêter l’action de la tondeuse (R-). Pour éviter cet apprentissage associatif indésirable, le manipulateur doit utiliser le R- (arrêt de la tondeuse) lorsque le cheval est immobile (comportement désiré). Pour cela, le manipulateur approche la tondeuse des zones sensibles et dès que le cheval bouge, il doit arrêter son mouvement et maintenir sa position, tondeuse toujours allumée. Dès que le cheval s’arrête de bouger, le manipulateur doit immédiatement éteindre la tondeuse. Cette séquence sera à répéter jusqu’à ce que le cheval associe l’immobilité à l’arrêt de la tondeuse. Lors de l’apprentissage, il est important d’arrêter souvent la tondeuse quand le cheval est immobile afin de renforcer ce comportement et de raser de façon intermittente. Au fil des répétitions, les périodes de tonte peuvent être allongées car le cheval a appris qu’à un moment la tondeuse va s’arrêter. Le R- sera d’autant plus efficace que le manipulateur arrête la tondeuse dans les quelques secondes qui suivent l’immobilité du cheval : plus ce laps de temps est faible, plus forte sera la probabilité de créer une association entre le comportement désiré et l’arrêt de la pression.

Comportements indésirables au box lors de la distribution des repas

Lors de la distribution des rations, il faut rester vigilant pour éviter de renforcer des comportements indésirables

Lors de la distribution des rations, il faut rester vigilant pour éviter de renforcer des comportements indésirables

Quand approche le moment des repas, certains chevaux au box tapent leur porte, la mordent, et/ou sont agressifs envers leurs voisins ou les humains. Il est important de savoir que la vie en box favorise l’apparition de comportements destructeurs ou anormaux qui peuvent devenir compulsifs et ensuite stéréotypés. En effet, la vie en box ne permet pas au cheval d’exprimer ses comportements naturels tels que la vie en société, la marche et la mastication pendant de longues périodes. Les comportements naturels de recherche de nourriture (gratter avec la jambe, menacer des congénères, etc.) ont tendance à être reproduits et exacerbés en boxe car la nourriture n’est disponible que pendant de courtes périodes. De plus, ces comportements peuvent être renforcés de façon non-intentionnelle par la personne responsable de l’alimentation des chevaux. En effet, si elle ne prête pas attention au comportement des chevaux, elle peut, au moment même où le cheval exécute des comportements destructeurs (réponse), remplir les seaux (R+) ; ces comportements sont alors renforcés, et ceci d’autant plus que le R+ est intermittent (i.e., non prévisible).

Ainsi, la meilleure manière de prévenir l’apprentissage de tels comportements est de connaître les règles de base de l’apprentissage associatif et d’éviter de les renforcer inconsciemment. Si ces comportements indésirables ont été inconsciemment renforcés, le R+ intermittent permet de les remplacer par de nouveaux comportements.

 

Travail du cheval monté (exemple de la cession à la jambe)

Comme au sol, l’apprentissage sous la selle se fait selon l’enchaînement suivant : stimulus (pression) – réponse (comportement désiré) – renforcement (R- : arrêt immédiat de la pression).

Prenons l’exemple de la cession à la jambe. Le cavalier applique une pression avec sa jambe intérieure tout en résistant avec les rênes. Le cheval va probablement commencer par avancer suite à la pression de la jambe. Le cavalier maintien alors la pression avec la jambe et les mains (Non, ce n’est pas cela que je souhaite) jusqu’à ce que le cheval esquisse un mouvement de déplacement latéral. Le cavalier relâche alors immédiatement la pression (Oui, c’est cela que je souhaite) afin de renforcer le plus léger déplacement latéral. Au fil des séances, le cavalier module progressivement sa demande afin d’allonger la durée ou d’améliorer la qualité du déplacement latéral.

Quelles erreurs peuvent être commises ? Tout d’abord, la première fois que la pression est appliquée, le cheval peut manifester des comportements indésirables (secouer la tête, essayer de mordre la jambe du cavalier, et parfois même ruer ou se cabrer) avant de proposer le déplacement latéral. Si l’un de ces comportements indésirables conduit à l’arrêt de la pression, il sera alors renforcé. Une autre erreur consiste à maintenir la pression alors que le cheval se déplace latéralement. Ainsi, alors que le cheval exécute le comportement désiré, le cavalier lui dit « Non, ce n’est pas cela que je souhaite ». Ceci est source de confusion pour le cheval et l’encourage à proposer d’autres comportements, tels que des comportements défensifs, pour que la pression s’arrête. La prochaine fois que cette même pression sera appliquée, ces comportements défensifs seront exécutés avec une plus forte intensité et fréquence.

Il est essentiel de comprendre qu’un cheval ne peut assimiler toutes les composantes d’un comportement complexe en une seule fois. Ainsi, le processus d’apprentissage requiert la mise en place de séquences « pas-à-pas » constituées chacune d’un seul élément du comportement complexe final, avec des approximations successives jusqu’à l’obtention du résultat final.

Parcours du dossier

Sur l’agenda
Rien pour le moment.
Restez informé !
Alter Equus sur Facebook
});