Qu'est-ce qu'un calendrier de renforcement?

Quel impact les programmes de renforcement ont-ils sur l'apprentissage?

Le conditionnement opérant est un processus d'apprentissage dans lequel de nouveaux comportements sont acquis et modifiés par leur association avec les conséquences. Renforcer un comportement augmente la probabilité qu'il se reproduise à l'avenir, tandis que punir un comportement diminue la probabilité qu'il sera répété. Dans le conditionnement opérant , les programmes de renforcement sont une composante importante du processus d'apprentissage.

Quand et à quelle fréquence nous renforçons un comportement peut avoir un impact dramatique sur la force et le taux de réponse.

Qu'est-ce qu'un calendrier de renforcement?

Alors, quel est exactement un calendrier de renforcement et comment cela fonctionne dans le processus de conditionnement? Un programme de renforcement est fondamentalement une règle indiquant quelles instances d'un comportement seront renforcées. Dans certains cas, un comportement peut être renforcé chaque fois qu'il se produit.

Parfois, un comportement peut ne pas être renforcé du tout.

Selon le cas, un renforcement positif ou un renforcement négatif peut être utilisé. Dans les deux cas, le but du renforcement est toujours de renforcer le comportement et d'augmenter la probabilité qu'il se reproduise à l'avenir.

Vous pouvez avoir une meilleure idée de la façon dont les programmes de renforcement fonctionnent en réfléchissant à la façon dont l'apprentissage se déroule dans des situations d'apprentissage naturelles ainsi que dans des situations d'entraînement plus structurées.

Dans le monde réel, les comportements ne vont probablement pas être renforcés chaque fois qu'ils surviennent. Pour les situations où vous essayez délibérément d'entraîner et de renforcer une action, comme dans la salle de classe, dans les sports ou dans l'entraînement des animaux, vous pouvez choisir de suivre un programme de renforcement spécifique.

Comme vous le verrez ci-dessous, certains horaires sont mieux adaptés à certains types de situations d'entraînement. Dans certains cas, l'entraînement peut nécessiter de commencer avec un horaire et de passer à un autre programme une fois que le comportement souhaité a été enseigné. Certains programmes de renforcement peuvent être plus efficaces dans des situations spécifiques.

Il existe deux types de programmes de renforcement:

Programmes de renforcement continu

En renforcement continu, le comportement souhaité est renforcé chaque fois qu'il se produit. Ce calendrier est mieux utilisé pendant les étapes initiales de l'apprentissage afin de créer une forte association entre le comportement et la réponse.

Par exemple, imaginez que vous essayez d'apprendre à un chien à vous serrer la main. Au cours des premières étapes de l'apprentissage, vous suivrez probablement un programme de renforcement continu afin d'enseigner et d'établir le comportement. Vous pourriez commencer par attraper la patte de l'animal, exécuter le mouvement tremblant, dire «Secouez», puis offrir une récompense chaque fois que vous effectuez cette séquence d'étapes. Finalement, le chien va commencer à effectuer l'action de son propre chef, et vous pouvez choisir de continuer à renforcer chaque réponse correcte jusqu'à ce que le comportement est bien établi.

Une fois la réponse solidement fixée, le renforcement est généralement remplacé par un programme de renforcement partiel.

Horaires de renforcement partiel

En renforcement partiel ou intermittent, la réponse est renforcée seulement une partie du temps . Les comportements appris sont acquis plus lentement avec un renforcement partiel, mais la réponse est plus résistante à l' extinction .

Par exemple, pensez à notre exemple précédent où vous entraîniez un chien à trembler. Bien que vous utilisiez initialement un programme continu, le renforcement de chaque instance du comportement n'est peut-être pas toujours réaliste. Finalement, vous pourriez décider de passer à un horaire partiel où vous fournissez un renforcement après tant de réponses se produisent ou après tant de temps s'est écoulé.

Il y a quatre horaires de renforcement partiel:

Les horaires à taux fixe sont ceux où une réponse est renforcée seulement après un nombre spécifié de réponses. Ce programme produit un taux élevé et régulier de réponse avec seulement une courte pause après la livraison du renforçateur. Un exemple d'un programme à taux fixe serait de livrer une boulette de nourriture à un rat après avoir pressé cinq fois une barre.

Les planifications à rapport variable se produisent lorsqu'une réponse est renforcée après un nombre imprévisible de réponses. Ce calendrier crée un taux élevé de réponse régulière. Les jeux de hasard et de loterie sont de bons exemples d'une récompense basée sur un programme à ratio variable. Dans un laboratoire, cela peut impliquer de livrer des boulettes de nourriture à un rat après une pression d'une barre, à nouveau après quatre pressions de la barre, et une troisième pastille après deux pressions de la barre.

Les horaires à intervalles fixes sont ceux où la première réponse est récompensée seulement après qu'une durée déterminée se soit écoulée. Ce programme provoque une grande quantité de réponses vers la fin de l'intervalle, mais beaucoup plus lentement après la livraison du renforçateur. Un exemple de cela dans un laboratoire serait de renforcer un rat avec une pastille de laboratoire pour la première pression de la barre après un intervalle de 30 secondes s'est écoulé.

Les planifications à intervalle variable se produisent lorsqu'une réponse est récompensée après une période imprévisible. Ce calendrier produit un taux de réponse lente et constante. Un exemple de ceci serait de livrer un culot alimentaire à un rat après la première pression de la barre suivant un intervalle d'une minute, une autre pastille pour la première réponse après un intervalle de cinq minutes, et une troisième pastille alimentaire pour la première réponse après un intervalle de trois minutes.

Comment choisissez-vous un calendrier de renforcement?

Décider quand renforcer un comportement peut dépendre d'un certain nombre de facteurs. Dans les cas où vous essayez spécifiquement d'enseigner un nouveau comportement, un horaire continu est souvent un bon choix.

Une fois le comportement appris, il est souvent préférable de passer à un horaire partiel.

Dans la vie quotidienne, les planifications partielles de renforcement se produisent beaucoup plus fréquemment que celles continues. Par exemple, imaginez si vous avez reçu un type de récompense chaque fois que vous vous êtes présenté pour travailler à temps. Au lieu de cela, ces récompenses sont généralement distribuées sur un calendrier de renforcement partiel beaucoup moins prévisible. Non seulement ces calendriers sont beaucoup plus réalistes et plus faciles à mettre en œuvre, mais ils ont aussi tendance à produire des taux de réponse plus élevés tout en étant moins susceptibles de disparaître.

De manière réaliste, renforcer un comportement chaque fois qu'il se produit peut être difficile et nécessite beaucoup d'attention et de ressources. Les horaires partiels ont non seulement tendance à conduire à des comportements plus résistants à l'extinction, mais ils réduisent aussi le risque que le sujet devienne rassasié. Si le renforçateur utilisé n'est plus désiré ou valorisant, le sujet peut cesser d'exécuter le comportement souhaité.

Par exemple, imaginez que vous essayez d'apprendre à un chien à s'asseoir. Si vous utilisez la nourriture comme récompense, le chien peut cesser d'exécuter l'action une fois qu'il est plein. Dans de tels cas, quelque chose comme l'éloge ou l'attention pourrait être un renforcement plus efficace.

Un mot de

Le conditionnement opérant peut être un puissant outil d'apprentissage. Le programme de renforcement utilisé pendant le processus de formation et de maintenance peut avoir une influence majeure sur la rapidité avec laquelle un comportement est acquis, la force de la réponse et la fréquence d'affichage du comportement. Afin de déterminer quel calendrier est préférable, il est important de considérer différents aspects de la situation, y compris le type de comportement enseigné et le type de réponse requis.

> Sources:

> Cooper, J, Héron, T, et Heward, W. Applied Behavior Analysis . New Jersey: Pearson Education; 2007

> Nevid, JS. Essentials of Psychology: Concepts et applications. Boston, MA: Cengage Learning; 2016