Qu'est-ce que le conditionnement opérant et comment ça marche?

Comment le renforcement et la punition modifient le comportement

Le conditionnement opérant (parfois appelé conditionnement instrumental ) est une méthode d'apprentissage qui se produit à travers des récompenses et des punitions pour le comportement. Par le conditionnement opérant, une association est faite entre un comportement et une conséquence pour ce comportement.

Par exemple, quand un rat de laboratoire appuie sur un bouton bleu, il reçoit une boulette de nourriture en récompense, mais quand il appuie sur le bouton rouge, il reçoit un léger choc électrique.

En conséquence, il apprend à appuyer sur le bouton bleu mais évite le bouton rouge.

Mais le conditionnement opérant n'est pas seulement quelque chose qui se déroule dans des environnements expérimentaux pendant la formation des animaux de laboratoire; il joue également un rôle important dans l'apprentissage quotidien. Le renforcement et la punition ont lieu presque tous les jours dans des environnements naturels ainsi que dans des environnements plus structurés tels que la salle de classe ou les séances de thérapie.

Examinons de plus près comment le conditionnement opérant a été découvert, son impact sur la psychologie et comment il est utilisé pour changer de vieux comportements et en enseigner de nouveaux.

L'histoire du conditionnement opérant

Le conditionnement opérant a été inventé par le behavioriste BF Skinner , c'est pourquoi vous pouvez l'entendre occasionnellement sous le nom de conditionnement skinnerien. En tant que behavioriste, Skinner pensait qu'il n'était pas vraiment nécessaire d'examiner les pensées et les motivations internes pour expliquer le comportement. Au lieu de cela, suggéra-t-il, nous devrions seulement regarder les causes externes et observables du comportement humain.

Au cours de la première partie du 20ème siècle, le behaviorisme était devenu une force majeure dans la psychologie. Les idées de John B. Watson ont dominé cette école de pensée dès le début. Watson s'est concentré sur les principes du conditionnement classique , suggérant une fois qu'il pouvait prendre n'importe quelle personne indépendamment de son passé et l'entraîner à être ce qu'il voulait.

Là où les premiers behavioristes avaient concentré leurs intérêts sur l'apprentissage associatif, Skinner était plus intéressé par la façon dont les conséquences des actions des gens influençaient leur comportement.

Skinner a utilisé le terme « opérant» pour désigner tout «comportement actif qui agit sur l'environnement pour générer des conséquences». En d'autres termes, la théorie de Skinner explique comment nous acquérons l'éventail des comportements appris que nous exhibons chaque jour.

Sa théorie était fortement influencée par le travail du psychologue Edward Thorndike , qui avait proposé ce qu'il appelait la loi de l'effet . Selon ce principe, les actions suivies de résultats souhaitables sont plus susceptibles d'être répétées, tandis que celles suivies de résultats indésirables sont moins susceptibles d'être répétées.

Le conditionnement opérant repose sur une prémisse assez simple - les actions qui sont suivies par le renforcement seront renforcées et plus susceptibles de se reproduire à l'avenir. Si vous racontez une histoire drôle en classe et que tout le monde rit, vous aurez probablement plus de chance de raconter cette histoire à l'avenir. Si vous levez la main pour poser une question et que votre professeur fait l'éloge de votre comportement poli, vous aurez plus de chance de lever la main la prochaine fois que vous aurez une question ou un commentaire.

Parce que le comportement a été suivi par un renforcement, ou un résultat souhaitable, les actions précédentes sont renforcées.

Inversement, les actions qui entraînent une punition ou des conséquences indésirables seront affaiblies et moins susceptibles de se reproduire à l'avenir. Si vous répétez la même histoire dans une autre classe, mais que personne ne rit cette fois, vous aurez moins de chance de répéter l'histoire à l'avenir. Si vous criez une réponse en classe et que votre professeur vous gronde, alors vous risquez moins d'interrompre le cours.

Types de comportements

Skinner distingué entre deux types de comportements différents

Alors que le conditionnement classique pourrait expliquer les comportements des répondants, Skinner s'est rendu compte que cela ne pouvait pas expliquer beaucoup d'apprentissage. Au lieu de cela, Skinner a suggéré que le conditionnement opérant avait une plus grande importance.

Skinner a inventé différents dispositifs pendant son enfance et il a mis ces compétences au travail pendant ses études sur le conditionnement opérant.

Il a créé un appareil connu sous le nom de chambre de conditionnement opérant, le plus souvent appelé aujourd'hui une boîte de Skinner . La chambre était essentiellement une boîte qui pouvait contenir un petit animal tel qu'un rat ou un pigeon. La boîte contenait également une barre ou une clé sur laquelle l'animal pouvait appuyer pour recevoir une récompense.

Afin de suivre les réponses, Skinner a également développé un dispositif connu sous le nom d'enregistreur cumulatif. Le dispositif enregistrait les réponses comme un mouvement ascendant d'une ligne de sorte que les taux de réponse pouvaient être lus en regardant la pente de la ligne.

Composants du conditionnement opérant

Il y a plusieurs concepts clés dans le conditionnement opérant.

Renforcement dans le conditionnement opérant

Le renforcement est tout événement qui renforce ou augmente le comportement qu'il suit. Il y a deux types de renforçateurs:

  1. Les renforçateurs positifs sont des événements favorables ou des résultats qui sont présentés après le comportement. Dans les situations qui reflètent un renforcement positif, une réponse ou un comportement est renforcé par l'ajout de quelque chose, comme une louange ou une récompense directe. Par exemple, si vous faites du bon travail et que votre manager vous donne un bonus.
  2. Les renforçateurs négatifs impliquent la suppression d'événements ou de résultats défavorables après l'affichage d'un comportement. Dans ces situations, une réponse est renforcée par l'élimination de quelque chose considéré comme désagréable. Par exemple, si votre enfant commence à crier au milieu de l'épicerie, mais s'arrête une fois que vous lui avez donné un festin, vous aurez plus de chances de lui donner un festin la prochaine fois qu'il commencera à crier. Votre action a conduit à l'élimination de la condition désagréable (l'enfant qui crie), ce qui renforce négativement votre comportement.

Dans ces deux cas de renforcement, le comportement augmente.

Châtiment dans le conditionnement opérant

La punition est la présentation d'un événement indésirable ou d'un résultat qui entraîne une diminution du comportement qu'il suit. Il y a deux types de punition:

  1. La punition positive , parfois appelée punition par application, présente un événement ou un résultat défavorable afin d'affaiblir la réponse qui en découle. La fessée pour mauvaise conduite est un exemple de punition par application.
  2. La punition négative , également connue sous le nom de punition par suppression, se produit lorsqu'un événement favorable ou un résultat est retiré après qu'un comportement se produit. Retirer le jeu vidéo d'un enfant suite à une mauvaise conduite est un exemple de punition négative.

Dans ces deux cas de punition, le comportement diminue.

Horaires de renforcement

Le renforcement n'est pas nécessairement un processus simple et il y a un certain nombre de facteurs qui peuvent influencer la rapidité et la façon dont de nouvelles choses sont apprises. Skinner a constaté que lorsque et à quelle fréquence les comportements étaient renforcés, ils jouaient un rôle dans la rapidité et la force de l'acquisition. En d'autres termes, le moment et la fréquence du renforcement ont influencé la façon dont les nouveaux comportements ont été appris et comment les comportements anciens ont été modifiés.

Skinner a identifié plusieurs différents programmes de renforcement qui ont un impact sur le processus de conditionnement opérant:

  1. Le renforcement continu consiste à fournir un renforcement chaque fois qu'une réponse se produit. L'apprentissage a tendance à se produire relativement rapidement, mais le taux de réponse est plutôt faible. L'extinction se produit également très rapidement une fois que le renforcement est arrêté.
  2. Les programmes à taux fixe sont un type de renforcement partiel. Les réponses sont renforcées seulement après qu'un certain nombre de réponses ont eu lieu. Cela conduit généralement à un taux de réponse assez stable.
  3. Les horaires à intervalles fixes sont une autre forme de renforcement partiel. Le renforcement ne se produit qu'après un certain intervalle de temps. Les taux de réponse restent assez stables et commencent à augmenter au fur et à mesure que le temps de renforcement approche, mais ralentissent immédiatement après la livraison du renfort.
  4. Les planifications à rapport variable sont également un type de renforcement partiel qui implique un comportement de renforcement après un nombre varié de réponses. Cela conduit à la fois à un taux de réponse élevé et à des taux d'extinction lents.
  5. Les horaires à intervalles variables sont la forme finale de renforcement partiel décrite par Skinner. Ce calendrier implique la fourniture de renforcement après une période de temps variable s'est écoulé. Cela a également tendance à conduire à un taux de réponse rapide et à un taux d'extinction lent.

Exemples de conditionnement opérant

Nous pouvons trouver des exemples de conditionnement opérant au travail tout autour de nous. Considérez le cas des enfants qui terminent leurs devoirs pour obtenir une récompense d'un parent ou d'un enseignant, ou des employés qui terminent des projets pour recevoir des félicitations ou des promotions.

Quelques autres exemples de conditionnement opérant en action:

Dans certains de ces exemples, la promesse ou la possibilité de récompenses entraîne une augmentation du comportement, mais le conditionnement opérant peut également être utilisé pour diminuer un comportement. La suppression d'un résultat souhaitable ou d'une application de résultat négatif peut être utilisée pour diminuer ou prévenir des comportements indésirables. Par exemple, on peut dire à un enfant qu'il perdra ses privilèges de récréation s'il ne parle pas de son tour en classe. Ce potentiel de punition peut entraîner une diminution des comportements perturbateurs.

Un mot de

Alors que le behaviorisme a peut-être perdu une grande partie de sa domination au début du XXe siècle, le conditionnement opérant reste un outil important et souvent utilisé dans le processus d'apprentissage et de modification du comportement. Parfois, les conséquences naturelles conduisent à des changements dans notre comportement. Dans d'autres cas, les récompenses et les punitions peuvent être consciemment distribuées afin de créer un changement.

Le conditionnement opérant est quelque chose que vous pouvez reconnaître immédiatement dans votre propre vie, que ce soit dans votre approche d'apprendre à vos enfants un bon comportement ou dans la formation du chien de la famille pour arrêter de mâcher vos pantoufles préférées. La chose importante à retenir est qu'avec n'importe quel type d'apprentissage, cela peut parfois prendre du temps. Considérez le type de renforcement ou de punition qui peut fonctionner le mieux pour votre situation unique et évaluez quel type de programme de renforcement pourrait mener aux meilleurs résultats.

> Sources:

> Coon, D & Mitterer, JO. Psychologie: un voyage. Belmont, CA: Wadsworth; 2014

> Domjan, M. Les principes d'apprentissage et de comportement, septième édition. Stamford, CT; Apprentissage Cengage; 2015