Conditionnement instrumental

Un autre terme pour le conditionnement opérant

Le conditionnement instrumental est un autre terme pour le conditionnement opérant , un processus d'apprentissage décrit pour la première fois par BF Skinner . Dans le conditionnement instrumental, le renforcement ou la punition sont utilisés pour augmenter ou diminuer la probabilité qu'un comportement se reproduise à l'avenir.

Exemples de conditionnement instrumental

Par exemple, si une élève est récompensée chaque fois qu'elle lève la main en classe, elle aura de plus en plus tendance à lever la main à l'avenir.

Si elle est également grondée quand elle parle à son tour, elle devient moins susceptible d'interrompre la classe. Dans ces exemples, l'enseignant utilise le renforcement pour renforcer le comportement de la main-levée et la punition pour affaiblir le comportement de sortie de parole.

Le conditionnement instrumental est souvent utilisé dans l'entraînement des animaux. Par exemple, entraîner un chien à serrer la main impliquerait d'offrir une récompense chaque fois que le comportement souhaité se produit.

Une brève histoire du conditionnement instrumental

Le psychologue EL Thorndike a été l'un des premiers à observer l'impact du renforcement dans les expériences de boîtes de puzzle avec des chats. Au cours de ces expériences, Thorndike a observé un processus d'apprentissage qu'il a appelé «apprentissage par essais et erreurs».

Les expériences impliquaient de placer un chat affamé dans une boîte de puzzle et, pour se libérer, le chat devait trouver une échappatoire. Thorndike a ensuite noté combien de temps il a fallu aux chats pour se libérer à chaque essai expérimental.

Initialement, les chats se sont engagés dans des méthodes d'évasion inefficaces, grattant et creusant sur les côtés ou le haut de la boîte. Finalement, un essai et une erreur conduiraient les chats à pousser ou à tirer avec succès la voie d'évacuation. Après chaque essai successif, les chats s'engageaient de moins en moins dans les comportements d'évasion inefficaces et répondaient plus rapidement avec les bonnes actions d'évasion.

Thorndike a fait référence à ses observations comme la loi d'effet . La force d'une réponse augmente quand elle est immédiatement suivie d'un «satisfier» (renforceur). D'autre part, les actions qui sont suivies d'effets désagréables sont plus susceptibles d'être affaiblies.

Dans les expériences de boîte à énigmes de Thorndike, échapper à la boîte était le plus satisfaisant. Chaque fois que les chats ont réussi à s'échapper de la boîte, le comportement qui a immédiatement précédé l'évasion a été renforcé et renforcé.

Le travail de Thorndike a eu un effet énorme sur les recherches ultérieures de BF Skinner sur le conditionnement opérant . Skinner a même créé sa propre version des boîtes de puzzle de Thorndike qu'il a appelé une chambre opérant, également connu comme une boîte de Skinner .

Comment fonctionne le conditionnement instrumental

Skinner a identifié deux types de comportements clés. Le premier type est le comportement des répondants. Ce sont simplement des actions qui se produisent par réflexe sans aucun apprentissage. Si vous touchez quelque chose de chaud, vous retirez immédiatement votre main en réponse. Le conditionnement classique se concentre sur ces comportements des répondants. Dans les expériences classiques de Pavlov avec les chiens , saliver à la présentation de la nourriture était le comportement du répondant. En formant une association entre le son d'une cloche et la présentation de la nourriture, cependant, Pavlov a pu entraîner les chiens à saliver simplement au son de cette cloche.

Skinner s'est rendu compte que si le conditionnement classique pouvait expliquer comment les comportements des répondants pouvaient mener à l'apprentissage, il ne pouvait pas tenir compte de tous les types d'apprentissage. Au lieu de cela, il a suggéré que ce sont les conséquences des actions volontaires qui ont conduit à la plus grande quantité d'apprentissage.

Le deuxième type de comportement est ce que Skinner appelle des comportements opérants. Il a défini ceux-ci comme n'importe quel comportement volontaire qui agit sur l'environnement pour créer une réponse. Ce sont les comportements volontaires qui sont sous notre contrôle conscient. Ce sont aussi des actions qui peuvent être apprises. Les conséquences de nos actions jouent un rôle important dans le processus d'apprentissage.

Renforcement et Punition

Skinner a identifié deux aspects clés du processus de conditionnement opérant. Le renforcement sert à augmenter le comportement tandis que la punition sert à diminuer le comportement.

Il existe également deux types différents de renforcement et deux types de punition différents. Le renforcement positif consiste à présenter un résultat favorable, par exemple donner un festin à un enfant après qu'elle a nettoyé sa chambre. Renforcement négatif implique l'élimination d'un stimulus désagréable, comme dire à un enfant que si elle mange toutes ses pommes de terre alors elle n'aura pas à manger son brocoli. Puisque l'enfant considère le brocoli comme une conséquence désagréable et que l'ingestion de pommes de terre entraîne l'élimination de cette conséquence indésirable, la consommation de pommes de terre est alors négativement renforcée.

La punition positive signifie l'application d'un événement désagréable après un comportement. La fessée, par exemple, est un exemple courant de punition positive. Ce type de punition est souvent appelé punition par application. Une conséquence négative est directement appliquée pour réduire le comportement indésirable.

La punition négative consiste à enlever quelque chose d'agréable après un comportement. Par exemple, si un enfant ne nettoie pas sa chambre, ses parents pourraient lui dire qu'elle ne peut pas aller au centre commercial avec ses amis. Enlever l'activité désirée agit comme un punisseur négatif sur le comportement précédent.