2.2.2. Le modèle animal et son application expérimentale chez l’homme

Les procédures expérimentales qui fournissent une évaluation cognitive et comportementale de l’impulsivité ont été utilisées dans les études psychopharmacologiques chez l’animal et par la suite chez l’homme. Elles sont essentiellement orientées sur les processus neurochimiques et neurofonctionnels impliqués dans les comportements cognitifs et moteurs définis comme impulsifs. Un autre type de mesures cognitives est constitué des tests neuropsychologiques utilisés dans un objectif d’évaluation fonctionnelle et de diagnostic de problèmes neurologiques organiques, lésionnels ou viral. Le recours à ces instruments en psychopathologie clinique s’explique par la relation étroite entre l’objectif de compréhension des fonctions cérébrales, propre à la recherche fondamentale, et l’intérêt que fournit pour l’étude des processus anormaux celle de leurs perturbations. L’évaluation cognitive de l’impulsivité en psychopathologie s’inscrit également dans la validation de modèles expérimentaux cherchant à identifier les processus similaires impliqués dans la diversité des comportements qualifiés d’impulsifs.

Les études animales de l’impulsivité se réfèrent typiquement à trois modèles expérimentaux : les procédures de récompense différée, celles de renforcement différentiel associé à un faible niveau de réponse et les procédures d’auto-renforcement (Evenden, 1999). Ces trois procédures ont été élaborées à l’origine dans le but d’évaluer l’effet d’une intervention pharmacologique et chimique sur les comportements impulsifs pathologiques afin de pouvoir les “ soigner ”.

Les procédures de renforcement différentiels (“  differential reinforcement of low rates  ”) sont essentiellement utilisées chez l’animal dans des études de pharmacologie comportementale. Elles sont sous-tendues par l’hypothèse selon laquelle l’émission de contingences de renforcement en compétition produit un conflit psychologique propice à générer un état d’anxiété. L’exemple le plus classique consiste à conditionner un animal à inhiber une réponse motrice entraînant l’émission d’un renforcement positif (comme de la nourriture) afin d’éviter simultanément un renforcement négatif (de type choc électrique). Soubrié (1986) note qu’une telle procédure, en ayant recours à des stimuli aversifs, fait essentiellement intervenir la dimension anxieuse. Elle n’apparaît donc pas pertinente pour étudier la dimension impulsive de manière spécifique et indépendante. L’une des variantes de cette procédure est “  the differential reinforcement  of low rates of responding schedule of reinforcement  ” (procédure DRL). Dans celle-ci, l ‘animal doit espacer ses réponse consécutives par un intervalle de temps. Le respect de cet intervalle de temps entre l’émission de la réponse motrice conduit à un renforcement positif. Dans ce cas, la capacité à inhiber un comportement est donc évaluée par la capacité du sujet à différer sa réponse motrice afin de respecter les intervalles de temps requis entre deux réponses pour obtenir une récompense. Cette procédure utilisée chez l’homme est nommée « space responding DRL » (Deitz, 1989). Plusieurs variantes de cette procédure existent et ont été validées chez l’homme : 1. la procédure « interval DRL » dans laquelle le renforcement positif est émis à la suite d’un intervalle de temps déterminé si moins d’un nombre prédéterminé de comportements cibles ont été émis durant cet intervalle de temps. Dans le cas où le sujet émet plus de comportements cibles que le nombre requis, le délai esr reporté, différant ainsi l’émission du renforcement positif ; 2. la procédure « full sessions DRL » dans laquelle le renforcement est délivré à la suite d’un délai uniquement si moins d’un nombre prédéterminé de comportements cibles ont été émis (Deitz, 1989 ; Evenden, 1999). Dans le cas de toutes les procédures DRL, le délai de temps ainsi que le nombre de comportements cibles requis sont déterminés par une évaluation en baseline de l’intensité du comportement cible sur lequel on cherche à agir. La procédure de « space responding DRL» est appropriée aux comportements qui apparaissent inadaptés essentiellement du fait de leur haut niveau d’occurrence. La procédure de « interval DRL » est utile dans le contrôles de comportements problématiques mineurs et nécessitant l’émission plus direct de feed-backs aidant au contrôle comportemental. La procédure de « full session DRL», enfin, est utilisée dans tous les cas où l’émission d’un comportement doit être réduite bien qu’il puisse s’exprimer occasionnellement (Deitz, 1989).

Le paradigme de “  self-control  ” (Logue, 1988) fait intervenir un délai de renforcement. Deux choix de réponse sont possibles. Le sujet a à choisir entre un renforcement positif de faible intensité délivré immédiatement et un renforcement positif de plus grande intensité mais différé. Cette procédure classiquement appliquée chez l’animal peut-être également utilisée dans les études sur l’impulsivité chez l’homme. Elle n’implique pas le recours à des stimuli aversifs. Dans une étude sur les effets des benzodiazépines chez le rat, Thiébot, Le Bihan, Soubrié et Simon (1985) ont utilisé cette procédure chez le rat sous la forme d’un labyrinthe et ont montré que les benzodiazépines diminuaient la tolérance des rats à l’obtention d’une récompense différée. Chez l’homme, cette procédure a été appliquée tout d’abord par Mischel (1961) qui a montré que des sujets catégorisés comme des délinquants choisissaient moins souvent la récompense différée que des sujets contrôles. Cette procédure a également été appliquée auprès d’enfants présentant un trouble de l’hyperactivité et de l’attention (trouble AD/HD). Cherek, Moeller, Doughert, et Rhoades (1997) ainsi que Cherek et Lane (1999) ont enfin montré que des sujets prisonniers de sexe masculin et féminin, considérés comme violents, montraient une préférence significative pour la récompense immédiate comparés à des sujets également prisonniers mais considérés comme non-violents.

Le paradigme Go / no go est également une procédure utilisée pour étudier les déficits d’inhibition comportementale et l’impulsivité chez l’homme. Nous développerons plus avant cette procédure expérimentale que nous avons choisi d’utiliser dans notre étude.

Appliquées à l’homme, ces procédures sont sous-tendues par des modèles explicatifs des comportements d’impulsivité impliquant le rôle des renforçateurs dans la détermination d’un comportement et dans son expression. La capacité d’inhiber ou de différer un comportement, définition en négative d’un comportement impulsif (réaction émotionnelle non contrôlée rationnellement face à un facteur environnemental perçu comme agresseur ou source d’une douleur morale, comportements addictifs, d’automutilation, achats compulsifs, trichotillomanie, jeux pathologique...), est corrélée à la valence émotionnelle positive contenue dans les conséquences de l’émission d’un comportement. De ce point de vue, l’impulsivité traduit un mode de réponse spécifique aux stimuli, fortement dépendant des renforcements positifs ou négatifs d’une action. La manipulation de la variable renforcement dans les études sur l’animal, a été reproduite sous la même forme dans les études chez l’homme et renvoie à la question de la motivation : qu’est ce qui motive l’émission d’un comportement impulsif, en particulier quand il n’est pas bénéfique à la personne et est donc source de renforcements négatifs ? Ces modèles expérimentaux s’inscrivent dans une perspective béhavioriste. Ils renvoient à la règle comportementale selon laquelle les facteurs qui motivent un comportement impulsif conduisent à l’expression préférentielle d’un comportement auquel est associé un résultat rapide ou dit en d’autres termes une récompense immédiate plutôt qu’à l’obtention d’un résultat positif différé. La fonction ou corrélation positive qui relie par ailleurs la latence du délai (durant lequel la réponse comportementale à une stimulation n’est pas émise) à la diminution de la force motivationnelle d’une récompense est le facteur temps. Un comportement est donc considéré comme impulsif lorsqu’il est consécutif au choix d’une récompense immédiate plutôt que différée. Dans le cas où la conséquence de ce choix comportemental est positive et adaptée, on parlera d’impulsivité fonctionnelle (Dickman, 1990). Mais dans les cas, qui nous intéresse plus fréquemment où le comportement impulsif est émis alors même que le sujet estime n’en retirer que des conséquences négatives, le facteur motivationnel n’apparaît pas le seul facteur en jeu. Le facteur émotionnel intervient également dans l’émission d’un comportement impulsif et/ou d’une cognition intrusive. Les symptômes psychopathologiques qui présentent une composante impulsive apparaissent fortement déterminés, d’une part par l’intensité de l’émotion ressentie et d’autre part par la capacité individuelle à contrôler cette émotion, en la contenant ou en la transformant et la détournant de sa forme d’expression première, spontanée et immédiate.