5.3 Un modèle hiérarchique des représentations d’actions inten-tionnelles : système-miroir et predictive coding

Comme suggéré plus haut, la mise en évidence d’une interaction entre informations visuelles et informations a priori, et d’une variation de cette interaction selon le niveau intentionnel ciblé, invite à privilégier un modèle hybride de la compréhension de l’action – mobilisant tantôt des mécanismes simulationnistes, tantôt des mécanismes inférentiels opérant sur des connaissances domaine-spécifiques de plus haut niveau. Un nombre croissant d’observations empiriques et de travaux théoriques suggèrent que ces deux classes de mécanismes pourraient jouer un rôle complémentaire dans les processus de mentalisation(Mitchell, 2005; Keysers & Gazzola, 2007; Brass et al., 2007; de Lange et al., 2008). Les résultats de la présente étude plaident en faveur d’un modèle hybride de ce type : dans ce cadre, l’observateur mobiliserait l’une ou l’autre classe de mécanismes selon que l’information sensorielle disponible est, ou n’est pas assez fiable pour amorcer un processus de simulation.

Récemment, Kilner et collaborateurs (2007a, 2007b) ont proposé de rendre compte de l’interaction de ces deux sources d’informations – a priori et perceptive – au sein d’un modèle hiérarchique de la compréhension de l’action. Le formalisme employé, celui du codage prédictif (predictive coding), est ici particulièrement approprié pour rendre compte de la manière dont un observateur résout le problème inverse de la perception intentionnelle (i.e. lorsque plusieurs intentions sont possibles sur la foi de ce qui est observé). Parce qu’il est biologiquement plausible, ce modèle permet en outre de faire des prédictions relativement fines sur la nature des mécanismes cérébraux impliqués.

Dans le cadre de ce modèle, il est postulé que des régions cérébrales hiérarchiquement distinctes (et possédant, ou non, des propriétés « miroir ») prennent en charge les différents niveaux de compréhension de l’action: 1) le niveau, général est descriptif, de l’ « intention », 2) celui du but pour réaliser cette intention, 3) le niveau subordonné de la commande motrice et enfin, au pied de la hiérarchie, 4) le niveau de la kinématique du mouvement en cours d’exécution (voir également Grafton & Hamilton, 2007). Le formalisme du codage prédictif postule que chaque niveau de la hiérarchie formule des prédictions sur ce que devraient être les représentations du niveau inférieur, puis les prédictions du niveau supérieur sont comparées aux prédictions actuelles du niveau inférieur. Ainsi, étant donné la nature du but qu’il anticipe, le sujet prédira une commande motrice congruente avec ce but, et, sur la base de son propre système moteur, attendra par conséquent une certaine kinématique, cohérente avec cette commande motrice. La comparaison entre la kinématique prédite et la kinématique observée génère, en cas de disparité (mismatch), une erreur de prédiction. Cette erreur de prediction est ensuite minimisée, via des connections forward, par une mise à jour de la représentation élaborée au niveau superordonné. Cet échange de signaux réciproques se poursuit jusqu’à ce que la cause la plus probable de l’action soit inférée ; en d’autres termes, jusqu’à ce que l’erreur de prédiction soit minimisée suffisamment pour permettre cette inférence (Kilner et al., 2007a, 2007b).

Ici, l’erreur de prédiction est une conséquence du problème inverse posé par la situation d’action dont il faut découvrir la cause. Le cadre du codage prédictif offre à ce titre un cadre biologiquement plausible de la manière dont le cerveau humain parvient à résoudre ce problème inverse en minimisant, à chaque niveau cortical (kinématique, commande motrice, simple but, puis intention), l’erreur de prédiction automatiquement générée durant l’observation de l’action. Le codage prédictif, lorsqu’il s’illustre au sein d’un modèle hiérarchique de la cognition, rend également compte de la manière dont des influences descendantes (top-down) peuvent être produites, au cœur du système lui-même, de manière dynamique et contexte-spécifique (Friston et al., 2006). Dans ce cadre, les estimations générées par les niveaux supérieurs deviennent en effet des a priori pour les niveaux inférieurs. En potentialisant l’information perceptive, via des modulations descendantesdu signal d’erreur de prédiction, ces estimations superordonnées rendent donc possible l’inférence intentionnelle même en cas d’incomplétude perceptive ou d’input visuel bruité (voir Baker et al., 2006 ; Summerfield & Egner, 2009).

Figure 9. Le système-miroir humain : un modèle de coding prédictif. L’intention la plus probable est celle qui minimise l’erreur de prédiction à tous les niveaux de la hiérarchie corticale (frontal inf., pariétal sup., STS). Pointillés : connections forward. D’après Kilner, Friston, & Frith (2007).

Les résultats de la présente étude peuvent être interprétés de manière cohérente à la lumière d’un modèle hiérarchique de ce type. L’intention motrice, telle que nous l’avons opérationnalisée, peut être directement prédite depuis l’observation de l’acte moteur lui-même, lorsque l’information visuelle est suffisamment fiable pour amorcer une comparaison avec la kinématique du mouvement prédite aux niveaux superordonnés. Dans ce cas, les performances des participants devraient être largement dépendantes de la minimisation de l’erreur de prédiction qui émerge de cette comparaison. Naturellement, cette comparaison est elle-même dépendante de la fiabilité de cette kinématique : lorsque l’information visuelle est trop incomplète, aucune comparaison ne peut avoir lieu, et de fait, les niveaux inférieurs ne peuvent ajuster leur représentation aux estimations superordonnées de la hiérarchie. La comparaison, suggère le modèle de Kilner, est ici impossible car l’erreur de prédiction est trop large : la kinématique observée sous-détermine en effet largement l’ensemble de ses causes possibles au niveau superordonné.

Dans la présente étude, l’impossibilité de cette comparaison se traduit chez les participants par une tendance à répondre en direction de l’intention qu’ils estiment a priori (i.e. avant l’observation de la séquence elle-même) la plus probable. Cette sur-dépendance aux a priori pourrait témoigner de l’existence d’un circuit de boucles récursives entre les niveaux inférieurs et supérieurs de la hiérarchie corticale. Ces boucles récursives pourraient être mobilisées lorsque l’information perceptive est trop incomplète pour engager une comparaison entre kinématique observée et kinématique attendue, ou, pour le dire autrement, lorsque miser par défaut sur nos attentes préalables est une meilleure garantie pour le succès de la prédiction – même si ces attentes peuvent, à l’occasion, contredire l’évidence perceptive.