3.2 L’apport du formalisme Bayesien

Pour tester cette hypothèse, les neurosciences computationnelles nous ont été d’un secours précieux. Il existe en effet un outil mathématique particulièrement adapté pour modéliser le poids respectif de ces deux sources d’information – perceptives et a priori –, ainsi que leur interaction au cours du temps. Cet outil, représenté sous la forme d’un théorème appelé « théorème de Bayes », a déjà fait l’objet d’une attention particulière dans des domaines aussi variés que l’apprentissage (Knill & Pouget, 2004), le contrôle sensorimoteur (Körding & Wolpert), ou la perception (Mamassian & Goutcher, 2001). Dans le cadre du formalisme Bayesien, l’acte de perception, par exemple, peut être modélisé comme un processus d’inférence probabiliste, en partie non-conscient. Cette inférence combine deux paramètres : une probabilité a priori (i.e. la probabilité de chaque état possible de la scène avant que ne survienne le stimulus), et une vraisemblance, relatives aux données perceptives de la scène (i.e. la probabilité du stimulus étant donné chaque état possible de la scène). Cette approche peut naturellement être généralisée aux processus cognitifs de plus haut-niveau (Tenenbaum et al., 2007 ; Baker et al., 2006), et nous avons fait l’hypothèse que les processus engagés dans la reconnaissance d’intentions devaient eux aussi obéir à une logique Bayesienne. Dans ce cadre, l’inférence intentionnelle devrait alors pouvoir être modélisée comme le produit d’une interaction entre des probabilités a priori (la probabilité qu’une intention cause le comportement observé) et des données sensorielles, ayant une certaine vraisemblance (les informations perceptives que le sujet accumule sur la scène d’action).

Quatre protocoles expérimentaux ont été élaborés pour tester cette hypothèse. Chaque protocole présentait des séquences d’actions filmées, guidées par des intentions de nature motrice ou privée (sociale ou non-sociale), que les participants devaient inférer. Dans chacune de ces expériences, et conformément à notre « assomption Bayesienne », nous avons donc fait varier 

i) la vraisemblance des informations visuelles, disponibles sur la scène d’action présentée (pour ce faire, nous manipulions la durée de séquences d’actions filmées ; ‘COVERT blocks’, figure 6, page suivante),

ii) les connaissances a priori dont disposait le sujet sur les types d’intentions à reconnaître (pour ce faire, nous augmentions la probabilité de certaines intentions, au détriment d’autres ; ‘OVERT blocks, figure 6).

Figure 6. Design expérimental : exemples de séquences expérimentales typiques (un block “OVERT” suivi par un block “COVERT”) utilisées dans les sessions BASELINE et BIAS. Overt blocks: videos pour lesquelles la quantité d’information visuelle est élevée et constante. Covert blocks: videos pour lesquelles la quantité d’information visuelle varie sur trois niveaux (LOW, MODERATE, HIGH). Dans les 4 expériences présentées, toutes les intentions ont la meme probabilité d’être réalisées, à l’exception des “OVERT blocks” de la session BIAS où une intention particulière a une probabilité d’occurrence plus importante que les deux autres (ici, l’action “tourner” (rotate), en rouge). Labels: Ov: Overt blocks; Co: Covert blocks; L: “lift” action; R: “rotate” action; T: “transport” action.

Nous avons ensuite comparé les performances des participants entre ces conditions dites « biaisées », où certaines intentions étaient plus probables que d’autres (‘bias session’), et des conditions « contrôles » (‘baseline session’) où toutes les intentions présentées avaient la même probabilité d’être réalisées. Nos prédictions étaient les suivantes : si l’inférence intentionnelle obéit à une logique Bayesienne, alors

  1. dans les conditions où l’action est présentée avec une quantité d’information visuelle peu élevée, les sujets devraient tabler davantage sur leurs connaissances a priori – c’est-à-dire avoir tendance à répondre préférentiellement en direction de l’intention qu’ils estiment la plus probable ;
  2. en revanche, lorsque l’action est présentée avec une quantité d’information visuelle élevée, les sujets devraient être moins sensibles à ce biais et présenter une dépendance accrue aux informations perceptives.

Notre seconde prédiction concernait la qualité de l’interaction entre ces deux sources d’informations, dont nous avons estimé qu’elle devait dépendre du type d’intention testé :

i) Pour la reconnaissance d’intentions motrices simples, les sujets devraient présenter une dépendance accrue aux informations perceptives. Cette prédiction est motivée par la nature pragmatique du contenu de l’intention motrice : il existe en effet une correspondance directe entre « l’intention de lever un verre » et l’acte de « lever » ce verre. En ce cas, percevoir l’acte lui-même devrait suffire à déterminer la nature de l’intention sous-jacente.

ii) Pour les intentions privées (sociale ou non-sociale) en revanche, les sujets devraient présenter une dépendance accrue aux informations a priori. Le contenu de l’intention privée (« avoir l’intention d’éteindre la lumière ») est en effet général et descriptif, et il est en partie détaché de la situation d’action : l’information perceptive sur le mouvement exécuté (« presser l’interrupteur » par exemple) ne suffit donc pas à déterminer la nature de l’intention privée, car cette information sous-détermine l’ensemble des intentions privées congruentes avec ce mouvement (l’acte « presser l’interrupteur » est en effet compatible aussi bien avec l’intention privée « éteindre » ou « allumer » la lumière). De fait, la reconnaissance d’une intention de nature privée s’opère dans un contexte d’incertitude perceptive qui devrait encourager les participants à se « méfier » de ce qu’ils observent et à se fier davantage à leurs attentes a priori.

iii) Lorsque les intentions motrices ou privées présentent une composante sociale (elles sont à propos d’autrui), cette dépendance aux informations a priori devrait s’accroître. La structure de l’interaction sociale (collaborative ou compétitive) répond en effet à des attentes particulières, souvent irrépressibles (la réputation des agents engagés dans l’interaction, par exemple ; Fu & Lee, 2007 ; Frith & Frith, 2006, pour revue). Nous estimons que le poids de ces attentes a priori devraient influencer massivement les prédictions du sujet, jusqu’à l’emporter sur la vraisemblance perceptive des séquences d’actions présentées.

iv) Chez les patients schizophrènes, enfin, nous nous attendions à ce que le déficit observé pour l’un ou l’autre niveau de la hiérarchie intentionnelle, s’exprime sous la forme d’une interaction inappropriée entre informations a priori et vraisemblance perceptive. Cette interaction anormale pourrait traduire une confiance excessive accordée à une source d’information au détriment de l’autre. La nature de l’information privilégiée devrait en outre dépendre du profil symptomatologique du patient : le profil de mentalisation des patients « productifs » pourrait en effet se caractériser par une tendance à accorder un crédit excessif aux informations endogènes et auto-générées (Firth, 1992), tandis que les patients « négatifs » inclineraient à se concentrer sur les informations exogènes et directement observables plutôt que sur leurs propres expériences internes (Taylor, 1994). Nous avons donc systématiquement évalués, pour chacun des patients testés, la sévérité des dimensions productive et négative via les échelles de cotation clinique standard, SANS (Andreasen, 1983) et SAPS (Andreasen, 1984).