Les résultats obtenus chez les sujets sains sont conformes aux prédictions que nous avions formulées. Dans les quatre études, la quantité d’information visuelle a un effet significatif sur les performances des participants : lorsque la durée des séquences d’action augmente, l’intention sous-jacente est naturellement plus facile à identifier. Les participants sont également sensibles à la structure probabiliste des séquences et tendent à répondre préférentiellement en direction des intentions dont la probabilité d’apparition est, sur l’ensemble de la séquence, la plus élevée. Cette augmentation des performances en direction de l’intention « privilégiée » interagit par ailleurs avec la quantité d’information visuelle disponible : dans la condition motrice (lever, tirer ou tourner le cube), et lorsque les participants disposent de peu d’information visuelle sur l’action, ils tendent à répondre préférentiellement en direction de leurs a priori – l’intention dont la probabilité est la plus élevée. Dans les conditions où l’intention à reconnaître est de nature « privée » (superordinate), ce phénomène de dépendance est amplifié et vient progressivement contaminer les niveaux intermédiaires d’information visuelle : les participants continuent de se référer à leurs a priori (l’intention qu’ils estiment a priori la plus probable) tout en négligeant les informations perceptives à leur disposition. Enfin, l’ajout d’une composante sociale témoigne d’une amplification de ce phénomène, avec une tendance marquée à répondre en direction des stratégies biaisées, même dans les conditions où l’information visuelle disponible est élevée et peut, à l’occasion, contredire les attentes préalables des participants.
Les résultats de cette première série d’études fournissent au total plusieurs indications. Reconnaître une intention, d’une part, mobilise des processus dont le fonctionnement s’ajuste au cadre plus général du formalisme Bayesien. Nous avons en effet montré que l’inférence intentionnelle pouvait être modélisée comme le produit d’une interaction entre des informations a priori – qui ont une certaine probabilité – et des informations perceptives – qui ont, elles, une certaine vraisemblance, variable selon les conditions. Lorsqu’on réduit progressivement la vraisemblance de ces informations perceptives (en manipulant la durée des séquences d’action), les sujets tendent à répondre de plus en plus massivement en direction des intentions qu’ils estiment les plus probables. Ces résultats confortent l’hypothèse selon laquelle les situations intentionnelles peuvent être interprétées comme des problèmes inverses, c’est-à-dire des situations – dans notre cas, des scènes d’actions – dont les causes, potentiellement multiples, ne peuvent être déterminées sur la foi des seules informations perceptives disponibles (Baker et al., 2006 ; Kilner et al., 2007 ; Keysers & Perrett, 2004 ; Wolpert et al., 2003). Or, confronté à un problème de ce type, il a été montré les sujets tendaient à résoudre l’ambiguité en recourant à des hypothèses a priori sur la nature du phénomène observé. Ce recours a été observé en perception pure, pour la résolution de stimuli bi-stables (Mamassian & Goutcher 2001), mais également en situation d’interprétation téléologique. Les enfants, par exemple, manifestent des attentes a priori extrêmement robustes sur les causes probables de certains événements, et ces attentes s’expriment conjointement à une tendance irrépressible à interpréter certains événements comme étant intentionnels, c’est-à-dire dirigés vers un but (‘teleological obsession’). Lorsque l’information perceptive n’est pas suffisante pour interpréter un événement comme dirigé vers un but (Csibra et al., 1999), ou lorsque l’action n’est que partiellement réalisée (Onishi et al., 2007), les enfants vont jusqu’à postuler des états du monde qui contredisent l’évidence perçue (tels que la présence d’objets physiques cachés). Ces hypothèses viennent compléter, sinon corriger, l’incomplétude perceptive de la situation et confirmer l’hypothèse a priori que l’action observée est bien intentionnelle. Nous croyons que les résultats de la présente étude traduisent, pour tous les niveaux intentionnels évalués, la mise en œuvre d’un mécanisme de complétion a priori de ce type.
Second résultat d’importance, ce recours massif aux a priori s’avère par ailleurs sensible aux variations de complexité intentionnelle : les participants tendent en effet à se référer davantage à leurs a priori lorsqu’on progresse dans la typologie – des intentions motrices simples aux intentions superordonnées, puis sociales. Nous avons fait l’hypothèse que cette différence tenait à la nature-même des intentions présentées. Dans les conditions « superordonnées », les séquences d’actions sont commutatives, et, de fait, un même acte moteur (« tourner » par exemple) peut indifféremment réaliser deux intentions distinctes (construire la forme S1, construire la forme S3)9. Ici, l’acte observé entretient donc une relation de correspondance multiple avec l’intention qu’il réalise (one-to-many relation), au contraire des conditions motrices où l’acte simple (imprimer une rotation au cube par exemple) dénote directement, et sans ambiguité, l’intention sous-jacente (« tourner le cube ») (one-to-one relation). En conditions superordonnées, l’information visuelle véhiculée par la kinématique de l’acte moteur n’est donc pas suffisante pour prédire sans ambiguité l’intention superordonnée que cet acte réalise. L’information perceptive est en ce cas naturellement ambiguë : elle sous-détermine l’ensemble des buts possibles qu’on peut raisonnablement lui associer. Or, en contexte d’incertitude visuelle, les participants n’ont pas d’autres choix que de se référer à leurs connaissances préalables, c’est-à-dire privilégier l’intention superordonnée qu’ils estiment la plus probable a priori. C’est précisément ce que nous observons dans ces conditions : les participants tendent à favoriser les intentions qui satisfont leurs attentes préalables, et à se défier de l’information perceptive associée à la scène d’action.
Enfin, les conditions « sociales » se caractérisent par une contamination de ces attentes a priori généralisée à tous les niveaux d’information visuelle, même élevé. Nous expliquons ce recours massifs aux a priori par les propriétés de la situation présentée aux participants (Chambon et al., ci-dessus). Les contextes d’interaction entre agents sont en effet connues pour amorcer des attentes modulaires, social-spécifiques, qui contribuent – avant même que l’information visuelle ne soit traitée, ou en parallèle de ce traitement – à favoriser certaines causes intentionnelles (e.g. le second joueur coopère si le premier joueur a coopéré / il fait défaut si le second joueur a fait défaut) au détriment de leurs alternatives (coopère toujours, fait toujours défaut, sans stratégie particulière). Cette préférence précoce en direction d’un certain mode de réciprocité (ici, le mode ‘coup-pour-coup’), et la persistance de cette préférence en condition d’information visuelle élevée, pourrait suggérer l’existence d’un système pré-traitant l’information de contexte perceptif. Ce système déterminerait la nature de la situation rencontrée en vertu de ses propriétés perçues : l’action observée est-elle intentionnelle ? la situation est-elle sociale ? L’existence d’un système de pré-traitement de ce type expliquerait dès lors pourquoi, lorsque l’action est identifiée comme se déroulant au sein d’un contexte d’interaction, les participants manifestent des attentes précoces sur la manière dont les agents sont, dans ce contexte, susceptibles d’interagir. La dépendance accrue des participants à leurs a priori semble ici traduire une difficulté à se désengager de ces intuitions domaine-spécifiques.
La mise en évidence d’un biais a priori en faveur du mode de réciprocité ‘coup-pour-coup’ invite à formuler des hypothèses sur les bases évolutionnaires de cette préférence. Les situations d’interaction sont, par défaut (même si elles ne le sont pas toujours nécessairement), des situations où chacun des participants tend à maximiser les bénéfices de l’interaction, tout en veillant à protéger sa ‘bonne’ réputation. Il a été montré que ce genre de situation tendait naturellement à exclure les tricheurs (« always defect ») ou les individus trop altruistes (« always cooperate ») pour converger vers un équilibre caractérisé par l’adoption de la stratégie « coup-pour-coup » (Rapoport & Chammah, 1965; André & Day, 2007). Le ‘coup-pour-coup’ est en effet le modèle qui explique le mieux comment la coopération peut émerger entre des individus mus par des intérêts égoïstes, et comment les systèmes coopératifs résistent aux tricheurs en les excluant, de proche en proche, de la coopération (Axelrod, 1997). Puisque le mode du ‘coup-pour-coup’ est le mode de réciprocité qui garantit, au mieux, la maximisation des gains à long terme, ce mode a pu être sélectionné en raison de son avantage sélectif particulier. Il n’est donc pas à exclure que les situations d’interaction sociale, lorsqu’elles sont identifiées comme telle, amorcent par défaut ce mode de réciprocité optimale. Cette préférence précoce, et peut-être irrépressible, pour le régime du ‘coup-pour-coup’ expliquerait dès lors pourquoi les sujets de la présente étude manifestent une dépendance accrue à leurs a priori (i.e. à ce mode de réciprocité) lorsque l’action de l’agent est précisément identifiée comme s’accomplissant dans un contexte d’interaction supposé par défaut mutuellement avantageux (i.e. un contexte où chaque joueur essaie de maximiser ses gains tout en préservant sa réputation).
Cela s’applique également à l’expérience de pensée de Jacob & Jeannerod (2005), que nous mentionnions en introduction : en l’absence d’attentes particulières sur la personnalité de celui qui tient le scalpel (Mr Hyde ? Dr Jeckyll ?), « manier un scalpel » peut indifféremment dénoter l’acte de torturer et celui de soigner.