1.2.4. Hiérarchie des propriétés de relation dans les traitements visuels précoces

Nous avons vu que, selon Palmer et Rock (1994a), les caractéristiques structurales d’uniformité de couleur ou de texture et la connexion entre les parties seraient les propriétés de relation déterminantes pour la segmentation précoce de régions visuelles, qui constitueront les unités perceptives de base représentant les objets de la sélection attentionnelle. Peut-on envisager que d’autres propriétés de relation participent à ce groupement précoce ? Une configuration complète, c’est-à-dire la combinaison complexe de plusieurs parties entretenant des relations spatiales variées peut-elle également jouer ce rôle ? La réponse à ces questions est nuancée.

Kimchi (2000) relativise ainsi la primauté du groupement fondé sur l’UC en montrant qu’un rapide processus de groupement s’opère aussi sur la base de propriétés de relation comme la fermeture, la collinéarité et la proximité, donnant lieu à des effets de dominance de la configuration sur les composantes, même si ces dernières sont disjointes. Elle présente pour cela une rapide amorce, similaire ou non aux deux stimuli présentés en cible, et pour lesquels un jugement d’identité est requis. Un effet d’amorçage par la configuration se produit même si l’amorce est un ensemble de segments disjoints ne remplissant pas les conditions de l’UC : il suffit qu’ils soient correctement disposés pour que la configuration virtuelle s’impose. Après les critères d’UC, celui qui semble guider les groupements les plus précoces semble être la proximité (Kurylo, 1997), ce qui permet de dire que la connexion des parties n’est pas nécessaire pour délimiter spontanément une forme. Des travaux comparant l’impact de diverses lois d’organisation à partir des conjonctions illusoires montrent le rôle prépondérant de la relation de proximité (Cohen & Ivry,1990 ; Printzmetal, 1995). Han, Humphreys et Chen (1999b) observent aussi que le groupement sur la base de la proximité est plus efficace que celui qui se base sur la similarité de formes et lorsque les deux critères sont disponibles, la proximité est dominante par rapport à la similarité. De même, Han (2004) montre que la concurrence d’un rapprochement possible sur la base de la proximité affecte fortement le groupement selon le critère de similarité de forme alors que l’inverse est moins vrai. Le groupement précoce basé sur la proximité semble se produire particulièrement vite et échappe aussi aux influences de haut niveaux telles que celle de la consigne de se baser plutôt sur un autre critère pour organiser les éléments : les auteurs estiment qu’il s’agit d’un processus de groupement largement bottom-up, produisant les premières unités perceptives dans le champ visuel. La distinction entre les deux types de groupement a d’ailleurs un corrélat électrophysiologique. Des données en potentiels évoqués (ERPs) corroborent l’antériorité du groupement basé sur la proximité, car celui-ci s’accompagne d’une activité positive 100-120 ms après la stimulation dans le cortex occipital médian et d’une onde négative occipito-pariétale 180 ms après le stimulus, alors qu’une onde négative nettement plus tardive est observée dans une région cérébrale distincte (occipito-temporale) pour un groupement basé sur la similitude de couleur (Han, Ding, & Song, 2002) ou de forme (Han, Song, Ding, Yund, & Woods, 2001).

La similarité de forme est moins efficace pour susciter des groupements, mais la ressemblance basée sur la fermeture est un cas particulier. Elle est traitée assez vite, davantage en tout cas que la similarité basée par exemple sur l’orientation (Han & Humphreys, 1999). D’une manière générale, la recherche d’une cible avec comme seul critère la présence d’une caractéristique de relation dépend du nombre de distracteurs. Il s’agirait donc d’une recherche guidée attentionnellement. Mais la fermeture constituerait un trait de relation suffisamment saillant pour une extraction automatique de la cible qui le porte (Elder & Zucker, 1993). Il s’agit d’une caractéristique très intimement liée à la forme et l’augmentation continue du degré de fermeture d’une cible s’accompagne d’une diminution régulière de l’effet du nombre de distracteurs, témoignant d’une automatisation progressive de l’extraction de la forme. Les expériences de Elder et Zucker (1993) montrent que la fermeture est un trait de relation dominant par rapport à la connectivité, ce qui nuance l’affirmation de Palmer et Rock sur le rôle primordial de l’UC. De même, des expériences réalisées avec des stimuli hiérarchisés montrent que la présence de petits éléments fermés au niveau local attire à ce point l’attention que les réponses peuvent alors être plus rapides au niveau local qu’au niveau global, ce qui est atypique (Han, Humphreys, & Chen, 1999a, 1999b ; Kimchi, 1994). De même, dans des tâches où il s’agit de juger l’orientation (lignes ou colonens) d’éléments, Chen (1986, cité par Han & Humphreys, 1999) montre que la similarité des éléments en termes de fermeture est un critère de similarité de forme aussi rapidement extrait que le critère de proximité : seuls ces deux caractéristiques permettraient un jugement correct de l’orientation pour des stimuli présentés très brièvement.

D’autres propriétés configurales ont encore été étudiées comme critères possibles de groupement précoce, avec une logique expérimentale en deux étapes (Lasaga, 1989, cité par Kimchi & Bloch, 1998). Un ensemble de stimuli simples est d’abord choisi, en fonction des performances dans des tâches de discrimination et de classification qui évaluent leur similarité. Ces stimuli simples sont ensuite combinés de manière à créer des configurations. Des épreuves de discrimination et de classification sont alors conduites sur ces stimuli plus complexes, qui se ressemblent ou non pour la configuration générale et/ou les composantes, afin d’inférer une éventuelle dominance perceptive de l’un ou l’autre type de propriétés. Des performances systématiquement meilleures pour discriminer des figures très différentes plutôt que similaires du point de vue configural, quelle que soit la discriminabilité des composantes, de même qu’une classification plus efficace à partir des ressemblances configurales qu’à partir des similitudes des composantes, témoignent d’une dominance perceptive des propriétés configurales. Cette prédiction a été vérifiée par Kimchi (1994), sur l’exactitude et la rapidité des réponses, dans des tâches portant sur 4 configurations : un carré, un losange, un plus (+) et une croix de Saint André (x). La classification la plus facile est celle qui rapproche les figures fermées (un carré et un losange) ou les figures ouvertes (les deux croix), et la discrimination est particulièrement difficile quand elle oppose l’une des figures ouvertes à l’une des figures fermées, ce qui confirme encore l’importance de la propriété configurale de fermeture, et ceci même lorsque les composantes ne sont pas exactement connectées. En utilisant des composantes qui diffèrent parce qu’elles sont droites ou courbes, et des configurations qui se distinguent par la fermeture ou par la symétrie, Kimchi et Bloch (1998) ont ensuite répliqué ces résultats, en prenant soin d’éviter que les tâches ne puissent s’effectuer par simple rotation mentale (ce qui était le cas pour les configurations utilisées dans leurs expériences antérieures). Ici encore, les performances de discrimination et de classification des figures ne peuvent s’expliquer par la similarité de leurs composantes, évaluée dans une expérience préalable. Une dominance perceptive des propriétés de configuration par rapport à celle des composantes est confirmée et il apparaît que la fermeture, mais aussi la symétrie (Kimchi & Bloch, 1998), constituent des propriétés particulièrement prégnantes. Par contre, l’intersection ne semble pas un trait toujours suffisant pour déterminer la détection d’une forme de manière pré-attentionnelle (Wolfe & Di Mase, 2003). La discrimination et la classification sont donc dominées par les propriétés de configuration. Les relations entre les composantes présenteraient une plus forte saillance perceptive que les composantes elles-mêmes, ce qui permettrait de les percevoir plus précocement.

Le cas des configurations complexes est particulier, car elles sont définies comme une une forme combinant diverses propriétés de relations : elles impliquent donc une plus forte complexité. Certains travaux montrent qu’il n’est pas possible aux processus visuels précoces de les utiliser comme seul critère de recherche pour détecter une cible parmi des distracteurs variés (Wolfe & Bennett, 1997). Même si la forme recherchée est facilement identifiable et a une forte valeur écologique (e.g., un ensemble de traits formant un visage), sa détection parmi des distracteurs contenant les mêmes traits articulés différemment n’est pas possible sans attention si les distracteurs sont hétérogènes. De même, la détection d’un T parmi des L (qui contiennent les mêmes traits) orientés de manières variées dépend de la quantité des stimuli non-pertinents et implique donc l’attention (Wolfe, Franzel, & Cave, 1988), même si les distracteurs sont présentés dans des conditions qui évitent les mouvements des yeux (Zelinsky & Sheinberg, 1997).

Toutefois, la recherche d’une configuration n’est plus affectée par l’augmentation du nombre de distracteurs lorsque ceux-ci diffèrent de la cible par leur seule configuration et sont homogènes entre eux (Duncan & Humphreys, 1989 ; Humphreys, Quinlan, & Riddoch, 1989). Il est difficile d’interpréter de tels résultats en évoquant seulement une analyse des traits. Le processus de regroupement inter-items des distracteurs pourrait opérer non seulement sur des traits individuels, mais aussi sur des formes combinées, des unités structurées. Ainsi, bien que la configuration ne suffise pas à guider la détection automatique de la cible, la similarité entre plusieurs configurations peut par contre être prise en compte comme critère de regroupement. Ce regroupement spontané (inter-item grouping) permettrait de distinguer une région par rapport à laquelle se détacherait avec évidence la forme à détecter, d’autant plus facilement que la cible se distingue fortement des distracteurs et que ces distracteurs se ressemblent entre eux (Duncan & Humphreys, 1989). La structure étendue qui se dégage ainsi fait percevoir une grande région unifiée, et il est difficile dans cet exemple de justifier les frontières de cette zone homogène sans que la configuration (traitée comme similaire) des éléments qui la composent ait été prise en compte. Les expériences dans lesquelles il s’agit de repérer une zone contenant la répétition d’une forme (région contenant des signes +) parmi des distracteurs contenant les mêmes composantes configurées différemment (L présentés dans diverses orientations) confortent aussi la précocité du traitement visuel permettant de repérer des zones homogènes pour ce qui est de la configuration des objets (Beck, 1966, cité par Wolfe & DiMase, 2003). Mais les configurations qui semblent ainsi pouvoir, dans une certaine mesure, s’imposer dès les traitements visuels précoces sont-elles véritablement des formes intégrées, organisées clairement dans la représentation mentale ? Ne s’agit-il pas plus simplement de proto-objets rassemblant des composantes sur la base de la présence de propriétés de relations, sans que l’organisation précise des composantes et des diverses relations soit encore codée, faute d’attention ?