2.5.2.1. Cas d’une surface uniforme

Le traitement hiérarchique du contour et de la surface a été démontré dès les années 60 à l’aide du paradigme des images stabilisées. L’objectif premier de cette technique était d’éliminer les mouvement oculaires, ce qui permettait ainsi d’observer leur rôle en perception visuelle. Pour supprimer les mouvements, l’observateur porte une lentille de contact reliée à un projecteur permettant d’envoyer une image sur la rétine. Il est possible de stabiliser une image sur la rétine de telle manière que, dès que l’œil bouge, l’image se déplace avec lui. L’utilisation de cette méthode a permis de montrer que le système visuel construit des régions dans le champ visuel uniquement à partir de l’information de contour. Ce résultat a été observé par Krauskopf (1963). Dans cette expérience, un cercle vert était entouré par un anneau rouge, et la frontière entre le rouge et le vert était stabilisée sur la rétine. Pour les observateurs, le disque vert central disparaissait et était rempli par l’anneau rouge, ce qui créait la perception d’un seul disque rouge. Cette expérience indiquait que d’une part, les mouvements oculaires participaient à la détection du contraste entre deux régions, et d’autre part, l’information de contour détermine la perception d’une surface. En effet, à partir du moment où la frontière entre l’anneau et le disque est stabilisée, ce contour disparaît, et la perception de la surface également. Cette expérience démontrait l’importance de l’information de contour pour le traitement de la surface. En utilisant des réseaux sinusoïdaux, Blakemore, Muncey et Ridley (1971) ont mis en évidence que le phénomène des images stabilisées n’était pas purement rétinien, mais pouvait être également d’origine corticale.

Par ailleurs, l’importance de ce traitement hiérarchique est également démontré avec l’utilisation d’une figure classique : à savoir les bandes de Mach. Le stimulus se présente sous la forme d’un dégradé achromatique allant du blanc au noir. Dans ce cas, une bande fine supplémentaire est perçue de façon plus claire que la surface lumineuse (à gauche) ; tandis qu’une bande plus foncée équivalente est perçue pour la surface sombre (à droite). Ces deux effets sont observés sur les bords des deux surfaces. Un exemple est présenté à la Figure 27a. La Figure 27b montre le profil de luminance affichée, alors que la Figure 27c indique le profil de luminosité classiquement perçu. Ce phénomène est similaire à l’effet COCE, mais ici les contours ne sont pas physiquement rehaussés. Ce type de stimuli n’implique pas un processus de remplissage dans l’intégration de la surface, mais démontre l’importance du traitement des contours (et plus particulièrement les contrastes) dans la perception de surface.

Figure 27 : Les bandes de Mach sont présentées à la figure 27a. La figure 27b présente le profil de luminance réel, et la figure 27c indique le profil de luminosité (l’exemple est issu de Schwartz, 1999, pp 194).

Toutefois, l’utilisation des images stabilisées permet certes, de démontrer l’existence d’un traitement hiérarchique, mais pas de façon binoculaire. De même, les bandes de Mach ne sont pas une démonstration de l’existence d’un traitement de remplissage. Par conséquent, l’hypothèse du remplissage a été testée à l’aide du paradigme de masquage. La première étude est celle de Stoper et Mansfield (1978) qui utilise un paradigme de métacontraste. Dans les expériences traditionnelles de métacontraste, un disque (la cible) est suivi par un anneau plus grand (le masque), et dans ce cas, l’anneau empêche de percevoir la cible. Une explication de ce phénomène est que le masque perturbe le traitement du contour de la cible ce qui bloque le traitement de sa surface. Dans l’expérience de Stoper et Mansfield (1978), pour empêcher que le masque n’interfère avec le contour de la cible, il était plus petit qu’elle. Les résultats ont montré que le contour de la cible était cette fois-ci perçu, mais les observateurs ne percevaient toujours pas la surface. Le processus de remplissage, distinct du processus de codage du contour, a donc été sélectivement perturbé. Ces données sont cohérentes avec l’idée que le contour est traité par un système rapide précoce, alors qu’un système plus lent et plus tardif traite la surface.

L’étude de Paradiso et Nakayama (1991) va dans la continuité des expériences menées par Stoper et Mansfield (1978). L’objectif de leur étude était de savoir, plus précisément, si l’information de contour participait à la perception d’une région homogène. Leur raisonnement était le suivant : si le processus de remplissage implique une activité de propagation, on peut démontrer son existence en l’interrompant. En d’autres termes, si les bords interrompent le remplissage, que se produit-il quand de nouveaux bords sont introduits ? Est-ce que le processus de remplissage est affecté avant qu’il ne soit complet ?

Paradiso et Nakayama (1991) ont tout d’abord réalisé une observation préliminaire dans laquelle l’expérience de Stoper et Mansfield (1978) était répliquée, mais cette fois-ci avec différents masques. Les résultats étaient identiques (cf. Figure 28) à ceux trouvés par Stoper et Mansfield (1978). Ces observations impliquent que le remplissage d’une surface peut être interrompu par la présentation d’un nouvelle forme (le masque).

Figure 28 : Résultats des observations obtenues dans l’expérience de Paradiso et Nakayama (1991). La figure de gauche indique la cible utilisée. Les trois figures du centre montrent les différents masques utilisés, et enfin les figures de droite présentent ce que les observateurs percevaient à la suite de la présentation de la cible et du masque (l’exemple provient de l’article de Paradiso et Nakayama, 1991).

A la suite des observations préliminaires, une expérience a été réalisée dans laquelle une cible, à savoir un disque blanc sur fond noir, était masquée par un disque blanc plus petit. La taille de la cible variait de 2.3 à 3.4 deg, alors que la taille du masque était constante (2 deg). La tâche de l’observateur était de juger, sur une palette de plusieurs niveaux de gris, la luminosité du centre de la cible. Deux principaux résultats ont été observés. Tout d’abord, les observateurs percevaient une diminution de la luminosité dans la zone de la cible se situant à l'intérieur du masque, mais également à proximité de la zone extérieure au masque. De plus, la suppression de la luminosité augmentait lorsque la taille de la cible augmentait. Ces résultats confirment que le remplissage est interrompu par les contours, mais il indique en outre que cet arrêt se produit graduellement à proximité du nouveau contour. Mais ceci est surtout vrai pour des délais de présentation entre le masque et la cible de –50 à +100 msec. Les auteurs ont par la suite estimé la vitesse de remplissage de la cible. Pour cela, ils ont affiché le délai entre la cible et le masque (msec) par rapport à la distance entre la cible et le masque (deg). Les résultats ont montré que le processus de remplissage se produisait pour un délai de 110 à 150 deg/sec.

Paradiso et Nakayama (1991) ont réalisé une seconde expérience où un disque segmenté était utilisé en tant que masque : la suppression variait de 0 (masque complet) à 360 degrés (pas de masque). Le processus de remplissage se produisait aussi lorsque le masque était segmenté. Ainsi, ces résultats, tout comme ceux observés dans l’expérience principale, reflètent l’intervention d’un processus de remplissage, qui commence dès les contours de la cible et qui continue jusqu’à ce que d’autres contours arrêtent ce phénomène. Ces résultats ne semblent donc pas être compatibles avec la théorie BCS/FCS de Grossberg et collaborateurs dans laquelle les contours arrêtent immédiatement le remplissage de la surface. Pour Arrington (1994), cette critique n’intègre pas les récents changements de la théorie BCS/FCS (Grossberg & Todorovic, 1988). Il montre par une simulation informatique que le modèle BCS/FCS permet de simuler les données des expériences de Paradiso et Nakayama (1991), pourvu que ces changements soient pris en compte. Cette étude conforte donc la thèse selon laquelle les contours n’arrêtent pas directement le remplissage de la surface, mais le font graduellement.

Le phénomène de remplissage a également été démontré en utilisant d’autres techniques que le paradigme de masquage. Dans une observation préliminaire, Paradiso et Hahn (1996) ont montré que lorsque la luminance d’un disque augmentait, la luminosité de ce disque n’était pas homogène. En effet, les observateurs percevaient soit une luminosité différente sur les contours du disque par rapport à la zone centrale, soit une zone sombre qui se remplissait vers l’intérieur. Les auteurs ont donc testé de façon qualitative ce phénomène en manipulant le délai entre chaque augmentation ou diminution de la luminance du signal. Le temps de présentation global du signal était toujours identique. Dans leurs expériences, les observateurs avaient pour consigne d’évaluer la force de leur sensation sur une échelle. Les résultats ont indiqué que pour des délais brefs (0.16 msec) ou longs (2 sec), aucune perception de remplissage n’était perçue. Mais la perception de ce phénomène était maximisée pour des durées intermédiaires (0.25 à 0.5 msec). De plus, la perception du remplissage était plus importante lorsque la luminance du signal diminuait. Des résultats identiques ont été observés quand le disque était placé autour de la tache aveugle. Ce dernier résultat suggère que la perception du remplissage est réalisée à partir de l’activité des neurones du cortex visuel. Par la suite, Paradiso et Hahn (1996) ont manipulé le temps de présentation global du signal : le délai de présentation entre chaque stimulus était toujours identique et a été choisi pour maximiser le processus de remplissage. Les résultats ont montré que plus le temps de présentation était long, et moins les observateurs percevaient le phénomène du remplissage.

Pour Paradiso et Hahn (1996), le mécanisme de remplissage aurait un rôle fondamental dans la perception de la luminance. En effet, la luminance perçue au centre d’une région uniforme pourrait être le résultat d’une interaction latérale entre les neurones. Ainsi, le signal serait traité à partir du contraste entre deux bords, et ce contraste influencerait progressivement les zones plus éloignées du bord. Le traitement neuronal du remplissage déterminerait la luminosité. Le problème de cette interprétation est qu’elle n’explique pas pourquoi les observateurs percevaient une surface homogène pour les délais inter stimuli les plus brefs. Les auteurs supposent que ce phénomène pourrait exister durant cette période, mais il se produit trop rapidement pour être perçu. Ce qui expliquerait pourquoi nous ne percevons pas de surface non uniforme dans la vie courante. De même, pour les délais inter stimuli les plus longs, à chaque fois que la luminance augmente, le traitement de remplissage est effectué avant la prochaine augmentation de luminance. Ainsi, le remplissage d’une surface existe, mais ce processus est trop bref pour être perçu.

La luminosité d’une surface dépend de paramètres spatiaux, comme le contraste au bord d’une figure ou encore la taille de la figure (Schwartz, 1999). Par ailleurs, la luminosité d’une surface est également influencée par d’autres caractéristiques, et notamment les informations contextuelles. Par exemple, un carré gris sur un fond clair apparaît plus sombre qu’il ne l’est réellement. Cet effet est inversé lorsque le même carré est présenté sur un fond sombre. Pour tenir compte de l’ensemble de ces paramètres, Rossi et Paradiso (1996) ont utilisé un réseau sinusoïdal. Les fréquences temporelles et spatiales de ce réseau étaient manipulées. La tâche de l’observateur était d’ajuster la fréquence temporelle à la plus petite fréquence pour laquelle la luminosité de la bande centrale semble arrêter la variation de luminance entre les bandes claires et sombres du réseau. Les résultats ont indiqué que le seuil des fréquences temporelles diminuait lorsque la taille des bandes augmentait (les fréquences spatiales basses). Des résultats similaires ont été observés lorsque les observateurs ajustaient la luminosité d’un rectangle par rapport à la luminosité de la bande centrale du réseau. Ces résultats supposaient que l’induction de luminosité était plus lente pour des grandes tailles. Cette limite est en accord avec l’idée qu’un mécanisme de remplissage se produit depuis les bords jusqu’à l’intérieur de la figure.

De nombreuses études physiologiques (Komatsu, Murakami & Kinoshita, 1996 ; MacEvoy, Kim & Paradiso, 1998 ; Rossi & Paradiso, 1999 ; Rossi, Rittenhouse & Paradiso, 1996) ont cherché à déterminer l’existence d’un processus de remplissage d’une surface uniforme à partir de l’enregistrement des neurones chez le singe comme nous l’avons présenté en détail dans une partie précédente. L’une des premières questions que l’on pourrait se poser est de savoir si les singes sont sensibles aux mêmes phénomènes que l’observateur humain. Une étude comportementale a ainsi été réalisée afin de déterminer si le phénomène de remplissage était généralisable pour l’ensemble des primates (Friedman, Zhou & von der Heydt, 1999). Les stimuli étaient composés d’un cercle et d’un anneau, et deux couleurs étaient utilisées alternativement (rouge et vert). Les bords du cercle étaient correctement définis ou lissés. Par ailleurs, le disque était statique ou en mouvement. La tâche consistait à appuyer sur une touche dès que le stimulus apparaissait comme uniforme. L’expérience était réalisée par des singes, mais également par des observateurs humains. Des essais contrôle étaient effectués pour lesquels la couleur du disque changeait régulièrement. Cette condition contrôle permettait de vérifier que les singes réalisaient correctement la tâche en ne répondant pas de façon systématique au bout d’un certain temps. Les premières réponses du singe ont été enregistrées 3-4 sec après la présentation du stimulus. Un plus grand nombre de réponses était donné lorsque le stimulus était composé d’un cercle statique et lissée. De plus, les singes percevaient le stimulus comme étant moins uniforme quand le disque était lissé sur les bords et en mouvement, ou statique et avec des contours bien définis. Très peu de réponses ont été données lorsque le cercle avait une frontière fixe et en mouvement. Des résultats similaires ont été obtenus chez l’observateur humain. Les résultats suggèrent donc que les singes perçoivent le processus de remplissage de la même façon que les humains.

L’ensemble de ces études ont montré la participation du processus de remplissage dans la perception de luminance. La propagation du signal neuronal a été ici mis en évidence en le stoppant (Paradiso & Nakayama, 1991 ; Stoper & Mansfield, 1978), ou en manipulant le temps de présentation (Paradiso & Hahn, 1996) ou la taille (Rossi & Paradiso, 1996) du signal. Le phénomène du remplissage est un processus rapide qui se produit à une vitesse de 110-150 deg/sec pour la propagation de la luminosité (Paradiso & Nakayama, 1991). Ce résultat est différent de la vitesse déterminée par Davey, Madess et Srinivan (1998) qui était de 22.44 deg/sec. Cette différence pourrait être liée à l’utilisation de figures illusoires (Davey, Madess & Srinivan, 1998) ou non (Paradiso & Nakayama, 1991).

Par ailleurs, une distinction contour/surface a également été réalisée pour l’activation des représentations d’objets. Biederman et Ju (1988) ont testé l’implication de la dimension de surface dans les représentations des objets. Dans une de leurs expériences, les observateurs devaient dénommer des objets constitués de dessins aux traits ou de photos en couleur des mêmes objets. Les résultats ne montraient pas de différence entre les temps de dénomination pour ces deux conditions, ce qui suggère que l’information de surface n’apporte pas d’information supplémentaire pour l’identification d’objet. Un résultat similaire a été trouvé par Ostergaard et Davidoff (1985) dans une tâche de catégorisation vivant/non vivant pour des dessins d’objet et des photos.