Problématique de la thèse

Lorsqu’un stimulus est perçu par le centre de la rétine appelée fovéa, le système visuel est particulièrement sensible à son détail qu’il code tout au long de la chaîne du traitement de l’information visuelle. En revanche, lorsque ce même stimulus est perçu dans la périphérie rétinienne une partie de l’information plus ou moins importante pour la reconnaissance de ce stimulus est perdue. En effet, l’acuité visuelle ou résolution spatiale, est maximale dans la fovéa et se dégrade progressivement dans la périphérie. En regardant la lettre ‘g’ ci-dessous on peut l’identifier bien que cela soit difficile.

Par contre, si on fixe le point à gauche, la reconnaissance du ‘g’ dans la partie périphérique droite s’avère très difficile voire impossible. Des différences anatomiques et physiologiques expliquent cette différence fonctionnelle.

Les différences entre vision fovéale et vision périphérique sont présentes dans les trois centres d’intégration principaux du système visuel : la rétine, le corps géniculé latéral et le cortex visuel. Les cônes, photorécepteurs photopiques qui assurent la vision de jour et traitent le détail et la couleur, sont plus denses au centre de la rétine et deviennent de moins en moins denses à mesure que l’on se déplace vers la périphérie. Les champs récepteurs des cellules ganglionnaires situés dans la fovéa sont très petits (0.25°) et deviennent de plus en plus grands en s’éloignant vers la périphérie, jusqu’à atteindre une surface supérieure à dix degrés. De plus, l’espacement entre les photorécepteurs est plus régulier au centre qu’en périphérie rétinienne.

Le corps géniculé latéral et l’aire visuelle primaire (V1) du cortex visuel abritent une carte de la rétine (projection rétinotopique), de sorte que deux points adjacents de la rétine se projettent de façon ordonnée. La densité des cellules est homogène au niveau de V1, ce qui change c’est la surface vouée au traitement d’un degré d’angle visuel : le facteur d’agrandissement cortical. Le champ visuel central est traité par des photorécepteurs régulièrement espacés et une plus grande surface corticale que le champ visuel périphérique.

Deux modèles physiologiques s’opposent quant à l’agrandissement cortical de la partie centrale du champ visuel. Un premier modèle attribue cet agrandissement à la densité des cellules ganglionnaires autour du centre de la rétine (Webb & Kaas, 1976). L’agrandissement étant défini comme le rapport de la surface de la structure neuronale par l’étendue de l’espace représenté. Le deuxième modèle propose que le cortex visuel bénéficie d’un agrandissement supplémentaire qui n’est pas dû uniquement à la densité des cellules ganglionnaires (Malpel & Baker, 1975 ; Perry & Cowey, 1985). Une étude ultérieure apporte des arguments en faveur de ce deuxième modèle (Myerson, Manis, miezin & Allman, 1977). Ces auteurs ont observé que la représentation corticale du champ visuel central est plus importante que ne le prédit la distribution des cellules ganglionnaires. En effet, 42% de l’aire V1 est vouée au champ visuel central de 10° alors que 25% seulement des cellules ganglionnaires sont vouées à cette même portion du champ visuel (Silveira, Picanço-Diniz, Sampaio & Oswalso-Cruz, 1989).

Deux modèles psychophysiques s’opposent pour expliquer la différence entre les performances visuelles réalisées au centre du champ visuel et celles réalisées dans sa périphérie. D’abord, le modèle à échelle unique proposé par Rovamo et Virsu (1979). En partant du constat de la sur-représentation de la fovéa et de la sous-représentation de la périphérie, ces auteurs ont formulé l’hypothèse suivante : si la différence entre la rétine centrale et la rétine périphérique est une question de représentation corticale, alors l’agrandissement de la taille d’un stimulus en périphérie donnerait les mêmes performances qu’en fovéa. Cette hypothèse a été vérifiée dans une expérience psychophysique où le sujet devait détecter la présence ou l’absence d’un stimulus à différentes excentricités. Les résultats ont montré une égalisation des performances à travers le champ visuel après agrandissement adéquat des stimuli selon l’excentricité à laquelle ils étaient présentés. C’est la naissance de la théorie du facteur d’agrandissement.

En effet, comme le montre la figure ci-dessus, la lettre ‘g’ est plus facile à identifier dans la condition B que dans la condition A grâce à un agrandissement de la taille du stimulus. L’idée d’un facteur d’agrandissement permettant de rendre équivalentes différentes tâches visuelles à travers le champ visuel est controversée par plusieurs auteurs (Farrel & Desmarais, 1990 ; Levi & Aitsebaomo, 1985, Saarinen, 1988, Saarinen, Rovamo & Virsu, 1989, Strasburger, Harvey & Rentschler, 1991, Strasburger, Rentschel & Harvey, 1994) . En effet, ces auteurs ont observé que le facteur d'agrandissement proposé par Rovamo et Virsu ne pouvait rendre équivalentes des tâches visuelles telles que l’identification de chiffres arabes (Farrel & Desmarais, 1990, Strasburger, Harvey & Rentschler, 1991, Strasburger, Rentschel & Harvey, 1994), de patterns symétriques en miroir (Saarinen, 1988, Saarinen, Rovamo & Virsu, 1989) et la discrimination de positionnement vernier (levi & al, 1985) à travers le champ visuel.

En reprenant les résultats d’études physiologiques,Levi et al., (1985) ont proposé le modèle à double échelle. Ces auteurs ont représenté le rapport périphérie/fovéa de l’inverse de la densité des cônes (CD-1) (Dow, Snyder, Vautin & Bauer, 1981) ainsi que l’inverse de la représentation corticale (M-1) (Rolls & Cowey, 1970) en fonction de l’excentricité en degrés d’angle visuel. Les résultats ont montré deux rythmes d’évolution très distincts. Un rythme de changement rapide caractérisant la baisse de représentation corticale et un rythme plus lent caractérisant la baisse de la densité des cônes en fonction de l’excentricité en degrés.

Par analogie avec ces rythmes caractérisant l’évolution de la représentation corticale et celle de la densité des cônes, (Levi et al. (1985)) ont proposé deux échelles d’agrandissement pour deux types de tâches visuelles. Une échelle pour les tâches de discrimination de position qui sont plus contraintes par des facteurs corticaux et donc nécessitent un facteur d’agrandissement plus important que celui proposé par Rovamo et Virsu. Une deuxième échelle pour les tâches de détection de contraste et de résolution de réseaux qui sont plus contraintes par des facteurs rétiniens et peuvent être égalisées par le facteur d'agrandissement proposé par Rovamo et Virsu. Ces conclusions donnent une explication convainquante des résultats de plusieurs études notamment celle de Saarinen et al. (1989), Strasburger et al. (1990) et Farrel et Desmarais (1990).

Toutefois, l’explication proposant deux échelles d’agrandissement selon le type de tâche est controversée. En effet, contrairement au modèle à échelle double Levi et al. (1985) et en accord avec le modèle à échelle unique (Rovamo & Virsu, 1989), les résultats de Higgins, Arditi et Knoblauch (1996) ont montré qu’un même facteur d'agrandissement permettait d’égaliser les performances d’une tâche de discrimination de position (identification de lettres symétriques) et celles d’une tâche de détection de contraste à travers l’excentricité rétinienne.

Ainsi, notre premier objectif sera de vérifier si les résultats de Higgins et al. (1996) sont généralisables à d’autres lettres et à d’autres positions dans le champ visuel. Nous étudierons deux types de tâches visuelles (détection et identification) à trois excentricités, notre but étant de comparer les échelles permettant leur égalisation à travers le champ visuel. Les résultats nous permettront d’argumenter en faveur d’un modèle à échelle unique ou d’un modèle à double échelle.

Afin d’étudier une situation qui se rapproche le plus de la réalité du monde visuel dans lequel nous nous repérons, notre deuxième objectif sera d’étudier la perception d’une cible présentée en périphérie dans un environnement chargé. En effet, un stimulus présenté seul est plus facile à identifier que lorsqu’il est entouré par d’autres éléments (Flom, Weymouth & Kahnemann, 1963). L’identification d’une cible en présence d’un pourtour devient de plus en plus difficile à mesure que le stimulus (cible et pourtour) s’éloigne dans le champ visuel périphérique même en tenant compte de l’agrandissement cortical (Anstis, 1974).

En fixant le point ci-dessus, on perçoit la lettre ‘g’ dans la condition A alors que la même lettre ayant la même taille et le même contraste, présentée au milieu de deux autres lettres, ne peut plus être perçue dans la condition B. C’est l’effet de groupement (crowding en anglais).

L’effet de groupement ou la difficulté à discriminer un stimulus dans un environnement chargé dépend de deux facteurs : la distance (Flom et al., 1963; Jacobs, 1979; Loomis, 1978) et aussi le degré de similarité (Kooi, Toet, Tripathy & Levi, 1994; Leat, Li & Epp, 1999; Nazir, 1991) entre la cible et le pourtour. Nous étudierons ces deux facteurs dans la même expérience en utilisant un stimulus structuré de segments Gabor. Grâce à leurs fréquences spatiales et leurs orientations localisées (explication plus loin dans le texte) les segments Gabor permettent une manipulation locale du stimulus.

Cette étude nous permettra de comprendre les caractéristiques de l’effet de groupement en vision périphérique. Nous comparerons nos résultats obtenus dans la périphérie à 10 degrés d’angle visuel dans le champ visuel inférieur à ceux obtenus dans la fovéa avec les mêmes stimuli. Les résultats de cette étude de la vision périphérique constitueront une argumentation en faveur d’un sous échantillonnage de récepteurs rétiniens ou corticaux (Levi et al., 1985) ou d’un bruit de positionnement des cônes rétiniens ou des champs récepteurs corticaux (Hess & Field, 1993).

Une expérience sera consacrée à l’apprentissage perceptif. Plusieurs études utilisant différentes tâches visuelles ont observé une amélioration des performances après un certain nombre de sessions réalisé par l’observateur, notamment lorsque les stimuli étaient présentés en vision périphérique. L’effet de pratique permettant une amélioration des performances est appelé apprentissage perceptif.

Le but de cette expérience est triple. Le premier est de comprendre le mécanisme de l’apprentissage perceptif dans une tâche de détection d’un signal selon un prototype inconnu de l’observateur. Le deuxième est d’appliquer une nouvelle méthode d’apprentissage proposée récemment par Ahumada (1996). Le troisième but est de poser les fondements d’une future étude d’apprentissage perceptif dans la partie périphérique du champ visuel.

En conclusion, à partir des résultats de nos expériences portant sur la détection, l’identification de lettres symétriques et sur l’effet de groupement en périphérie nous donnerons des arguments en faveur d’un modèle à échelle unique ou un modèle à double échelle. Nous présenterons des arguments en faveur d’une différence quantitative ou qualitative entre la vision fovéale et la vision périphérique. L’expérience sur l’apprentissage perceptif en vision centrale nous renseignera sur l’évolution de l’acquisition d’un prototype lorsque celui-ci est inconnu de l’observateur.