1.1 Traitement général de l’information visuelle

Le traitement visuel commence au niveau de l’oeil où arrive un flux constant d’informations lumineuses. A partir de ces indices visuels élémentaires, un traitement complexe de l’image rétinienne est effectué par le cerveau humain afin de construire une représentation perceptive stable du monde environnant.

Une difficulté majeure tient au fait qu’un même objet peut être perçu dans différentes positions et dans différents contextes, pouvant ainsi donner lieu à de multiples représentations perceptives qui devront être ultérieurement combinées pour former un percept tridimensionnel unique de l’objet quel que soit le point de vue d’observation et le contexte. A partir de cette construction d’une représentation perceptive stable de l’objet, il est alors possible de procéder à une interprétation par association avec des représentations préexistantes en mémoire dans le but d’une reconnaissance de l’objet. Il convient donc de distinguer les traitements précoces de l’information visuelle conduisant à une représentation perceptive unique et stable du monde environnant en perpétuel mouvement, des traitements ultérieurs conduisant à l’identification des divers objets et nécessitant une comparaison avec des représentations internes stockées en mémoire. Cette dichotomie entre les phénomènes perceptifs à proprement parler et les phénomènes de reconnaissance se retrouve en partie dans la dichotomie énoncée entre les traitements dits de ’bas niveau’ et ceux dits de ’haut niveau’. Toutefois, cette dichotomie suscite des controverses puisque la distinction entre les traitements de bas niveau et ceux de haut niveau n’est pas encore clairement définie. Les processus de traitement de la vision de bas niveau sembleraient être davantage dépendants des caractéristiques physiques des stimuli et indépendants de la nature de la tâche comparativement à ceux associés à la vision de haut niveau (Üllman, 1996; pour revue, Montoute, 1999).

Nous nous limiterons aux premiers niveaux de traitement visuel et à leur organisation avant l’accès aux informations contextuelles intégrées à la mémoire permanente. Les conceptions cognitivistes classiques décomposent le système perceptif de traitement de l’information en deux grandes étapes. Les premiers traitements, qualifiés de ’précoces’, correspondraient à l’encodage des caractéristiques élémentaires, telles que les dimensions, l’orientation de contour, la fréquence spatiale, la disparité rétinienne, la couleur, la direction du mouvement, etc.

La seconde étape des traitements visuels correspondrait davantage à des processus de structuration permettant la mise en rapport des informations locales extraites au niveau précédent et la réalisation de groupements d’éléments (Kubovy et Pomerantz, 1981; Beck, 1982; pour revue, Bonnet, 1995). Ces conceptions font par conséquent l’hypothèse d’une organisation hiérarchique et d’une décomposition du traitement de l’information visuelle en un certain nombre d’étapes successives. Par ailleurs, cette structure hiérarchique de l’ensemble du système visuel associe souvent les processus de traitement de la vision de ’bas niveau’ à des processus majoritairement ascendants (’bottom-up’ ou ’data-driven’) partant des informations rétiniennes et allant progressivement vers des informations de plus en plus intégrées à des niveaux supérieurs dans la hiérarchie. Des données en psychologie et en neurophysiologie ont néanmoins montré l’existence de processus descendants (’top-down’ ou ’concept-driven’) mettant en jeu des connaissances acquises et influençant les traitements perceptifs de bas niveau, comme cela a été montré pour certains phénomènes d’illusions optiques (Gregory, 1975; pour revue Thorpe, 1994; Bonnet, 1995). L’organisation strictement hiérarchique du système visuel a également été remise en cause par un certain nombre de données expérimentales suggérant plutôt une organisation en réseau avec des processus pouvant fonctionner en parallèle ou en interaction et non sur un mode linéaire ascendant (pour revue, Üllman, 1996; Tallon-Baudry, 1997) ; l’existence d’un tel parallélisme pourrait être une des clés de la grande efficacité (rapidité et efficience) des traitements réalisés par le système visuel.

De même que l’hypothèse d’une organisation hiérarchique est classique dans les conceptions fonctionnalistes, l’hypothèse d’une organisation modulaire du système visuel, souvent illustrée par des schémas de ’boîtes’, est largement présente. La notion de modularité prend son origine dans la conception fodorienne.

Selon Fodor (1983, 1985), le système cognitif serait décomposable en structures modulaires, de type ’bottom-up’, et non modulaires, de type ’top-down’, et toute opération complexe serait décomposable en sous-opérations. ’Un système modulaire, perceptuel, est caractérisé par des opérations obligatoires, rapides, automatiques, ’domaines-spécifiques’, pré-câblées et innées alors qu’un système non modulaire, central, présente des caractéristiques opposées, c’est-à-dire qu’il est lent, non spécifique, cognitivement pénétrable et sans architecture fixe’ (Nachson, 1995). Ainsi, le système visuel, hautement complexifié, serait organisé de manière modulaire facilitant de ce fait, selon Fodor, la détection des erreurs et l’efficience des traitements. Cette décomposition du système visuel en modules de traitement permet une compréhension plus aisée de son fonctionnement, c’est-à-dire que chaque sous-opération est supposée être sous-tendue par un processus indépendant et spécialisé. Autrement dit, à chaque module serait dévolu le traitement d’une caractéristique particulière. Par ’module’, il faut entendre un système réalisant son propre traitement sans que son fonctionnement interne ne soit influencé par un traitement d’un autre système. Les modules présentent, dans la conception fodorienne, les propriétés suivantes : impénétrabilité (encapsulation des traitements), irrépressibilité (traitements automatiques), pré-câblage (traitements non influencés par des effets ’top-down’), et spécificité (traitements ’domaines-spécifiques’ dévolus à un seul type d’information). Un exemple typique de la spécificité modulaire, selon Fodor, serait le traitement des visages : la reconnaissance des visages serait sous-tendue par un système périphérique, ’domaine-spécifique’, de niveau supérieur.

Le principe de modularité implique l’existence de neurones spécifiques pour chaque concept (outils, animaux, visages, etc.) et un codage local (par opposition à un codage distribué) de l’information visuelle, où chaque unité représenterait un attribut ou un concept particulier. Cette conception conduit à la notion de ’cellule grand-mère’, ou d’’unité gnostique’ selon Konorski (1967), postulant l’existence de neurones extrêmement spécialisés.

Bien qu’une telle hypothèse soit attrayante, les arguments expérimentaux qui la supportent demeurent fragiles. En effet, les recherches en neuropsychologie favorisent peu la notion de modularité fonctionnelle bien que certains déficits aient été décrits comme plus ou moins spécifiques, par exemple le déficit de la reconnaissance des visages ou prosopagnosie (Bodamer, 1947), celui lié à la perception des objets inanimés (Warrington, 1982; Warrington et Shallice, 1984; McCarthy et Warrington, 1988), ou encore le déficit sélectif de la perception des fruits et légumes (Hart et coll., 1985). Des études ont par ailleurs montré que ces déficits spécifiques étaient rarement isolés : la prosopagnosie est en général associée à un déficit de reconnaissance des couleurs (Zeki, 1990), ou encore à une agnosie visuelle des objets sévère (Newcombe et coll., 1994).

Les principes sur lesquels les conceptions cognitivistes classiques ont fondé l’organisation du système visuel, à savoir une hiérarchie des traitements, un aspect séquentiel des opérations, une modularité des systèmes et une certaine sélectivité, sont aujourd’hui discutés à la lumière des nombreux travaux anatomiques et électrophysiologiques effectués chez le singe et chez l’Homme. Ces travaux apportent des contraintes neurobiologiques en lien avec les bases neuronales qui sous-tendent les différentes opérations, que les psychologues ne peuvent ignorer.