3.2.2. Rôle des représentations verbales dans le traitement d’informations visuo-spatiales imagées

De nombreux travaux ont montré qu'un recodage verbal peut être utilisé pour encoder des informations spatiales. Ainsi, Fenner, Heathcote et Jerrams-Smith (2000) ont montré, à travers une tâche de rappel d’un parcours dans un environnement, que les performances des enfants de 5-6 ans étaient fortement liées à leurs capacités visuo-spatiales, alors que ce n’était pas le cas des enfants de 9-10 ans. Ces auteurs suggèrent qu’alors que les jeunes enfants n’ont pas la capacité de former des modèles mentaux de leur environnement dans un format propositionnel (verbal), l’utilisation de ce type de codage s’accroît avec l’âge. L’étude de Miles, Morgan, Milne et Morris (1996) va dans le même sens. Ces derniers ont montré que lorsqu'une tâche visuelle d'identification de patterns est couplée à une suppression articulatoire, les performances sont significativement diminuées chez des enfants de 7 ans et des adultes, mais pas chez les sujets plus jeunes, suggérant l'idée qu'une stratégie verbale pourrait favoriser le rappel de patterns visuels. D'autres recherches ont également suggéré que les enfants de plus de 7 ans auraient tendance, lorsque des images leur sont présentées, à opérer un recodage des informations spatiales sous une forme phonologique (Hitch, Halliday, Dodd & Littler, 1989; Hitch, Halliday, Schaafstal & Schraagen, 1988 ; Hitch, Woodin & Baker, 1989 ; Pickering, 2001) et que la suppression articulatoire peut affecter les performances à des tâches visuo-spatiales (Pelizzon, Brandimonte & Fravretto, 1999). Par ailleurs, Pickering et al. (2001) ont tenté d'expliquer pourquoi le rappel de stimuli dans des épreuves visuelles et spatiales était meilleur lors de la présentation statique que lors d'une présentation dynamique (expérience 1, décrite pp. 55-56), et pourquoi les enfants de 8 et 10 ans testés obtenaient des scores significativement plus élevés que les enfants de 5 ans. Ils ont émis l'hypothèse que les enfants de 8 et 10 ans procédaient à un recodage sous forme verbale ou phonologique de l'information visuo-spatiale, et que par ailleurs ce recodage s'opèrerait plus aisément pour des images statiques que pour des stimuli dynamiques, car la récupération en MLT de connaissances concernant la reconnaissance de patterns et leurs labels verbaux serait plus facilement appliquée à des images statiques. Pour tester cette hypothèse, ils constituent deux groupes d'enfants de 6 et 10 ans (seul le deuxième est censé avoir recours de façon régulière à une stratégie de recodage de l'information visuo-spatiale, auquel ils soumettent une tâche visuelle de rappel de patterns (tâche des matrices), successivement dans deux versions, statique et dynamique. Chaque version est combinée à trois conditions : tâche seule, tâche avec suppression articulatoire (boucle phonologique inopérante, ou pour le moins fortement perturbée) et tâche avec "tapping" spatial (cette dernière condition permettant de contrôler l'effet de l'interférence occasionnée par la tâche secondaire venant perturber la tâche principale). La suppression articulatoire était générée en demandant au sujet de répéter le mot "table", régulièrement et sans interruption durant l'apparition des stimuli sur l'écran d'ordinateur. La tâche secondaire de "tapping" spatiale était réalisée au moyen d'un tableau carré en bois, sur lequel était disposée aux quatre coins une cheville. Afin que le niveau de difficulté soit équivalent pour chacun des groupes d'âge, les enfants de 6 ans devaient taper avec la main entre deux chevilles sur un plan horizontal, tandis que les enfants de 8 ans devaient taper chacune des quatre chevilles en suivant le sens des aiguilles d'une montre. Les résultats ont révélé un effet significatif de l'âge (les scores étaient significativement supérieurs chez les enfants les plus âgés) et du format de la tâche (scores plus élevés pour la version statique), ainsi qu'une interaction significative entre ces deux facteurs, montrant des variations inter-groupes plus importantes pour la tâche statique. Mais l'hypothèse formulée par les auteurs n'a pas été vérifiée. En effet, il n'a pu être établi que la suppression articulatoire durant l'encodage des stimuli avait un effet néfaste sur la performance à la tâche. Aussi, l'accroissement plus important des performances pour la version statique par rapport à la version dynamique de la tâche visuelle (tâche des matrices) n'apparaît pas dû au recours plus massif des enfants les plus âgés au recodage verbal, puisque le fait d'empêcher ce recodage verbal durant l'encodage des stimuli visuo-spatiaux n'entraîne pas une baisse significative des performances lors d'une présentation de la même tâche seule (sans tâche secondaire interférente venant perturber l'usage et le fonctionnement de la boucle phonologique). Mais les auteurs ont jugé ces résultats incertains. En effet, pour savoir si la suppression articulatoire et le "tapping" spatial ont une influence sur les performances à la tâche des matrices (tâche visuelle), il aurait été nécessaire de connaître les performances relatives à ces deux tâches secondaires, en les faisant passer également seules, afin de voir si la réalisation de la tâche visuelle conjointement à une tâche secondaire provoque ou non un déclin des performances dans cette dernière. C'est pourquoi ils proposent une expérience complémentaire, dans laquelle ils évaluent à nouveau les performances d' enfants de 6 et 10 ans dans les deux versions (statique et dynamique) de la tâche des matrices, chacune de ces versions étant passée seule ou combinée à l'une des deux tâches secondaires (suppression articulatoire et "tapping" spatial). Un enfant figurait donc non plus dans six, mais dans neuf conditions expérimentales. De plus, un groupe d'adultes était ajouté, afin de déterminer si les changements développementaux observés chez les enfants étaient généralisables aux adultes. Ce dernier groupe passait une épreuve supplémentaire par rapport aux enfants, elle aussi combinée ou non à l'une des deux tâches secondaires (soit au total douze conditions expérimentales). Il s'agissait d'une tâche de rappel verbal immédiat d'une liste de chiffres entendus ("digit recall"). Le niveau de complexité augmentait par l'ajout, tous les quatre essais, d'un item dans la liste. L'utilisation de cette tâche visait à s'assurer, d'une part, que la tâche de suppression articulatoire est responsable de la désactivation de la boucle phonologique, et d'autre part, que la tâche de tapping spatial n'engendre pas des diminutions dans les performances simplement parce que c'est une tâche plus difficile. Les résultats relatifs au rôle de la boucle phonologique dans la réalisation de la tâche visuelle ont montré une interaction significative entre le format de présentation de la tâche des matrices (statique vs dynamique) et l'âge des sujets, et l'examen des performances pour la version statique et pour la tâche de suppression articulatoire n'a pas révélé de baisse significative à la tâche visuelle lorsque la boucle phonologique est désactivée. Par conséquent, le rôle du recodage verbal de l'information visuo-spatiale n'a pu être mis en évidence dans le cas de la réalisation de la tâche des matrices dans sa version statique. Ces résultats rejoignent ceux observés par De Ribeaupierre, Lecerf et Bailleux (2000), qui notent un changement développemental tardif dans les modes d'encodage utilisés dans des épreuves visuo-spatiales. Ces auteurs ont proposé une série de trois expériences, visant à déterminer, d’une part, la nature de l’encodage (visuo-spatial et/ou verbal) utilisé pour la mémorisation de propriétés visuo-spatiales (localisation et/ou couleur) et, d’autre part, si le type d’encodage donne lieu à des changements développementaux. La tâche utilisée consistait à rappeler les positions de jetons colorés placés sur une personnage (un clown en forme de cacahuète : M. Peanut). Les jetons étaient soit de même couleur (M. Cacahuète violet : Purple-P task), auquel cas le sujet devait mémoriser les positions des jetons, soit de couleur différente, le sujet devant alors mémoriser à la fois les positions et les couleurs des jetons. Dans la première expérience, des enfants de 6, 8 et 10 ans ont effectué chacune des deux tâches, conjointement à une tâche verbale (suppression articulatoire) ou spatiale. La tâche concourante articulatoire visait à supprimer l’usage de la boucle phonologique, en faisant répéter "bla-bla-bla" durant l'encodage. La tâche interférente spatiale consistait à dessiner, de façon répétée, sur une feuille placée sur le côté, avec l'index de la main dominante, un grand "8" en adoptant un mouvement gardant la même amplitude. Les performances aux tâches secondaires n'étaient pas enregistrées (l'expérimentateur veillait néanmoins à ce que le sujet effectue correctement ces tâches). Un groupe contrôle, réalisant la tâche principale seule, sans tâche concourante, était par ailleurs constitué. Le niveau de complexité de la tâche principale augmentait en ajoutant, à chaque nouvel essai, un jeton sur le personnage. Le temps d'exploration du personnage était proportionnel au nombre de jetons placés (trois secondes si trois items étaient présents, quatre secondes en présence de quatre jetons, etc…). Outre le fait que les performances dans chacune des épreuves de rappel de localisation spatiale (M. Peanut-Violet) et de rappel d'associations couleur-position (M. Peanut-Couleur) croissaient au cours du développement, les résultats ont montré que les trois groupes d'enfants recouraient massivement à un encodage de type spatial, la suppression articulatoire ne provoquant pas de baisse significative des performances à la tâche, contrairement à la présence de la tâche secondaire spatiale. Dans une deuxième expérience, De Ribeaupierre et al. (2000) soumettent les mêmes tâches à des sujets adultes, afin de voir si le recodage verbal des informations visuo-spatiales est une stratégie prégnante chez cette population. En outre, afin de tester l’hypothèse selon laquelle l’encodage des informations visuo-spatiales est favorisée lorsque les positions sont encodées en même temps (car le sujet dispose alors d’une image globale), les auteurs proposent deux versions pour chacune des deux tâches (M. Peanut-Violet et M. Peanut-Couleur). En plus de la présentation simultanée utilisée dans la première expérience, ils soumettent une présentation séquentielle (les jetons apparaissaient les uns après les autres). Les résultats ont montré que la suppression verbale durant l’encodage avait un effet néfaste sur les performances des sujets sur chacune des épreuves, quelle que soit le mode de présentation. Les adultes recoureraient, de façon quasi exclusive, à un encodage de type verbal. Du reste, les performances relevées ne se distinguaient pas de façon significative entre les deux modes de présentation des stimuli (simultanée vs séquentielle). Enfin, dans une troisième expérience, conduite également avec des adultes, les deux mêmes tâches secondaires (répétition verbale vs spatiale) et modes de présentation (simultanée vs séquentielle) étaient conservés (le groupe contrôle étant lui aussi maintenu), mais l’épreuve originale était modifiée. Les contours externes de la figure du clown ont été supprimés (d’où le nom "Cacahuète-Fantôme" ("Ghost-Peanut task") donné à la tâche), afin de limiter le recours à un encodage verbal des positions. Seule la tâche d'association position-couleur (M. Peanut-Couleur) était utilisée. Les résultats attestaient qu'un encodage de nature spatiale intervenait, en dépit du fait que l'encodage verbal n'était pas totalement supprimé. Les auteurs en concluent que, lorsque les conditions le permettent et bien qu'il ne soit pas le plus efficace, les adultes adoptent de façon quasi systématique un codage verbal pour traiter une information visuo-spatiale.

Il apparaît donc que le recodage verbal de l'information visuo-spatiale est non seulement fonction de l'âge des sujets, mais aussi de la nature de la tâche à réaliser et du contexte expérimental. Comme l'ont montré de nombreux travaux (De Ribeaupierre et al., 2000 ; Miles et al., 1996 ; Pelizzon et al., 1999), il peut jouer un rôle essentiel et constituer une stratégie efficace dans le rappel de stimuli visuo-spatiaux. L’usage de représentations multiples dans l’encodage en MDT d’items visuo-spatiaux constituerait une base plus solide pour leur mémorisation que le recours simple à des représentations uniquement visuelles (Palmer, 2000).

Deux raisons ou facteurs pouvant rendent compte des changements de comportement relatifs au codage des informations visuo-spatiales au cours du développement ont été mis en avant. La première explication est que la capacité de transformation d’une information dans un format visuel à un format phonologique dans une tâche mnésique est étroitement liée à l’acquisition de la langue (Conant, Fastenau, Giordani, Boivin, Chounramany, Xaisida, Choulamountary, Pholsena & Olness, 1997 ; Fastenau, Conant & Lauer, 1998 ; Logie, Della Sala, Wynn & Baddeley, 2000).

Le deuxième facteur jouant un rôle dans les changements développementaux quant à la conversion des informations visuelles sous forme verbale est la maturation des fonctions associées à l’exécuteur central de la MDT, qui est impliqué dans une multitude de processus cognitifs. Si les jeunes enfants ont recours à un codage visuel dans le rappel d’informations visuo-spatiales, c’est parce qu’ils se limitent aux caractéristiques perceptives des stimuli (Longoni & Scalisi, 1994 ; Palmer, 2000). Les étapes précoces du développement de la MDT s’appuient sur l’établissement de fonctions basiques perceptives et sensori-motrices, alors que les changements développementaux subséquents reposent sur la maturation de systèmes neurologiques permettant l’intégration de processus complexes associés à la MDT. De plus, plusieurs mécanismes ou facteurs participent au développement de la MDT visuo-spatiale, en particulier ceux ayant trait à la récupération de connaissances sémantiques ou lexicales stockées en MLT (Vecchi, Montecellai & Cornoldi, 1995 ; Wilson, Scott & Power, 1987), à la planification de l’action et à la manipulation des informations stockées (Baddeley, 1996), à l’efficacité d’utilisation d’une stratégie adaptée à la résolution d’un problème requérant le rappel d’une information (Cowan, 1997 ; Schneider & Sodian, 1997), à la vitesse de traitement de l’information en MDT (Cowan, Wood & Borne, 1994 ; Cowan, Wood, Wood, Keller, Nugent & Keller, 1998 ; Smyth & Scholey, 1996) et à l’attention (Cowan, 1997).

La question de l’encodage verbal des données spatiales imagées a été également étudiée en situation de perception haptique. Le codage verbal d’informations spatiales semble également contribuer à la construction des représentations spatiales haptiques. En effet, des différences dans la reconnaissance de formes explorées haptiquement ont été observées, chez l’enfant, selon que ces dernières pouvaient être connues ou étaient dépourvues de signification. Un avantage de la main gauche (donc de l’hémisphère droit, prenant en charge les fonctions spatiales) a été montré lorsque les formes palpées sont sans signification (Summers & Lederman, 1990), alors que quand les stimuli utilisés sont des lettres, on ne retrouve plus cette asymétrie de performances (Gibson & Bryden, 1983). Une interprétation pouvant expliquer ce résultat est que la perception des lettres par le canal haptique exige un traitement spatial effectué par l’hémisphère droit qui peut être perturbé, voire même éliminé par le traitement linguistique réalisé par l’hémisphère gauche (Coiffi & Kandel, 1979 ; Witelson, 1977). Aussi, comme le souligne Stréri (2000), « le problème lié à l’utilisation d’objets concrets est qu’ils sont aisément identifiés par leur nom et qu’une médiation verbale, comme pour les lettres, peut affaiblir la capacité de traitement de l’hémisphère droit » (p. 96).

Le recours possible à un codage verbal de stimuli visuo-spatiaux a également été mis en évidence par l’observation de dissociations caractérisant certaines pathologies. A cet égard, l’exemple de l’aphasie (ou anomie tactile) tactile, qui recouvre un trouble de la dénomination des objets perçus, a fait l’objet de travaux. Cette pathologie est le plus souvent observable chez des patients ayant subi une section chirurgicale ou accidentelle du corps calleux (patients « split-brain »). La plus grande partie des études conduites concernent un déficit du traitement de l’information de la main gauche (ou parfois bimanuel). L’incapacité du sujet à dénommer des objets palpés de la main gauche serait due à la déconnexion hémisphérique qui supprimerait la mise en relation de la représentation de l’objet exploré tactilement et le nom correspondant. En effet, « les aires corticales impliquées dans la construction de la représentation spatiale des objets palpés de la main gauche sont situées dans l’hémisphère droit qui, suite à la section du corps calleux, n’est plus en contact avec les zones du langage situées dans l’hémisphère gauche » (Gentaz & Badan, 2000, p. 39). Les études de Baynes, Tramo, Reeves et Gazzaniga (1997) et Badan et Caramazza (1997) confortent cette interprétation, et montrent que la reconnaissance haptique est dépendante du niveau de familiarité des stimuli présentés, puisque la patiente identifiait plus difficilement des objets sans signification (lettres et formes avec ou sans signification découpées dans du papier de verre). De plus, avec l’emploi d’un matériel moins facilement analysable que des objets communs, la patiente présentait également des troubles de la reconnaissance haptique de la main droite. Endo, Miyasaka, Makishita, Yanagisawa et Sugishita (1992) ont suggéré que, dans l’aphasie tactile, le contenu de la mémoire sémantique ne pourrait être mis en relation avec la mémoire lexicale. Ils ont montré, à partir de l’observation de deux patients présentant des troubles de la perception haptique, que l’aphasie tactile est la conséquence d’une lésion sous-corticale incluant le gyrus angulaire gauche, qui empêche toute liaison entre les aires sensorielles associatives et les aires du lobe temporal inférieur impliquées dans la mémoire sémantique, créant une déconnexion tactilo-verbale.

Les données relatées précédemment montrent que le recodage verbal d’informations spatiales, lorsque le stimulus exploré le permet (selon son degré de familiarité, ou sa nature sémantique : significatif ou non, et suivant les conditions de réalisation de la tâche), est une stratégie pouvant être adoptée par le sujet, si ce dernier dispose des connaissances sémantiques (unités lexicales) requises pour l’appariement entre les représentations mentales stockées en MDT et celles contenues en MLT, au sein du lexique mental. Cette stratégie semble du reste susceptible d’être activée quelle que soit la modalité perceptive d’exploration du stimulus (visuelle vs haptique).

Enfin, il est à noter que les relations entre représentations visuelles (images mentales) et représentations verbales ne s’avèrent pas symétriques chez le jeune enfant. En effet, d’une part, comme nous l’avons vu, de nombreux travaux font état que, pour traiter des stimuli imagés, les jeunes enfants (avant 7-8 ans) ont essentiellement recours à un codage visuel, alors que les enfants plus âgés et les adultes adoptent préférentiellement un codage verbal ou propositionnel. Ainsi, la liaison en mémoire associative entre la représentation visuelle d’un objet et son nom ne s’effectue pas spontanément chez les jeunes enfants. Mais cette différence quant à la nature des liens pouvant s’opérer entre représentations visuelles et représentations verbales au cours du développement ne s’observe pas lorsque l’information encodée est verbale, comme en témoignent les recherches sur le « contrôle de la source », telle que celle de Foley, Durso, Wilder et Friedman (1991). Ces auteurs ont réalisé une expérience dans laquelle, après la présentation d’une série de mots se référant à des objets concrets et d’images représentant des objets différents de ceux évoqués par les mots, des enfants de 6 et 9 ans ainsi que des adultes étaient soumis, sans avoir été prévenus, à une tâche de contrôle de la source dans laquelle ils devaient dire si le mot prononcé par l’expérimentateur avait été présenté sous forme d’image, de mot, ou s’il était nouveau. Aucune évolution développementale notable ne se dégageait des résultats. Le même type d’erreurs était observé chez les enfants et les adultes : tous affirmaient plus facilement qu’un mot avait été présenté sous forme d’image que sous forme de mot. Ainsi, lorsque l’entrée en mémoire associative s’effectue par un mot, il s’avère que l’association du mot avec la représentation visuelle est de même force chez les jeunes enfants et chez les adultes. Les données issues de ces différentes expériences suggèrent donc une asymétrie chez les jeunes enfants concernant les relations en mémoire associative entre représentations visuelles et représentations verbales, le mot apparaissant plus facilement associé à l’image que l’image au mot.

Les quatre chapitres théoriques précédents ont fait l’objet des composantes principales sur lesquelles porte notre étude. Après avoir défini les analyses syntaxiques du dessin (résidant dans la description de règles graphiques) et avoir présenté les travaux sur la règle syntaxique sur laquelle porte plus spécifiquement notre recherche (chapitre 1), nous avons abordé le processus sur lequel s’appuie le PEC : l’opération de planification de l’action (chapitre 2). Cette opération sous-tend l’élaboration de stratégies dans la résolutions de problèmes tels que l’exécution de dessins complexes non familiers (inconnus), et mobilise le système représentationnel, ce dernier assurant l’intégration en mémoire des données du problème. De plus, notre travail étant consacré à l’examen du rôle du contenu et du format des représentations dans l’émergence du PEC au cours du développement, nous nous sommes intéressés :

  1. d’une part, aux capacités représentationnelles (et à leur évolution) relatives à l’intégration en mémoire des données en situation de résolution de problème (construction de représentations unifiées) ; dans cette optique, nous avons envisagé la distinction entre les modalités visuelle et haptique dans l’appréhension perceptive et le traitement des propriétés visuo-spatiales (chapitre 3), et
  2. d’autre part, au format de stockage des informations visuo-spatiales (chapitre 4) ; nous nous sommes alors interrogés sur le rôle (ou la nécessité) de l’imagerie visuelle (recours à des représentations dans un format imagé) et du codage verbal (exploitation de représentations phonologiques ou propositionnelles) des données visuo-spatiales.

Rappelons que la présente recherche a pour objet de déterminer le rôle du contenu et du format des représentations dans l’émergence du PEC, et s’inscrit dans une perspective développementale. Nous formulons l’hypothèse générale selon laquelle le PEC s’appuie sur une opération de planification de l’action, basée sur une intégration cohésive des données (élaboration de représentations globales, contenant les propriétés d’ensemble des dessins à exécuter). Par ailleurs, cette dernière serait conditionnée par le format des représentations pouvant être exploitées par les enfants au cours du développement. Les deux séries d’expériences qui suivent visent précisément à tester ces hypothèses.