5.3. Représentations phonologiques en période pré-scolaire

5.3.1. Représentations phonologiques lexicales détaillées chez l’enfant ?

Un décalage a été décrit entre les importantes capacités de discrimination perceptive des bébés et les faibles performances des enfants d’âge pré-scolaire, pourtant plus âgés, lorsqu’il s’agit de se baser sur des connaissances phonologiques fines pour reconnaître des mots. L’utilisation de catégories phonologiques détaillées ne semble pas aller de soi chez le jeune enfant dans des situations expérimentales de niveau lexical. Chez des enfants francophones de 11 mois, avec la technique du regard préférentiel, Hallé et Boysson-Bardies (1996) ont montré que les représentations lexicales de mots familiers sont sous-spécifiées. En traitant l’information phonologique sur un ‘mode lexical’, ces enfants admettent des changements portant sur le voisement ou sur le mode d’articulation des consonnes initiales (sans toutefois admettre la suppression complète de la consonne initiale), qui ne les empêchent pas de reconnaître les mots. Pourtant, à cet âge, ils perçoivent les contrastes phonémiques lorsqu’ils sont testés à partir de syllabes sans signification. On peut ainsi observer chez de très jeunes enfants un phénomène de déshabituation lorsqu’une répétition d’une même syllabe (e.g. /ba/) est interrompue par une série d’une nouvelle syllabe (e.g., /da/), sans que cela s’accompagne de la capacité à catégoriser correctement des objets dont les noms constituent une paire minimale basée sur cette opposition. Par exemple, des enfants de 22 à 36 mois se montrent capables de produire correctement un contraste, en imitant la production d’un adulte (ce qui montre qu’ils perçoivent ce contraste), sans parvenir pourtant à utiliser celui-ci correctement pour assigner des sens différents à deux mots (Eilers & Oller, 1976).

Un traitement perceptif correct des traits ne s’accompagne donc pas immédiatement d’une utilisation performante de ces traits pour opposer les significations de mots distincts. L’usage proprement linguistique et lexical de représentations phonologiques détaillées ne va donc pas de soi pour un jeune enfant.

Cette observation a conduit à mettre en avant l’importance, indéniable, d’unités phonologiques de grande taille comme les syllabes pour les tout-petits (Bijeljac-Babic, Bertoncini & Mehler, 1993 ; Eimas, 1994). Elle a aussi donné lieu à l’hypothèse d’une représentation holistique des mots dans le lexique des jeunes enfants. La représentation lexicale serait essentiellement constituée de la structure prosodique, de la forme acoustique globale, ou encore d’un ensemble de traits non organisés en véritables segments avant l’apprentissage de la lecture. L’information sur la position des segments aurait aussi moins d’importance pour les enfants de 5 ans que pour les adultes : les indices extraits au début du mot n’auraient pas pour eux la valeur informative particulièrement forte qui leur est accordée par l’adulte (Walley, 1988). Par exemple, la similarité globale des stimuli suffirait à expliquer les confusions des enfants de 4 ans et demi dans des épreuves de mémorisation, ainsi que leurs réponses dans des tâches de classification, alors que les collégiens répondent en fonction des phonèmes communs (Treiman & Breaux, 1982). Les représentations phonologiques lexicales des jeunes enfants et des adultes sont alors décrites comme de nature différente.

Une première explication pour cette difficulté phonologique dans les épreuves lexicales est qu’elles imposent l’apprentissage de mots, tâche référentielle qui demande en elle-même tellement de ressources que les enfants détournent leur attention des détails phonologiques (Swingley & Aslin, 2000). Les enfants entreraient alors dans un mode de traitement attentionnel particulier (Hallé & Boysson-Bardies, 1996). Une autre explication, évoquée par ces mêmes auteurs, évoque la fascination des enfants pour les objets présentés visuellement dans ces situations lexicales, attraction qui réduit l’attention pouvant être portée sur une analyse phonologique précise des stimuli. Stager et Werker (1997) ont ainsi montré que des enfants de 14 mois différencient les membres d’une paire minimale, à condition qu’ils n’aient pas sous les yeux un objet nouveau en mouvement. Les détails phonétiques impliqués sont donc potentiellement discriminables, mais le contexte doit s’y prêter.

D’après Gerken, Murphy et Aslin (1995), le décalage apparent entre les capacités de discrimination perceptives et la faible sensibilité des enfants à des détails phonologiques rendus pertinents pour le sens de mots pourrait aussi s’expliquer par d’autres aspects méthodologiques. Les tâches utilisées auprès des bébés (distinguer un nouveau stimulus d’un autre, auquel ils étaient habitués) sont beaucoup plus faciles que celles qui sont proposées après un an : il est alors nécessaire d’apparier un stimulus acoustique à son référent. Non seulement cela implique un traitement sémantique, non imposé dans les tâches purement perceptives, mais les épreuves elles-mêmes imposent souvent d’autres contraintes cognitives. Pour White et Morgan (2008), les erreurs des enfants pourraient s’expliquer par d’importantes contraintes relatives aux tâches utilisées, notamment en termes de mémoire de travail et de capacités d’inhibition. D’autres auteurs évoquent aussi une influence négative de la faible familiarité du matériel utilisé (Fennell & Werker, 2003 ; Swingley & Aslin, 2000). Par exemple, dans l’expérience de Eilers et Oller (1976), des enfants de 22 à 36 mois apprennent que le pseudo-mot tig désigne un nouveau jouet, opposé ici à pig (mot familier). Les erreurs de discrimination perceptives s’élèvent à 36%, mais il se pourrait que cette situation expérimentale, centrée sur l’apprentissage d’un mot nouveau et demandant d’inhiber un nom et un objet familiers perturbe les enfants. Dans des épreuves de sélection d’image, Barton (1978, cité par Swingley & Aslin, 2000) a aussi montré que les enfants de 27 à 35 mois parviennent à différencier les membres d’une paire minimale de mots (e.g., ‘bear’/’pear’), mais les performances chutent s’il ne s’agit pas de mots familiers mais de mots appris au moment de l’expérience. De même, les expériences de Garnica (1973) montrent que certains contrastes phonémiques ne sont pas traités de manière stable s’ils doivent être mis en lien avec des mots récemment appris.

Lorsque les tâches lexicales sont peu complexes quant à la sélection de la réponse (utilisation de techniques d’habituation, ou de regard préférentiel) et quand la charge mnésique est faible, tout en impliquant des processus sémantiques sur un matériel familier, les réponses de jeunes enfants peuvent témoigner de représentations de mots remarquablement détaillées du point de vue phonologique. Par exemple, Gerken et ses collègues (1995) utilisent une épreuve où l’enfant doit comparer différents stimuli auditifs à la représentation mentale d’une cible qui reste toujours la même (le mot familier little), ce qui impose une faible charge en mémoire. Ils ont montré que, contrairement à l’hypothèse holistique, les enfants de 3 à 4 ans commettent plus d’erreurs si le stimulus diffère de la cible par deux traits appartenant à un même segment plutôt que par deux traits répartis sur des segments différents. Les traits phonologiques semblent donc dès cet âge liés de façon précise aux phonèmes dans les représentations lexicales, d’une manière qui ne diffère pas fondamentalement de celle des adultes. Ils montrent aussi qu’à cet âge une différence d’un seul trait peut affecter l’accès à un mot, ce qui confirme au niveau des représentations lexicales un effet précédemment observé chez des enfants du même âge avec des paires de pseudo-mots trisyllabiques (Graham & House, 1970). En s’intéressant au développement encore plus précoce, à partir d’une analyse de la direction des regards, Swingley, Pinto et Fernald (1999) ont montré que des enfants de 2 ans différencient d’autant plus rapidement deux mots perçus, que la durée des segments qui se recouvrent au début des stimuli est importante. Swingley et Aslin (2000) ont également montré que des enfants de 18 à 23 mois regardent moins un objet cible (parmi deux présentés) si son nom est mal prononcé, à un trait phonologique près, (« where’s the gall ? », plutôt que « where’s the ball ? »), puis répliquent ces résultats avec des enfants de 14-15 mois (Swingley & Aslin, 2002). Les représentations lexicales précoces ne seraient donc pas totalement sous-spécifiées, y compris dans des situations référentielles, à condition que différents paramètres de l’expérience soient adaptés à un ensemble de compétences cognitives des tout-petits. Dans une épreuve d’apprentissage de mots nouveaux où la sensibilité au changement est mesurée avec le paradigme d’habituation, Werker, Fennell, Corcoran et Stager (2002) confirment la sensibilité des enfants de 17 et de 20 mois à une modification impliquant un trait unique, mais ne l’observent pas à 14 mois. Enfin, la quantification des regards posés sur l’objet cible plutôt que sur un objet concurrent lors de l’écoute du nom de la cible confirme que les enfants de 18 à 24 mois sont sensibles à la prononciation incorrecte d’un trait unique dans la consonne initiale du mot (Bailey & Plunkett, 2002). Cet effet a ensuite été confirmé sur la voyelle initiale (Mani& Plunkett, 2007). Ainsi, dès la deuxième année de vie, mais sans doute plus systématiquement vers 18 mois, les enfants s’avèrent sensibles à une erreur de prononciation portant sur un seul trait de l’initiale d’un mot, ce qui témoigne de représentations lexicales détaillées.

A ce jour, trois grandes hypothèses coexistent au sujet de la nature des connaissances phonologiques lexicales chez le jeune enfant et sur ce qui détermine son développement.

Selon l’hypothèse de la familiarité la représentation phonologique d’un mot deviendrait de plus en plus détaillée du point de vue des traits simplement grâce à la répétition des expériences avec ce mot.

Selon l’hypothèse développementale avec étape holistique, c’est l’augmentation du vocabulaire de l’enfant qui imposerait une représentation de plus en plus précise des mots afin de les différencier, dans un voisinage phonologique de plus en plus dense et complexe. D’abord holistique, sans doute organisée autour des syllabes et de la prosodie, la représentation des mots deviendrait ensuite segmentale/phonémique pour éviter les confusions lexicales : les phonèmes, mais aussi les traits distinctifs, ne seraient représentés qu’assez tardivement (Charles-Luce & Luce, 1995 ; Metsala, 1999). Ainsi, le développement de la conscience phonémique, dont on connaît les liens importants avec la réussite de l’apprentissage de la lecture, ne s’expliquerait pas seulement par l’amélioration des capacités méta-cognitives des enfants, mais aussi par des changements dans la nature des unités de représentation phonologique. L’âge de l’enfant et la taille de son vocabulaire seraient les facteurs les plus déterminants pour la capacité à isoler un phonème dans un mot (pour une étude chez des enfants de 4 à 7 ans, voir Metsala, 1999), ou pour la sensibilité à des détériorations de la forme phonologique au niveau des traits.

En prenant en compte à la fois l’âge des enfants, la taille de leur vocabulaire et la familiarité des mots, Bailey et Plunkett (2002) ont voulu confronter ces deux premières hypothèses au sujet de la précision phonologique des mots dans le lexique des jeunes enfants. Ils montrent que, chez des enfants de 18 à 24 mois, la sensibilité au changement d’un trait phonologique est tout aussi forte, quelle que soit la taille du vocabulaire (mots compris, mais pas nécessairement produits), la taille du voisinage lexical du mot testé, ou la récence de l’apprentissage du mot. De même, Swingley et Aslin (2000) ne montrent pas de corrélation entre la sensibilité au changement phonologique et la taille du vocabulaire des enfants de 18-24 mois. Enfin, pour Dollaghan (1994) qui s’est intéressé au vocabulaire des enfants entre 1 et 3 ans, même le lexique le plus précoce contiendrait déjà suffisamment de mots similaires les uns aux autres pour que des stratégies holistiques soient inefficaces pour l’enrichissement du vocabulaire. Coady et Aslin (2003) ont confirmé que le lexique précoce contient un grand nombre de mots pouvant aisément susciter des confusions, et cette densité précoce du voisinage lexical nécessiterait déjà une grande finesse de représentation des unités. Les auteurs de ces recherches n’apportent donc des arguments ni à l’une ni à l’autre des deux hypothèses et concluent à une étonnante précocité de la précision des représentations phonologiques des mots chez les enfants. Ces résultats sont en accord avec une troisième hypothèse : l’hypothèse de la continuité.

Notons toutefois que l’effet de la taille du vocabulaire sur la sensibilité au changement d’un trait phonologique a été observé dans un groupe d’enfants de 17 mois, mais pas à 14 mois ni à 20 mois (Werker et al., 2002). Cet effet transitoire soutient alors l’hypothèse développementale, mais seulement pour une tranche d’âge très courte, au-delà de laquelle (vers 18 mois) la taille du vocabulaire aurait atteint un seuil après lequel l’encodage phonologique serait déjà très détaillé.

Encore aujourd’hui, le débat persiste quant au niveau de détail auquel les premières représentations lexicales des enfants sont structurées (Zamuner, 2009). Il est essentiellement illustré par l’opposition entre deux théories : la théorie LMR (Lexical Restructuring Model), associée à l’hypothèse développementale avec étape holistique, et PRIMIR (Processing Rich Information from Multidimensional Interaction Representations, Werker & Curtin, 2005), qui reprend l’hypothèse de la continuité. Le point commun entre ces théories est de reconnaître que les représentations lexicales se restructurent au cours de l’enfance et évoluent vers des représentations phonémiques. Toutefois, la première décrit le passage de représentations holistiques vers des représentations phonémiques détaillées au niveau des traits, alors que la seconde estime que les représentations précoces sont déjà très détaillées et évoluent vers des représentations phonémiques sans passer par une étape holistique.

D’après LMR, les premières représentations lexicales sont holistiques et ne deviendront plus détaillées que sous l’impulsion d’un vocabulaire de taille suffisante. Cette taille critique se situe pour certains chercheurs entre 50 et 100 mots ; elle est le plus souvent décrite autour de 150-200 mots ; pour d’autres, elle correspond à la taille du vocabulaire d’un enfants de 8 ans (pour une revue, Vogel Sosa & Stoel-Gammon, 2006). Quoi qu’il en soit, selon ce modèle, l’organisation du lexique des jeunes enfants en groupes de voisins lexicaux serait qualitativement différente de celle des adultes : elle ne serait déterminée ni par des détails phonétiques très fins, ni par la position de ces détails car les représentations holistiques ne tiendraient pas compte de ces aspects.

Pour PRIMIR, au contraire, les détails phonétiques sont présents dès les premières représentations de mots. Ce modèle décrit un développement en trois étapes. Avant le développement du lexique, les compétences perceptives de l’enfant lui permettraient d’organiser les sons et de se représenter leur structure (développement d’une première dimension appelée General Perceptual Plane). Des catégories phonétiques spécifiques au langage se mettraient alors déjà en place. Elles seraient cependant très dépendantes du contexte, ce qui ne permet pas encore de les considérer comme vraiment abstraites, au même titre que des contrastes phonologiques. Grâce à la mise en place de cette première dimension, les connaissances de l’enfant pourraient se développer sur un deuxième plan : celui des mots (Word Form Plane). Dans ce lexique naissant, une structure émergerait à travers les regroupements de voisins lexicaux, qui partagent des traits phonétiques. La densité du voisinage permettrait ensuite d’opérer des généralisations phonologiques à partir des mots, ce qui ferait émerger des représentations phonémiques (Phonemic Plane). Comme dans le modèle LMR, les représentations de la forme sonore des mots se restructureraient pendant l’enfance, mais contrairement à LMR, PRIMIR dit que les premières représentations lexicales ne sont pas holistiques et contiennent déjà des détails phonétiques.

Ce modèle prédit aussi que la composition du lexique précoce de l’enfant est en partie déterminée par les caractéristiques des traitements qu’il peut réaliser très tôt sur le plan perceptif. Or, sur ce plan, les résultats de plusieurs recherches soutiennent que les bébés sont plus sensibles aux contrastes phonétiques situés au début des mots. Jusczyck, Goodman et Baumann (1999) ont montré que la sensibilité des enfants de 9 mois à la ressemblance phonétique est plus forte au début qu’à la fin des mots. Zamuner (2009) a aussi observé que des enfants de 10 mois discriminent certains contrastes à condition qu’ils se situent au début des mots, et d’après Swingley (2005), l’encodage du début des mots est plus détaillé que celui de la fin des mots chez des enfants de 11 mois. Puisque le développement sur le plan perceptif déterminerait le développement lexical et la structure du voisinage lexical, le modèle prédit que le voisinage dans le lexique précoce devrait être plus dense en prenant en compte le début des mots plutôt que leur terminaison. La structure du voisinage lexical chez le jeune enfant serait alors de même nature que celle de l’adulte, ce qui est contraire à la prédiction du modèle LMR. Selon PRIMIR, les jeunes enfants acquièreraient plus facilement des mots qui contrastent les uns avec les autres au niveau de l’initiale, car l’information perceptive au début des mots serait plus riche et représentée plus en détail. Dans le vocabulaire adulte, la densité du voisinage suit cette règle, les voisinages les plus denses rassemblant des mots qui riment, en anglais comme en allemand ou en français (Goswami, 2002). L’étude récente de Zamuner (2009) chez des enfants anglophones de 1 an 4 mois à 2 ans 6 mois a confirmé cette prédiction : les voisinages lexicaux les plus denses rassemblent des mots qui riment. Il n’y aurait donc pas de différence qualitative entre l’organisation du lexique précoce et du lexique adulte, ce qui s’oppose à la théorie d’un passage entre des représentations lexicales holistiques vers des représentations plus détaillées au cours de la petite enfance. Le très jeune enfant disposerait déjà de représentations phonétiques, certes très dépendantes du contexte, mais suffisamment détaillées pour permettre le développement de représentations de mots d’une qualité proche de celles des plus grands. Ces résultats soutiennent donc l’hypothèse de la continuité entre les compétences précoces des enfants en perception de la parole et l’acquisition du lexique.

Mais dans quelle mesure les catégories phonétiques précoces sont-elles comparables à des représentations phonologiques abstraites au niveau des traits, telles que chez les adultes ? En quoi diffèrent-elles ?