III.2.2.3. Discussion des résultats théoriques

Au cours de cette dernière étude, les principes de fonctionnement d’un modèle perceptivo-lexical d’identification des mots écrits, le modèle CLIP (Kajii & Osaka, 2000 ; Benboutayab, 2004), ont été adaptés avec succès à la description théorique des contraintes imposées par les caractéristiques du savoir lexical précoce des enfants sur la qualité d’intégration des connaissances verbales ultérieures.

Dans un premier temps, la simulation des profils de réponse enregistrés sur les pseudo-mots, imposée par la nécessité d’estimer la contribution des paramètres visuels à la reconnaissance des stimuli, a permis de déceler la présence d’un biais de réponse sur les décisions lexicales réalisées par les enfants scolarisés en CP et CE1. Les enfants de ce niveau de lecture présentaient en effet une tendance plus élevée à accepter de manière erronée les pseudo-mots dépourvus de voisins orthographiques parmi les mots réels connus en comparaison des enfants plus avancés dans leur maîtrise de la langue écrite.

Concernant les simulations conduites sur les mots, le calcul des probabilités de réponses correctes en référence à une situation optimale - où l’organisation structurale de la langue serait représentée de manière exhaustive à travers l’ensemble des mots précoces - a abouti à une surestimation des performances observées auprès des élèves du Cycle 3. Cette surestimation tendait par ailleurs à s’amplifier dans les simulations réalisées pour les mots tardifs. Au contraire, le calcul des mêmes probabilités basé sur une estimation plus réaliste des mots constitutifs du lexique précoce des enfants - reposant sur la prise en compte de la trajectoire de fréquence de ces mots (Zevin et Seidenberg, 2004) et de l’étendue probable du vocabulaire d’un élève en fin de CP (Lété, 2004) - permettait d’approcher les données empiriques avec davantage d’exactitude. L’utilisation d’une estimation fiable du stock lexical des lecteurs débutants avait pour principale conséquence d’augmenter la probabilité pour que les mots inclus dans les listes expérimentales n’activent aucun voisin orthographique parmi les mots acquis précocement, limitant la contribution des inférences lexicales (correctes ou incorrectes) à l’acceptation correcte d’un mot. L’amplitude des effets d’AdA_ortho qui se manifestaient alors sur les courbes théoriques calculées présentait en outre une remarquable similitude avec la taille des effets enregistrés sur les performances des enfants.

Prenant la suite des résultats empiriques collectés jusqu’alors, les modélisations réalisées au moyen du modèle CLIP sont donc venues appuyer les critiques adressées au postulat de Zevin et Seidenberg (2002), favorable à une élimination des effets d’AdA_ortho du traitement des systèmes écrits alphabétiques. La mise en évidence d’un impact systématique de l’AdA_ortho sur la reconnaissance des mots écrits nous avait en effet précédemment incité à proposer que, contrairement aux modèles connexionnistes, les lecteurs débutants se trouvaient dans l’incapacité d’exploiter un échantillon de formes orthographiques suffisamment large et diversifié pour que les mots rencontrés tardivement puissent tirer un bénéfice maximum des premières connaissances acquises au moment de leur assimilation. La réduction de l’influence de l’AdA_ortho sur les performances des enfants intellectuellement précoces, possiblement dotés de capacités supérieures d’adaptation au traitement des informations de l’environnement écrit, a fourni les premiers éléments en faveur de cette hypothèse. L’hétérogénéité de la population considérée limitait toutefois la portée de ces interprétations. Notre approche théorique du phénomène a permis de mettre en évidence de manière plus robuste que la proportion de mots de structure incompatible avec les propriétés des mots précoces tendait effectivement à augmenter avec l’AdA_ortho, en accord avec nos prévisions. De fait, tandis que 18% des CLIPs partiels dérivés des mots acquis en CE1 (Liste 2) n’activaient aucun voisin parmi les mots inclus dans notre base d’items acquis précocement, 26% des CLIPs dérivés de mots rencontrés en CM1 (Liste 4) se trouvaient dans cette même situation.

Les graphiques de la Figure 54 proposent une description plus détaillée de la répartition des mots intégrés dans les Listes 1, 2 et 4 suivant l’organisation de leurs structures infra-lexicales, décrites dans la base de données Lexique (New et al., 2001). Les barres bleues concernent les 51 mots de structure compatible avec les mots de notre base d’items précoces (i.e. « mots compatibles », par la suite), autrement dit les mots dont plus de la moitié des CLIPs partiels activaient un voisin précoce. Les barres violettes concernent les 39 mots de structure incompatible avec les éléments de notre base d’items précoces (i.e. « mots incompatibles », par la suite), dont moins de la moitié des CLIPs partiels activaient un voisin précoce. Les graphiques du haut présentent la distribution des deux ensembles de mots basée sur les différences de structures orthographiques (i.e. enchaînement des consonnes et des voyelles dans les mots écrits). Les graphiques du bas présentent les données correspondantes concernant les différences de structures phonologiques (i.e. enchaînement des phonèmes vocaliques et consonantiques à l’oral). La lecture des corrélations entre les ensembles de données est facilitée par les graphiques en nuage de points présentés dans la partie droite de la Figure 50.

Figure 54. Les histogrammes de gauche présentent la répartition des mots compatibles et incompatibles avec les propriétés du savoir lexical précoce des enfants suivant les caractéristiques de leur structure orthographique (graphique du haut) et phonologique (graphique du bas) sous-jacente.

Les légendes en rouge pointent les principales différences opposant dans les deux distributions dans chaque contexte. Les mêmes données ont été reportées dans les graphiques de droite de manière à faciliter la lecture des corrélations entre les distributions. Ces graphiques expriment la répartition des mots incompatibles suivant les différentes structures répertoriées en fonction de la répartition observée pour les mots compatibles sur ces mêmes structures. Le nuage de point du haut concerne les structures orthographiques, celui du bas les structures phonologiques.

De nets contrastes se dessinent entre les deux distributions. Les graphiques révèlent en particulier que les mots compatibles - contrairement aux mots incompatibles - sont clairement organisés autour d’une structure dominante tant sur le plan orthographique que phonologique. Sur l’axe orthographique, la séquence CVCCV concerne ainsi 43% des mots compatibles, et, sur l’axe phonologique, 45% de ces mots respectent la séquence CVC.

Les structures dominantes repérées au sujet des mots compatibles sont en revanche largement moins présentes parmi les mots incompatibles : la séquence CVCCV ne concerne que 23% des formes orthographiques de ces mots et la séquence CVC ne décrit pas plus de 10% de leurs formes phonologiques correspondantes. Inversement, les séquences orthographiques CVCVC et CVVCC, qui comptent parmi les mieux représentées au sein des mots incompatibles (i.e. : 26% et 28% respectivement), ne sont que faiblement représentées au sein des mots compatibles.