II.2.4. Discussion

Cette seconde étude avait pour objectif d’évaluer le postulat d’une élimination de l’influence de l’AdA sur la réalisation de tâches mobilisant les conversions de graphèmes à phonèmes une fois atteint un niveau satisfaisant d’expertise en lecture. Le comportement du modèle de Zevin et Seidenberg (2002) laissait en effet envisager qu’un avantage des premiers mots acquis puisse être observé chez les lecteurs débutants, causé par les rencontres répétées avec ces items dans l’intervalle encore court qui sépare ces enfants de leur entrée dans l’apprentissage de la lecture. Les mots tardifs bénéficiant des connaissances construites sur la base des premiers items rencontrés lors de leur apprentissage, cet avantage serait toutefois appelé à disparaître après un certain nombre d’années de familiarisation avec la langue écrite.

Les résultats obtenus à l’issue de la présente expérience confirment partiellement cette hypothèse en mettant en évidence que les élèves CM1, CM2 et 6ème reconnaissaient effectivement plus rapidement les mots appris dans les premières années de leur scolarité lorsque ceux-ci étaient présentés parmi des distracteurs visuellement et/ou phonologiquement proches de mots réels. Ces nouvelles données, qui concernent plus particulièrement le traitement de l’écrit, viennent compléter les résultats auparavant établis par les quelques études menées auprès d’enfants dans le cadre de la problématique de l’AdA. Brysbaert (1996) a ainsi rapporté que les latences de dénomination d’objets des enfants de 8-9 ans sont affectées par l’AdA indépendamment de la fréquence. V. Coltheart et collègues (1988) ont pour leur part démontré que la précision de lecture orale des enfants de 9 ans restait influencée par cette variable dans des conditions où la fréquence et l’imageabilité étaient contrôlées. Finalement, Garlock, Walley et Metsala (2001) ont récemment mis en évidence que les enfants âgés entre 5 ½ et 7 ½ parvenaient à identifier précisément les mots précoces à partir d’une quantité d’information relative au début de leur prononciation plus restreinte que les mots tardifs. L’amplitude des effets d’AdAortho, importante à la fin du CM1, tendait en outre à diminuer entre cette classe et la fin du CM2 pour se stabiliser ensuite en 6ème. L’influence de l’AdAortho se faisait encore plus discrète dans les niveaux scolaires suivants : non significative en 4ème, elle affectait uniquement la précision des décisions lexicales en 2nd, par ailleurs proches d’un effet de plafond.

Néanmoins, il ressort de nos travaux deux importants résultats qui contredisent le versant du postulat de Zevin et Seidenberg (2002) concernant l’élimination des effets d’AdA chez les lecteurs experts, du fait que l’assimilation des items tardifs se trouverait facilitée par le réinvestissement des connaissances construites sur la base des mots précédemment rencontrés. D’abord, l’AdAortho affectait clairement les performances des lecteurs adultes jeunes et plus âgés en décision lexicale, tâche reposant au moins partiellement sur la réactivation des associations de forme orthographique à forme phonologique. Ensuite et surtout, l’amplitude des effets d’AdAortho se retrouvait dans une proportion équivalente à l’issue des cinq premières années d’enseignement élémentaire (CM2 : 7.37 ms/an), à l’âge adulte (6.28 ms/an) et auprès des adultes plus âgés (7.46 ms/an). Ces observations viennent confirmer à plus large échelle les résultats précédemment obtenus par notre équipe dans des conditions similaires et désignés par le terme de résistance à la pratique (Aghababian, 1998, Aghababian et Nazir, 2000 ; Nazir, Decoppet & Aghababian, 2003). Ainsi que l’illustre la Figure 21, le profil de résultat obtenu se trouve également très proche des résultats théoriques établis par Ellis et Lambon-Ralph (2000) à l’issue de leur tentative de simulation du décours naturel de l’acquisition du vocabulaire au moyen de leur réseau connexionniste entraîné sur un mode cumulatif et intercalé.

Figure 21. Le graphique de gauche présente la distribution des performances du réseau connexionniste de Ellis et Lambon-Ralph (2000) sur 4 bases d’exemples introduites plus ou moins tardivement dans l’entraînement du modèle (les exemples les plus précoces sont représentés par les cercles noirs, les exemples les plus tardifs par les losanges noirs).

Le graphique de droite présente les différences de performances observées dans la présente étude sur des mots précoces (Liste 1) et tardifs (Liste 4) auprès de participants de niveau d’expertise en lecture variable. Une diminution progressive des performances est observée dans les deux cas à mesure que les nouveaux items ont été rencontrés tardivement. L’avantage des items précoces sur les items tardifs reste en outre globalement stable sur l’ensemble des périodes considérées, tant sur les données théoriques qu’empiriques.

Se référant à la logique exposée par Morrison et collaborateurs (2001) et discutée en introduction (p.34), la constance dans la magnitude des effets d’AdAortho contredit l’hypothèse de fréquence cumulée qui prévoit que l’AdA connaisse une diminution consécutive à l’avancée en âge des participants. Ghyselinck, Lewis et Brysbaert (2004) insistent néanmoins sur les limites inhérentes à la comparaison des résultats établis sur la base des études transversales (i.e. études se concentrant sur un moment déterminé et impliquant plusieurs groupes de participants d'âge différent) comme celle de Morrison et al. ou la nôtre, qui restent potentiellement influencés par les effets de cohorte 18 . Entre autres, les effets d’AdAortho chez les personnes âgées ont ici été observés dans le contexte d’un accroissement global du temps de réaction probablement attribuable à un ralentissement général des fonctions cognitives, que les conditions expérimentales ne permettent pas de spécifier plus avant.

A ce stade de notre recherche, nous ne pouvons donc que présumer de l’insuffisance de l’hypothèse de la fréquence cumulée à expliquer nos résultats. Rappelons toutefois que le modèle mathématique d’accumulation des instances de Lewis (1999ab, Lewis et al., 2001) présenté en introduction établit une relation précise entre le logarithme des temps de réaction et les valeurs logarithmiques de fréquence et de temps de résidence des mots d’après la fonction de puissance exprimée suivant les termes rappelés ci-dessous :

où F représente la fréquence d’occurrence de i, Age l’âge du participant au moment où sa performance est mesurée, AdA l’âge d’acquisition de i et A et K sont des paramètres constants.

En adoptant une perspective simplifiée dans laquelle la distribution de la fréquence resterait constante au cours du temps, on peut raisonnablement penser que l’intégration des paramètres de la présente expérience à l’équation développée par Lewis (1999ab, Lewis et al., 2001) permette d’approcher avec plus de précision les prédictions de l’hypothèse de fréquence cumulée concernant la distribution des temps de réaction sur les mots précoces et tardifs pour les différentes catégories d’âge considérées. Cette simulation des délais de réponse a donc été réalisée en associant aux mots de chaque liste expérimentale un délai de réponse théorique dérivé de leur fréquence d’occurrence et de l’âge supposé de leur intégration au vocabulaire des enfants. Trois mesures de fréquences ont été utilisées pour ce calcul, choisies pour être les mieux adaptées à l’âge des participants concernés. Deux de ces estimations étaient ainsi tirées de la base de données Manulex (Lété, Sprenger-Charolles & Colé, 2004) adressée aux enfants et la troisième était extraite de la base Lexique (New et al., 2001), concernant les adultes. Le temps de résidence des mots a pour sa part été estimé d’après l’âge moyen du groupe de participants pour lequel était réalisée la simulation et les normes d’AdAortho disponibles dans l’échelle de Dubois-Buyse (Reichenbach et Mayer, 1977) utilisée pour la sélection des stimuli. Les constantes A et K ont enfin été ajustées de manière à ce que les données théoriques et empiriques s’expriment dans une échelle comparable et qu’une corrélation satisfaisante soit obtenue entre les valeurs logarithmiques des deux mesures. Le détail des calculs et des analyses de corrélations figure dans l’Annexe 4. Le graphique de la Figure 22 présente les temps de réaction théoriques et empiriques 19 associés à chaque liste de mots présentée aux participants. Deux principaux résultats ressortent de cette analyse. En premier lieu, les données recueillies auprès des enfants et des adolescents (i.e. du CM1 à la 2nd) entretiennent de fortes similitudes avec les performances prédites par le modèle mathématique d’accumulation des instances de Lewis (1999ab). Ce constat est tout particulièrement vrai pour les mots inclus dans les deux premières listes, pour lesquels le modèle prévoit une différence systématique de temps de traitement en faveur des items de la Liste 1. Cette tendance reste d’ailleurs observable chez les adultes jusqu’à un âge avancé. Il paraît donc difficile d’exclure toute contribution de la fréquence cumulée aux profils de résultats présentés dans notre étude. Néanmoins, et ce point est crucial pour la question qui nous préoccupe, l’écart de performance observé entre les mots tardifs et précoces chez les adultes jeunes et plus âgés reste sans commune mesure avec les résultats prédits par le modèle (voir les cercles rouges sur les deux derniers graphiques de la Figure 22). Les résultats théoriques montrent clairement que lorsque les individus avancent en âge, la variation induite par la fréquence cumulée des mots sur les temps de réaction tend à devenir négligeable, ce qui se traduit par une homogénéisation des performances sur les quatre listes expérimentales. Les résultats empiriques prouvent au contraire qu’une partie des stimuli continue à induire un accroissement des temps de réaction chez les participants âgés d’une vingtaine comme d’une soixantaine d’années, en raison vraisemblablement de leur acquisition plus tardive.

Figure 22. Temps de réaction théoriques et observés obtenus pour les différentes listes présentées (L1 à L4) dans les différents groupes d’âge considérés. Les cercles rouges pointent les performances empiriques des adultes jeunes et âgés que le modèle basé sur la fréquence cumulée ne permettait pas de prédire.

Les tests t de comparaisons des moyennes observées et théoriques ont confirmé ces observations en démontrant que les délais de réponse moyens correspondant aux Listes 3 (t=2.761 ; p=.0124) et 4 (t=2.679 ; p=.0143) chez les jeunes adultes et à la Liste 4 (t=2.792 ; p=.0116) chez les adultes plus âgés étaient les seuls à échapper aux prédictions du modèle d’accumulation des instances (voir l’Annexe 4 pour les détails de ces analyses). De manière intéressante, la diminution de la valeur prédictive du modèle par accumulation des instances semblait liée à une perte progressive de la corrélation des valeurs de fréquence et des temps de réaction à mesure que les participants progressaient en âge. Les analyses par régression simple conduites sur les valeurs logarithmiques des temps de réaction et les valeurs de fréquence transformées en log(Fréquence + 1) ont en particulier démontré que si la distribution des latences de réponse des enfants était adéquatement décrite par la fréquence des mots présentés, cette relation tendait discrètement à s’amenuiser avec le temps pour finir par disparaître des performances des adultes âgés (r2=.027 ; p=.1444 et voir l’Annexe 4 pour le détail de ces analyses).

Notre mise en évidence d’un impact de l’AdA (ou du temps de résidence) supérieur aux prévisions de l’hypothèse de la fréquence cumulée conceptualisée par Lewis (1999ab, 2001) s’accorde avec les résultats d’une récente évaluation du même postulat publiée par Ghyselinck et al., (2004). Appuyés sur des régressions multiples conduites sur une variété de tâches, dont quatre décisions lexicales, ces auteurs ont en effet démontré que les coefficients de régression associés au temps de résidence étaient systématiquement plus élevés que ceux associés à la fréquence. Or dans le modèle de Lewis (1999ab, 2001), les valeurs logarithmiques de la fréquence et du temps de résidence prédisent le logarithme du temps de réaction de telle manière que des coefficients de régressions égaux leur soient respectivement associés (voir Ghyselinck et al., 2004). Plus précisément, Ghyselinck et collègues (2004) ont montré que le temps de réaction obtenu dans une tâche de décision lexicale où des non-mots illégaux tenaient lieu de distracteurs pouvait être prédit par l’équation suivante :

Cet exemple veut montrer que la simulation des temps de réaction empiriques obtenus par Ghyselinck et al. (2004) n’était possible qu’à condition de modifier l’équation originale de Lewis en augmentant le poids du paramètre Temps de résidence (représentant l’influence de l’AdA) face au paramètre Fréquence. Les auteurs ont également souligné que l’AdA et la fréquence affectaient les latences de la décision lexicale suivant une amplitude comparable alors même que le domaine de définition des mots de haute et de basse fréquence était considérablement plus étendu que celui des mots précoces et tardifs. Autrement dit, si les mots précoces introduits dans les listes expérimentales étaient au maximum 9 fois plus anciennement connus que les mots tardifs (i.e. potentiellement rencontrés 9 fois plus souvent), les mots possédant une fréquence élevée étaient pour leur part rencontrés 90 fois plus souvent que leurs homologues de basse fréquence. Ces données apportent des indices supplémentaires suggérant que Fréquence et AdA (ou Temps de résidence) ne contribuent pas à l’expression mesurée des effets d’AdA suivant la relation prévue par les principes mathématiques de la fréquence cumulée, ce qui a été considéré par Ghyselinck et collaborateurs (2004) comme un argument décisif à l’encontre de ce postulat.

Notes
18.

Les effets de cohorte désignent la part des variations de performances enregistrées auprès de participants jeunes et plus âgés attribuable aux différences de nature socio-culturelles et éducatives existant entre les groupes comparés plutôt qu’à la seule différence portée par l’âge chronologique.

19.

Les différences substantielles observées entre les présents résultats expérimentaux et les données présentées dans la partie Résultat proviennent du fait qu’il s’agit ici du résultat des analyses par items tandis que les graphique des figures 15 et 19 présentaient les résultats par sujets.