III.2.3.1.2. Méthode et Résultats

III.2.3.1.2.1. Estimation du savoir lexical des jeunes lecteurs.

Cette première étape vise à sélectionner un ensemble de mots représentant de manière réaliste le savoir lexical précoce des enfants, en référence auquel le modèle CLIP est tenu de conduire sa recherche de voisins, consécutivement à la survenue d’un CLIP partiel.

Il est évident que l’échelle Dubois-Buyse (Reichenbach et Mayer, 1977), qui préconise l’apprentissage de quelques 56 mots en CP et de 230 mots supplémentaires en CE1, n’offre pas un aperçu réaliste de l’étendue du vocabulaire précoce des enfants. Une stratégie de sélection des items précoces alternative a cependant été proposée par Zevin et Seidenberg dans un article récent (2004), fondée sur la fréquence d’occurrence des mots en différentes périodes de l’apprentissage de la lecture. Constatant que les variables lexicales telles l’imageabilité, la concrétude, la familiarité, la fréquence cumulée et la longueur expliquaient près de 70% de la variance des valeurs d’AdA attribuées à 328 mots par 40 jeunes adultes, ces auteurs ont en effet conclu au caractère irréaliste des tentatives d’exploration de l’AdA en isolation de ses facteurs associés. Du point de vue de Zevin et Seidenberg (2004), l’AdA ne saurait en effet être décorrélé des variables lexicales reconnues comme déterminantes pour l’assimilation plus ou moins précoces des mots dans le décours de l’apprentissage. En particulier, l’assimilation première de certaines représentations orthographiques semble dépendre directement de la multiplication des rencontres avec les mots concernés au cours d’une période déterminée de l’acquisition de la lecture. Zevin et Seidenberg (2004) concluent donc que la trajectoire de fréquence, qui définit précisément l’évolution de la fréquence d’occurrence des mots à travers la progression des apprentissages, constitue la mesure la plus adaptée à l’appréhension les effets d’AdA. Les mots présentant une trajectoire de fréquence « élevée à basse » sont ainsi rencontré plus fréquemment dans les premières étapes de l’assimilation du système écrit de la langue que dans les phases ultérieures, optimisant leur probabilité d’intégration précoce. En contrepartie, les mots présentant une trajectoire de fréquence « basse à élevée » sont rarement présents dans les textes destinées aux lecteurs débutants mais rencontrés plus fréquemment par les lecteurs plus avancés, ce qui diffère vraisemblablement leur acquisition (voir également Bonin et al., 2004 pour une discussion sur ce point).

L’utilisation de la trajectoire de fréquence pour la construction de la notre base de connaissances précoces est rendue possible par les normes disponibles dans la base de données Manulex (Lété et al., 2004). Chaque item répertorié dans cette base se voit en effet assigner trois mesures distinctes, correspondant respectivement à sa fréquence d’occurrence dans les manuels scolaires destinées aux élèves de CP, de CE1 et du Cycle 3. Tirant parti de ces estimations, les items constituant le vocabulaire précoce des enfants ont donc été choisis de manière à ce que leur fréquence d’occurrence soit trois fois plus importante dans les manuels scolaires destinés aux classes de CP et CE1 que dans les ouvrages s’adressant aux élèves du Cycle 3 (i.e. trajectoire de fréquence « élevée à basse », en application des critères de Zevin et Seidenberg, 2004). Enfin, deux mille mots ont été retenu parmi les candidats sélectionnés, de manière à représenter de manière réaliste la quantité de mots normalement assimilée par un enfant en fin de CP, d’après les estimations de Lété (2004).