II.1.2.2. Matériel.

La liste expérimentale comprenait 200 items, dont 100 mots transcrits par un caractère Kanji unique et leur traduction en Hiragana. Les Kanji sélectionnés se répartissaient en 5 groupes de 20 items chacun, respectivement acquis au cours des première (L1), seconde (L2), troisième (L3), quatrième-cinquième (L4) et sixième (L5) années d’école primaire, conformément à la Liste Educative (Gakunen-haitouhyou) publiée par le Ministère Japonais de l’Education en 1977 et réactualisée en 1981.

Le choix des Kanji cibles a été complexifié par la nature agglutinative du Japonais, favorisant la création de mots par juxtaposition d’éléments morphémiques représentés par des caractères chinois isolés (Halpern, 2001). Pris pour lui-même, chaque caractère Kanji ne véhicule donc généralement qu’une signification approximative, bien qu’une minorité d’entre eux reste associée à un concept défini. La liste Educative ne répertoriant que les Kanji isolés, seuls les items conservant un sens et une prononciation non ambigue en isolation ont été retenus à l’issue d’un tri préalable 8 . Au terme de cette première sélection, les items acquis en quatrième et cinquième année ont été réunis en une liste unique, en raison d’une restriction trop importante du nombre de candidats encore disponibles pour ces deux tranches d’âge. La seconde étape de la sélection a consisté à apparier les mots acquis à différentes étapes du parcours scolaire des enfants sur le plan des variables lexicales influentes, à partir des mesures disponibles dans la base de donnée « Nihongo-no Goitokusei » (Propriétés Lexicales du Japonais, Amano & Kondo, 1999). Cette base, fondée sur les entrées du dictionnaire Shinmeikai Kokugo Jiten (Kindaichi, 1989), est organisée suivant 8 sous-bases décrivant une variété de caractéristiques relatives à plus de 80 000 mots Japonais et aux caractères les composant, et représente certainement l’outil descriptif le plus complet actuellement disponible pour la langue Japonaise.

Les variables considérées pour cet appariement étaient les suivantes : fréquence lexicale, longueur de la forme orale des mots associés (estimée en nombre de morae 9 ), nombre et fréquence d’usage (i.e. validité de lecture) des lectures alternatives, et complexité visuelle des caractères, estimée d’après le nombre de traits entrant dans la composition de chaque idéogramme et selon la densité des points de la police de caractère des Kanji sur une matrice de 32 x 32. Les mesures utilisées sont décrites plus précisément dans l’Annexe 2 . Le détail des valeurs moyennes prises par chacun de ces facteurs dans les 5 listes expérimentales constituées figure dans le Tableau 6. On notera qu’en dépit de nos efforts, l’alignement des tout premiers mots acquis sur ceux des 4 autres listes est resté partiellement insatisfaisant, compte tenu des propriétés particulières de ces items, présentant une fréquence et validité de lecture très élevées.

Tableau 6.
 
Listes
L1 L2 L3 L4 L5
Statistiques (1)
Listes 1 à 5
Statistiques (2)
Listes 2 à 5
Frq 113898.45 58949.70 70836.80 52366.60 44117.90 F(4,95)=4.377;
p=.0027 **
F(3, 76)=.950; p=.4210 ns
Lth 2.10 2.10 2.10 2.10 2.20 F(4,95)=.207;
p=.9342 ns
F(3, 76)=.260;
p=.8538 ns
Alt. 6,60 5,70 5,45 5,65 4.75 F(4,95)=1.064;
p=.3785 ns
F(3, 76)=.550;
p=.6497 ns
Vdt 6.76 6.74 6.70 6.66 6,61 F(4,95)=3.271;
p=.0147 *
F(3,76)=2,239; p=.0906 ns
Cpx1. 6.20 9.45 10.40 11.150 9.95 F(4,95)=8.538;
p<.0001 ***
F(3,76)=1.100;
p=.3544
Cpx2 . 196.55 243.70 269.35 273.15 268.55 F(4,95)=12.757;
p<.0001 ***
F(3,76)=2.217;
p=.0930 ns
Le tableau présente les valeurs moyennes obtenues pour chaque facteur lexical contrôlé (Frq : fréquence lexicale, Lg : longueur, Alt : nombre de prononciations alternatives, Vdt : validité de lecture, Cpx1 : complexité visuelle des caractères exprimée en nombre de traits, Cpx2 : complexité visuelle des caractères selon la densité des points de leur police de caractère sur une matrice de 32 x 32) dans chacune des listes expérimentales constituées. La comparaison des valeurs lexicales associées aux items de chaque liste a été réalisée au moyen de 6 ANCOVAs prenant pour facteur continu chaque variable lexicale contrôlée, dont le résultat est présenté dans les deux dernières colonnes du tableau (Statistiques 1 : analyses réalisées sur la totalité des stimuli et Statistiques 2 : analyses réalisées sur les stimuli inclus dans les liste 2 à 5). Les analyses ont démontré qu’a l’exception des items de la première liste, les mots acquis entre la 2e et la 5e année pouvaient être considérés comme homogènes sur le plan des variables contrôlées.

Notes
8.

Nous tenons à remercier Ken Kihara, Natsumi Kajii et tout particulièrement Sumikazu Nishio qui a pris en charge cette sélection et sans qui ce travail n’aurait pu aboutir.

9.

Les moraes font référence aux unités infra-syllabiques de longueurs variables transcrites par un kana unique.