III.1.2.MULTEXT

Les corpora Français et Anglais ont été extraits du corpus multilingue MULTEXT développé pour l'étude de la prosodie (Campione et Veronis, 1998). Des histoires ont été lues par
20 lecteurs différents (5 hommes et 5 femmes par langue) pour un total de 8236 mots pour l'Anglais, et 6945 mots pour le Français.

Les catégories syntaxiques des mots présents dans le corpus ont été déterminées à l’aide des logiciels more et post (pour la désambiguïsation) de la boîte à outils CLAN utilisée dans les spécifications CHILDES ( www.childes.com  ).