Le corpus de Lyon (Demuth & Tremblay, 2008).

Sept enfants (2 garçons et 5 filles) ont été enregistrés (audio et vidéo) en interaction spontanée avec leurs parents pendant environ une heure tous les quinze jours de l’âge de 12 mois à l'âge de 36 mois. 4 enfants ont été enregistrés jusqu'à l'âge de 48 mois (session mensuelle). Le corpus total compte approximativement trois cent trente heures d'enregistrement. Les enfants ont été enregistrés à leur domicile, en situation naturelle et chaque session dure une heure. Ces sessions regroupent aussi bien des sessions de jeu avec jouets et livres que des interactions avec les parents.

La transcription est réalisée avec le logiciel CLAN. Chaque transcription comprend une transcription orthographique intégrale des productions de la mère et de celles de l’enfant, ainsi qu’une transcription phonétique intégrale des productions des enfants. Les transcriptions sont associées aux vidéos grâce à la présence d’étiquettes (une étiquette par tour de parole).

Les données utilisables à ce jour (parce qu’entièrement transcrites) concernent quatre enfants : Ana, Marie, Nathan et Théotime.

Ces données sont complétées par un questionnaire permettant de décrire l’environnement familial, et surtout par un questionnaire parental permettant d’évaluer le vocabulaire de chaque enfant (version française du CDI, S.Kern 2003). Ces données sont disponibles pour tous les enfants, de 12 à 30 mois.