2.2.2. Le corpus de Paris(Morgenstern & Parisse, 2007).

Ces données mises en ligne récemment sur le site de CHILDES ont été collectées dans le cadre des projets ANR « Léonard » (nom du premier enfant suivi par Aliyah Morgenstern, porteuse du projet, dans le cadre de sa thèse, et dont les enregistrements sont désormais disponibles au format CHAT) puis « CoLaJe » (communication langagière chez le jeune enfant) auxquels nous avons participé. Les travaux du groupe ont consisté à enrichir au maximum les transcriptions (Rossi & Morgenstern, 2008), en tenant toujours compte du point de vue du chercheur qui avait suivi l’enfant et le connaissait personnellement. Ce chercheur référent était également consulté lorsqu’il ne participait pas directement aux analyses pratiquées par les autres chercheurs du projet. Le projet initial, qui a conduit l’équipe à travailler sur différents aspects du développement grammatical, s’est enrichi peu à peu pour conduire à une prise en compte de la multimodalité : le pointage a ainsi été étudié en lien avec la prosodie des premières productions vocales et l’orientation du regard (Leroy, Mathiot & Morgenstern, 2009 ; Dodane & Martel, 2009).

Au début du projet « Léonard », j’ai moi-même réalisé le suivi longitudinal d’une petite fille bilingue, Clara, que j’ai filmée tous les mois au domicile de ses parents (de 9 mois à 3 ans). Si les données n’ont finalement pas été transcrites dans leur intégralité, et n’ont été exploitées que dans une étude sur le développement de la négation (Rossi & Shimanek, 2007), cette expérience m’a beaucoup appris. J’ai compris que la connaissance que l’on avait du développement d’un enfant lorsqu’on le suivait personnellement différait qualitativement de celle qu’on pouvait acquérir par de nombreux visionnages de données collectées par d’autres chercheurs. J’ai pu constater aussi que la transcription était un travail difficile, qui impliquait toujours une grande part d’interprétation (Ochs, 1979). Morgenstern et Parisse l’ont bien expliqué : « Or se confronter directement au langage d’un enfant grâce à l’observation ou à l’expérimentation est absolument primordial pour tous ceux qui étudient l’acquisition du langage. Travailler uniquement sur des enfants virtuels peut amener à oublier le caractère très interprétatif des phénomènes langagiers et les limites de tout type de transcription » (Morgenstern & Parisse, 2007). Une grande partie du travail de l’équipe a consisté à faire des transcriptions une ressource toujours plus fiable et plus riche.

Si j’ai néanmoins choisi de faire des données de Lyon et de Providence le socle empirique de cette étude, c’est en raison de leur grande comparabilité. De plus, les chercheurs du laboratoire Dynamique du Langage à Lyon, qui ont réalisé la collecte et suivi la réalisation des transcriptions, et K.Demuth, responsable de la collecte et des transcriptions aux États Unis, m’ont aidée à faire des choix raisonnés et m’ont fait partager leur connaissance approfondie des données. J’ai toutefois gardé bien présentes à l’esprit les réserves mentionnées ci-dessus. J’ai notamment modifié les transcriptions en vue de ne garder sur la ligne orthographique que des informations qui ne relevaient pas d’une interprétation subjective, et réanalysé systématiquement les résultats obtenus à l’aide des programmes de CLAN (cf. infra). Je me suis aussi nourrie des observations réalisées dans le cadre des projets Léonard puis CoLaJe, que je mentionne à plusieurs reprises dans le chapitre suivant.