1. Introduction 

L’approche adoptée dans ce travail est résolument empiriste. Si nos analyses trouvent le plus souvent leur fondement dans des travaux antérieurs, nous avons aussi passé de longues heures à visionner les enregistrements et annoter les transcriptions sans avoir établi de catégorisations préalables. L’objet de ce chapitre est donc d’abord de bien situer ce moment primordial que constitue la découverte et l’analyse préliminaire des suivis longitudinaux, sur lesquels reposent la plupart des analyses que nous présentons ensuite, et de définir par là-même leur statut : qu’est-ce qu’un corpus en acquisition du langage, et que peut-on raisonnablement en attendre ? Nous nous attacherons en particulier à souligner la spécificité de chaque corpus (en fonction des modalités et des objectifs de la collecte, notamment), mais aussi et surtout de chaque enfant.

Nous présentons ensuite les outils d’analyse auxquels nous avons eu recours : annotation des transcriptions, analyses semi-automatiques et codage qui tous deux imposent des ré-analyses (c’est-à-dire un retour aux données) et une réflexion sur le choix des catégories.