L'ensemble du corpus écrit a été segmenté en propositions ou clauses afin de faciliter le traitement des données. En effet, nous avons d'abord essayé de segmenter le corpus en phrases — la phrase représentant l'unité de mesure de l'écrit — mais le non respect de la ponctuation chez les plus jeunes poussait à un comportement subjectif que nous ne pouvions adopter plus longtemps. Aussi avons-nous opté pour un découpage en clauses. Notons que ce choix présente des avantages non négligeables : d'une part, une clause correspond grosso modo à une idée, ce qui permet de clairement isoler chacune d'entre elles. D'autre part, les analyses qui vont suivre ont été grandement facilitées par ce découpage, nous pensons notamment aux chapitres 6 et 7 qui traitent des relations causales ou, autrement dit, de l'empaquetage syntaxique. En revanche, si les définitions d'une clause semblent claires et facilement utilisables en théorie, leur application à des formes réelles, et d'autant plus à des formes réelles produites par de jeunes enfants, n'est pas chose aisée non plus. La définition nous ayant servi de base est celle de Berman et Slobin (1986 : 7) :
‘"N'importe quelle unité qui contienne un prédicat unifié. Par unifié, nous voulons dire un prédicat qui exprime une seule situation (activité, événement, état). Les prédicats incluent des verbes fléchis et non fléchis ainsi que des prédicats adjectivaux. En général, les clauses ne seront composées que d'un seul élément verbal ; cependant, les infinitifs et les participes qui fonctionnent comme compléments de verbes modaux ou aspectuels sont inclus dans la matrice verbale en tant que clause unique" (Berman et Slobin, 1986 : 7 16 ). ’De cette définition, nous avons principalement retenu qu'une clause doit être composée d'un sujet accompagné d'un seul élément verbal, fléchi ou non fléchi.
Cependant, aux côtés des cas répondant à cette règle générale, gravite toute une série d'exceptions que Gayraud et al. (à paraître) tentent de résoudre. Cette typologie, inspirée des réflexions de Blanche-Benveniste (1990), met en place un ensemble de critères précis, même si certains sont sujets à discussion ou s'il en manque quelques-uns afin que la grille soit exhaustive pour notre propre corpus. En effet, Gayraud et al. (à paraître) travaillent avec des enfants à partir de 9/10 ans et certaines des formes des plus jeunes n'entraient dans aucune des catégories pré-établies. Nous traiterons ces cas particuliers après avoir présenté la règle générale et les exceptions à cette règle comme les ont définies Gayraud et al. (à paraître).
(Notre traduction) : "...any unit that contains a unified predicate. By unified, we mean a predicate that expresses a single situation (activity, event, state). Predicates include finite and nonfinite verbs as well as predicate adjectives. In general, clauses will be comprised of a single verbal element ; however, infinitives and participles which function as complements of modal or aspectual verbs are included with the matrix verb as a single clause" (Berman et Slobin, 1986 : 7).