1.2.2. Le recueil et la constitution du corpus écrit

Les productions écrites, seconde grande composante de notre corpus, sont prélevées en deux temps. Avant le déroulement de la séquence, nous avons recueilli les productions à la composition du premier semestre (février-mars). Le résultat donne 251 copies ainsi réparties : 54 en 6L, 70 en 6C, 77 en 4C et 50 copies en 4ème L. A la fin du déroulement des séquences, nous avons recueilli les productions faites lors de la composition du deuxième semestre. 262 copies sont récupérées dont 54 en 6 L, 75 en 6C, 77 en 4C et 56 en 4L. Au total, 513 copies sont recueillies qui se répartissent ainsi :

Toutes les productions écrites prélevées ne sont pas traitées. Elles sont soumises à un système d’échantillonnage pour la raison évidente que nous ne cherchons pas l’exhaustivité, mais à disposer d’une somme d’informations suffisantes pour décrie le niveau de performance général des élèves de chaque classe par rapport aux sous-compétences narratives. A la différence des enregistrements vidéo, la partie du corpus constituée des copies des élèves est construite à partir d’un échantillonnage aléatoire simple (Quivy et Van Compenhoudt, 1995 ; Amyotte, 1996, Martin, 2005), c’est dire que les productions sont choisies de manière à offrir à chaque auteur la possibilité de faire partie de l’échantillon. Cependant, du moment que nous envisageons le développement cognitif comme une transformation, la modification d’un état premier sous l’effet conjugué de facteurs internes et externes, nous cherchons identifier, à travers les productions écrites des élèves, des indicateurs d’un processus évolutif tendant à la maîtrise des compétences narratives. Aussi, ce sont les productions de la première composition qui nous servent de base de travail pour procéder à l’échantillonnage des copies. La taille de l’échantillon de chaque classe est définie suivant le principe des échantillons exemplaires qui s’établit en fonction du point à partir duquel le chercheur estime avoir atteint la saturation. En clair, la taille de l’échantillon exemplaire est fixée en référence au point au delà duquel le chercheur estime que le cas n’apporte plus rien de nouveau. A ce tire, nous pensons que l’échantillon représentative de chaque peut être fixée ainsi :

Le degré de proximité de la taille des échantillons avec les quantités sur lesquelles ils sont prélevés (environ 20 point en 6L et 4L, autour de 30 points en 6C et 4C) dépend de celle-ci. Nous voulons dire que plus la quantité est faible, plus la taille de l’échantillon s’en approche pour garantir la validité des informations et leur généralisation. Par ailleurs, la possibilité des élèves en 4C de choisir entre deux sujets à la composition du premier semestre nous a contraint à un aménagement qui est à l’origine du chiffre affiché pour cette classe. Pour terminer, nous faisons remarquer qu’une fois la copie d’un élève de la première composition est choisie pour figurer dans l’échantillon, la copie du même élève est choisie parmi les productions du second semestre. Au bout du compte, nous nous retrouvons avec un corpus de productions écrites ainsi composé :