5.3. Le logiciel CLAN

Les textes écrits et oraux ont été ensuite transférés dans CLAN, outil de traitement de corpus, selon les conventions CHILDES (Child Language Data Exchange System, http://childes.psy.cmu.edu/ ). Ce logiciel permet trois actions principales : (a) la transformation des données manuscrites en données dactylographiées, (b) le codage, et (c) le dénombrement d’occurrences. CLAN permet la transcription de productions orales puis grâce à certaines adaptations permet le traitement des données écrites. Des codes sont insérés afin de coder des phénomènes typiques tels que les erreurs d’orthographe, les majuscules, les révisions à l’écrit etc. Les fichiers CLAN se composent de deux parties principales : un en-tête (Illustration 5) et le corps de la production (Illustration 6).

Illustration 5 : L’entête et ses fonctions principales

L’en-tête permet de donner à chaque fichier des informations importantes aussi bien sur le sujet, le type de texte, les transcripteurs, etc. La seconde partie du fichier CLAN présente donc le corps du texte, la production de l’individu (Illustration 6).

Illustration 6 : Corps du texte

Dans ce fichier, nous mettons divers codes soit exigés par CLAN soit dont nous avons besoin tels que*SBJ indiquant que la clause qui suit correspond aux dires/écrits du sujet. Les productions des sujets ont été segmentées en clauses (Conventions de transcription des textes écrits en Annexe 13 et 14).72 Ces productions sont ensuite codées sous ce même logiciel qui permet la mise au point d’un fichier de codage automatisant le codage et réduisant ainsi les erreurs (Illustration 7).

Illustration 7 : Une partie du fichier de codage

Nous ajoutons au fichier de transcription CLAN, une ligne nommée %ref, qui contient les informations entrées dans le fichier de codage pour coder les SN (Illustration 8). Les productions ont également été segmentées en UT.73

Illustration 8 : Partie d’un fichier transcrit et codé

Ensuite, CLAN permet de questionner ces lignes de codages ce qui permet de comptabiliser des catégories (Illustration 9).

Illustration 9 : Exemple d’un questionnement

Ainsi, dans cet exemple, nous avons par le bais de la fenêtre de commande CLAN demandé au logiciel de nous donner le nombre d’occurrences de pronoms en position sujet codé sur la ligne %ref. Pour se faire, nous avons recours à la commande freq freq + t%ref + s"$*|pro:suj:*|:$".

Ce Chapitre 5 était alors consacré à la présentation des logiciels – Eye and Pen©, Transcriber et CLAN – utilisés pour collecter, coder et analyser les données. Ces logiciels ont été décrits partiellement puisque nous nous sommes strictement focalisée sur les fonctions des logiciels dont nous nous sommes servie. Le Chapitre 6 qui suit apporte des précisions quant aux choix et positions théoriques concernant le codage des pronoms et des SNL.

Notes
72.

Le choix de segmenter en clause est abordé dans le Chapitre 6.

73.

Le choix de segmenter en UT est expliqué dans le Chapitre 6.