5.2. Le logiciel Transcriber

Les fichiers audio originaux ont été traités en quatre temps. Premièrement, ils ont été normalisés et passés en mono avec le logiciel Praat (Boersma et Weenink, 2009). Deuxièmement, ils ont été traités par le programme StkCVnoFo.tcl pour de faciliter le traitement des pauses. Ce logiciel a été développé par F. Pellegrino (Laboratoire Dynamique Du Langage) et permet le repérage automatique des zones de pauses vides. Troisièmement, les productions orales ont été transcrites grâce au logiciel Transcriber, qui estle seul logiciel, à notre connaissance, à pouvoir s’associer au programme StkCVnoFo.tcl, ce qui nous a permis de traiter les processus en temps réel tels que les pauses (Illustration 3). Les conventions de transcriptions des textes oraux se trouvent en Annexe 13. Quatrièmement, une fois les transcriptions réalisées dans Transcriber, elles ont été exportées dans le logiciel CLAN grâce à un filtre adapté (réalisé par Florence Chenu, Laboratoire Dynamique Du Langage).

Illustration 3 : Fenêtre d’un fichier Transcriber

Le logiciel Transcriber permet de structurer et de transcrire des enregistrements. La première étape est la segmentation de la bande son, la seconde correspond à la transcription orthographique de la parole de chaque locuteur du fichier son. Il s’agit de la transcription proprement dite. L'étape de segmentation vise à structurer les enregistrements, c'est-à-dire à segmenter et à décrire le signal acoustique à différents niveaux jugés pertinents pour le traitement ultérieur (Illustration 11). Il s'agit ici principalement de noter l'identité des locuteurs, de séparer les tours de paroles, de délimiter les séquences de bruits et de paroles. L'enregistrement est découpé en tours de paroles (Illustration 4) délimités par des pauses.

Illustration 4 : Exemple de segmentations et d’identification de tours de parole

La fenêtre principale de Transcriber se décompose en deux parties principales : (a) dans la partie 1, situé en haut de l’écran (Illustration 4), se trouvent les prises de parole des locuteurs où peuvent être placées les transcriptions orthographiques correspondantes. Le symbole # représente une pause de plus de 250 millisecondes ; (b) la partie 2, située en bas de l’écran (Illustration 4), présente une vision acoustique du message et propose également une mise en relation entre la vision acoustique et la transcription. Ainsi dans cette Illustration 4, nous distinguons les sections suivantes : (a) les paroles de l’investigateur (« toire [C] que tu as écrite tout+à+l’+heure [C] ») ; (b) la pause de plus de 250 millisecondes de frj547fnsfbw (#) ; (c) le tour de parole de frj547fnsfbw (« ça parlait d’un concert ») (d) puis une autre pause de 250 millisecondes de frj547fnsfbw (#) et enfin (e) de nouveau une prise parole de frj547fnsfbw (« où : »).