2. Transana ; « logiciel de transcription et de traitement qualitatif des données audio/vidéo »

Avant de rentrer plus dans le détail de l’analyse, nous ferons dans ce paragraphe une présentation du logiciel sur lequel se basera la suite de notre travail.

Transana est un outil de transcription et d’analyse qualitative des données audio / vidéo : Transana ( www.transana.org ), créé à l’origine par Chris Fassnacht au Wisconsin Center for Education Research à Madison (WCER) est actuellement développé par David Woods. Il supporte plusieurs formats vidéo (mov, mpeg1, mpeg2, wmv, avi…) et audio (wav, mp3, wma…). Il est disponible sous système d’exploitation Windows et Mac. Il existe en deux versions : la version « Single User », pour un seul utilisateur et « Multi User », une version dont la base de données est partageable avec plusieurs utilisateurs. Nous utiliserons dans notre travail la version Single User.

Dans ce qui suit, nous détaillerons certains éléments clés pour l’utilisation du logiciel. Notre but n’est pas de décrire comment l’utiliser mais de présenter une vue d’ensemble afin de pouvoir justifier son utilisation dans notre travail par la suite.

Il est important de noter que notre travail sur Transana part du fait que nous considérons Transana comme un outil de gestion et de traitement de bases de données28. A notre avis, à partir de Transana, il est possible de créer une véritable base de données multimodale pouvant être utilisée et exploitée par d’autres chercheurs que nous, ainsi que pour autres objets de recherche. La compréhension de la structure de Transana est indispensable pour l’application de notre point de vue théorique sur la base de données. La façon dont nous avons utilisé Transana n’est pas la seule, c’est un outil dont la manipulation est très flexible ; c'est-à-dire permettant d’être utilisé de plusieurs façon différentes et pour plusieurs but variés. Cependant la méthodologie que nous avons conçue à partir de ce logiciel représente un premier élément de réponse sur la question de pérennité et d’indexation des données Audio /Vidéo dans le domaine des sciences de l’éducation.

Figure 1 Impression d’écran de l’interface de Transana (c’est nous qui avons ajouté les numéros et la flèche).

Transana est un logiciel « d’alignement » multimodal mettant en relation les données vidéo et leurs « transcriptions ». Son interface permet de créer un lien direct entre l’audition / visualisation du signal et les notations.

En effet, sur l’écran (figure 1) apparaissent quatre fenêtres principales en interaction :

  1. Fenêtre des bandes audio/vidéo permettant de parcourir les enregistrements.
  2. Fenêtre de visualisation contenant dans une première moitié la bande sonore permettant d’observer les variations sonores dans l’environnement étudié et dans l’autre moitié la suite du codage des données. Cette fenêtre ne sera pas exploitée dans notre travail.
  3. Fenêtre de transcription et ses différents outils. Dans notre cas le mot transcription a deux sens différents :

La fenêtre de visualisation, la transcription et la bande vidéo sont mises en relation en insérant des repères temporels (« time codes ») dans la fenêtre de transcription. Ces repères sont créés par l’utilisateur au fur et à mesure de la transcription ou après la transcription. Ainsi chaque passage de la transcription est indexé et synchronisé avec le passage correspondant de la bande Audio/vidéo et la visualisation de la bande vidéo sera plus simple à parcourir. La place des indices temporels lors des transcriptions est codée suivant l’objet de recherche ; dans notre cas chaque indice temporel marquera une unité discursive ; nous revenons sur la définition de ces unités dans la suite du texte.

Le passage par cette étape de synchronisation des « transcriptions » avec des bandes vidéo est indispensable pour la création de la base de données.

  1. La fenêtre « data » ; Elle est divisée en quatre parties (figure 2, ci-dessous) : partie « séries », « collections », « Mots clés » et « Recherche ».
Figure 2 Impression d’écran de la fenêtre « base de données » montrant les trois structures arborescentes (la série contenant l’ensemble des bandes vidéo relié à leurs transcriptions, la collection contenant les clips créés à partir des transcriptions indexées, les mots clés contenant plusieurs grilles de nature differentes) ainsi que la fonction recherche
  1. La première permet d’appliquer une grille d’analyse prédéfinie. Nous pouvons également constituer la grille au moment des observations ; les mots clés seront implémentés au fur et à mesure de l’analyse.
  2. La deuxième fonction est une fonction d’indexation permettant de créer des index pour les clips afin de faciliter des opérations booléennes sur eux. Ces mots clés peuvent être attribués aux clips ou aux bandes vidéo. Exemple : lors de notre opération de codage, nous avons défini un groupe de mot clés « Classe » ; dans ce groupe, nous avons créé deux mots clés : « classe A » et « classe B ». Nous attribuons « classe A » à l’ensemble des clips créés pour la classe A et nous faisons la même opération pour les clips de la classe B. Ceci nous permettra de restreindre la recherche dans le cas où nous allons travailler sur chaque classe à part. Nous appelons cette opération « la phase de codage des données». L’étape de codage est indispensable dans l’utilisation de Transana et de la construction de la base de données ; elle présente un passage obligatoire dans l’étape d’élaboration des résultats qualitatifs et quantitatifs.

Tout changement dans une transcription d’une bande (vidéo ou audio) ou dans les mots-clés d’un clip peut être propagé à l’ensemble des transcriptions et mots-clés des clips identiques à ce clip. Cela peut être fait à partir de la fonction « propagate changes » présente dans la fenêtre des clips et dans la fenêtre des transcriptions.

Figure 3 cette fenêtre est consacrée aux requêtes. A partir d’une opération booléenne sur les mots clés, nous pourrons effectuer les opérations d’union, d’intersection et de soustraction.
Figure 3 cette fenêtre est consacrée aux requêtes. A partir d’une opération booléenne sur les mots clés, nous pourrons effectuer les opérations d’union, d’intersection et de soustraction.

Ce logiciel présente plusieurs autres fonctionnalités graphiques, statistiques, textuelles pour le traitement de données… Nous ne rentrons pas dans leur détail. Seules les fonctions utilisées dans notre travail seront détaillées dans la suite de la partie traitement des données.

Le choix de ce logiciel est donc bien adapté dans notre travail. En effet, ce logiciel par son interface multimodale permettant de mettre en lien les trois fenêtres nous a permis d’avoir accès simple à la vidéo à la « transcription » et à la bande sonore, ce qui facilite l’utilisation des données et la visualisation d’un très grand nombre de bandes vidéo d’une façon très rapide. Cette facilité de reprendre un même clip ou un ensemble de clips nous a permis de mieux comprendre l’action des différents acteurs dans la situation notamment celle de l’enseignante.

A partir de maintenant, nous n’allons plus parler de quatre fenêtres mais de trois car la fenêtre de « visualisation sonore » ou le « sonogramme » n’a pas été utilisé dans notre travail.

Compte tenu des caractéristiques que nous venons de voir, nous pouvons rajouter à nos questions de recherche une question d’ordre méthodologique :

Que nous amènera l’utilisation d’un tel logiciel dans l’étude l’aspect chronogénétique des décisions ? Quelles sont ses avantages et ses limites ?

Notes
28.

Une base de données, usuellement abrégée en BD ou BDD, est un ensemble structuré et organisé permettant le stockage de grandes quantités d'informations afin d'en faciliter l'exploitation (ajout, mise à jour, recherche de données).Une base de données se traduit physiquement par un ensemble de fichiers présent sur une mémoire de masse (bien souvent un disque).

29.

Nous détaillerons les critères de ce découpage dans la suite