1.1.4. L’usage de l’analyse thématique dans le traitement des données textuelles.

La technique d’analyse thématique vise à permettre d’identifier, dans un texte, des thématiques qui constitueront un élément pour le traitement des unités d’analyse. Elle s’insère dans la panoplie des méthodes et techniques d’analyse de contenu (Régnier 2006b p.95) . Selon Lemaire (2002), la pratique de l’analyse thématique assistée par ordinateur est déterminée par la définition donnée au thème. La définition de l’analyse thématique diffère celle donnée dans l’analyse littéraire en linguistique. Les tenants de cette pratique assistée par ordinateur s’appuient sur une définition restreinte du terme que nous résumons par la formule lapidaire de Lemaire (2002) : le thème est ce dont parle le texte. Le thème est alors une construction intellectuelle élaborée par le lecteur à partir des éléments textuels récurrents. En tant qu’abstraction, il est possible qu’il ne corresponde pas à une expression précise du texte. Le thème criança (enfant) prédominant dans un texte sans que le mot lui-même ne figure.

Nous pouvons expliciter les trois étapes initiales fortes de l’analyse thématique assistée par ordinateur : sélection, classification et pondération. Ces étapes précèdent et préparent l’étape de l’interprétation qui est du ressort du chercheur et qu’il conduit selon ses orientations méthodologiques choisies. En ce qui nous concerne, les étapes se sont opérées de la façon suivante.

Dans l’étape de sélection, le programme informatique SPAD permet d’identifier les variables textuelles constituées de mots et de phrases. L’ordinateur se justifie comme un instrument d’aide précieux dans sa capacité à pouvoir traiter un grand corpus dans un temps extrêmement court, ce que n’autorise nullement le traitement manuel.

Dans l’étape de classification, nous utilisons l’ordinateur pour organiser les données sous forme de listes, de tableaux ou de graphiques. Ici nous avons utilisé le logiciel SPAD, d’abord pour la création du vocabulaire, pour le listage des formes graphiques par ordre lexicographique et par ordre lexicométrique. Ensuite nous avons sélectionné les 10 formes graphiques-mots les plus fréquentes pour leur appliquer la procédure d’édition du contexte, procédure CORDA de SPAD.

Dans l’étape de pondération, nous avons mis en œuvre des techniques statistiques élémentaires classiques de la description statistique.

Martin (cité par Lemaire, 2002) suggère de constituer une liste hiérarchique qui peut contenir tous les mots de la langue qui permettra à l’ordinateur de déduire la présence du thème à l’intérieur du texte, mais aussi la récurrence des formes concrète. Par exemple nous pouvons reconnaître le thème enfance à partir de : enfant, petit garçon, petite fille, jeu, etc. Par définition le champ thématique est « l’ensemble de l’information lexicologique, la constellation des vocables, qui, selon les études de thématique théorique ou appliquée, et dans les textes, semblent entretenir avec le mot-pôle désignant le thème correspondant, son intitulé, divers types de relations, d’associations » Martin (cité par Lemaire, 2002).

Dans notre travail, les champs thématiques furent identifiés à partir des récurrences de l’évocation des mots des enseignants.