III-2 Notre démarche d’étude et le fonctionnement d’ALCESTE

Le corpus cubain que nous nous proposons d’analyser en utilisant le logiciel ALCESTE, se compose de quatre entretiens réalisés à La Havane les 4, 5, 8 et 9 janvier 2001 avec quatre professionnels de l’Institut Cubain de la Radio et de la Télévision (ICRT) :

Irma Caceres, rédactrice en chef de la télévision cubaine, spécialiste de politique internationale ;
Vicente Gonzales Castro, producteur, spécialiste de l’histoire de la télévision cubaine ;
Susana Sardiñas, directrice des relations internationales de l’ICRT ;
Fabio Fernandez Kessel, directeur du Centre de recherches sociales de l’ICRT.

Il s’agit d’entretiens non directifs, centrés sur l’Europe et ses représentations.

L’ensemble de ces entretiens individuels ont été réalisés en espagnol sur le lieu de travail de nos interlocuteurs, puis traduits en français à Lyon avec l’aide d’un journaliste hispanophone d’Euronews, spécialiste de politique internationale, Javier Villagarcia. Notre corpus se compose de textes traduits - ils résultent à ce titre d’une première interprétation – et d’un discours rapporté, plus précisément d’un discours indirect dans la mesure où l’on a affaire à la version de traducteurs qui, par définition, ne veulent pas reproduire l’énoncé originel mais s’efforcent de restituer à l’identique le contenu pensé de cet énoncé. Des conditions relativement homogènes ont présidé à la constitution du corpus. Eu égard à sa taille, notre échantillon ne peut toutefois prétendre à une quelconque représentativité statistique. Le logiciel ALCESTE va nous permettre de repérer et de hiérarchiser les différents mondes lexicaux de notre corpus à partir d’un classement statistique de ses phrases, effectué en fonction de la distribution des mots, indépendamment du contexte dans lequel s’inscrivent ces discours. Mais les lignes de force qui se dégageront de ce mode de traitement sont susceptibles de constituer un point d’appui pour une démarche interprétative.

Deux types d’information sont fournis par ALCESTE :

d’une part, une illustration graphique de la structure du corpus, et plus précisément de son mode d’organisation en classes qui correspondent à ses différents mondes lexicaux ;
d’autre part, des listes de mots couplées à des listes de chiffres, supposées refléter des relations de proximité ou d’éloignement sur un plan sémantique.

Pour chacune des classes proposées, on s’efforcera de déduire de l’observation des listes de mots et de chiffres, de notre connaissance du contexte et des définitions livrées par le dictionnaire, le dénominateur commun des occurrences classées ; de définir la nature des liens entre les classes ; et de mettre au jour les éléments fédérateurs qui fondent la cohérence de notre corpus.

* Notre objectif : repérer les zones de pertinence sémantique dans le corpus

A partir de la structure du corpus, notre objectif est de rechercher les zones de pertinence ³⁸⁰ telles qu’énoncées par les professionnels de l’ICRT (Institut cubain de la radio et de la télévision) et propres à la ligne rédactionnelle de la télévision cubaine, afin de dessiner l’esquisse d’un ordre de représentation d’un univers : ici les représentations de l’Europe. ALCESTE rend compte d’une distribution de mots dans le corpus dont chaque énoncé est considéré comme porteur de traces sémantiques d’un mode de représentation de l’univers en question, qu’il s’agisse de qualité, d’action ou d’objet. Chaque énoncé est émis par une instance d’énonciation déléguée dans le discours. L’énonciateur est alors détenteur d’une position, d’un point de vue, qu’on cherchera à isoler dans une visée interprétative.

* UCE, occurrences, classes et contextes associés

Le corpus est envisagé comme une succession d’unités de contexte élémentaire (UCE) qui correspondent approximativement à des phrases. Ces UCE sont réparties en classes en fonction des occurrences ³⁸¹ qui les composent. Un contexte sémantique est associé à chacune de ces classes. Le logiciel désigne les classes par des nombres ; ici, sept classes ont été constituées : 1, 2, 3, 4, 5, 6, 7. Les contextes correspondants sont désignés par des lettres : A, B, C, D, E, F, G.

* La CDH, support de la première étape de l’interprétation

Le logiciel propose un mode de classification qui va servir de support à la première étape de l’interprétation : la classification descendante hiérarchique (CDH). A partir de cette arborescence, nous allons tenter de dégager le processus de constitution des classes . Le concepteur d’ALCESTE a prévu que le logiciel effectue deux fois la classification en faisant varier les groupes d’UCE effectivement classées, afin de s’assurer de la pertinence des différentes classes proposées et des relations entre elles. Ces deux classifications donnent lieu à deux représentations de la CDH. Certaines UCE ne peuvent être affectées à une classe particulière. Pour que l’interprétation soit valable, le pourcentage des UCE classées doit être supérieur à 50 %. Ce qui est ici le cas : 180 UCE ont été classées sur un total de 281, soit 64,06 %. Mais Max Reinert, comme nous l’avons déjà souligné, n’attache pas une importance décisive à la rigueur du découpage.

* Khi 2 et clé : l’évaluation du lien entre une forme et son contexte

Un Khi 2 mesure la liaison entre une forme et son contexte. Il exprime un coefficient d’appartenance de la forme au contexte et la prise en considération des Khi 2 permet de mettre en évidence des distinctions d’importance entre les formes d’un même contexte. Les Khi 2 sont parfois remplacés par des indicateurs de clé de 0 à 9 qui désignent chacun un intervalle de valeurs : une clé 4 correspond ainsi à une probabilité de 1 % que la forme soit associée par hasard au contexte. Ce niveau est habituellement considéré comme très significatif. Une clé 9 correspond à une probabilité inférieure de un à 650 milliards que la forme soit associée par hasard au contexte. Ce qui signifie que plus l’indicateur de clé est élevé, plus l’appartenance de la forme au contexte se manifeste avec netteté. Mais la prise en compte des Khi 2 plus faibles et des absences significatives repérables à leurs Khi 2 négatifs est également indispensable pour affiner l’analyse.

* Le taxème, élément générique commun à l’ensemble d’une classe

L’interprétation repose sur un postulat : tout vocabulaire est relatif au contexte dans lequel il est employé ³⁸² . Ainsi, les modes de structuration d’un lexique varient-ils en fonction des registres dans lesquels ils s’exercent. Notre démarche visera à mettre en évidence les taxèmes propres à chacune des classes dégagées par le logiciel, un taxème pouvant se définir comme une classe sémantique minimale. S’attacher à identifier, à partir des différentes classes produites par ALCESTE, le taxème qui leur est associé, permet de faire émerger l’élément générique commun à l’ensemble de la classe, mais aussi de relever les afférences sémantiques qui la complètent et qui s’inscrivent alors de façon originale dans un discours spécifique : ici, l’Europe dans le discours des professionnels de la télévision cubaine.

* Repérage sémique, thématique et focus

Décrire le sens, c’est faire surgir à la fois un mode d’organisation et un mode de pensée, une structure du discours. Le recours au dictionnaire Le Petit Robert fournira les définitions participant au repérage sémique. Dans chaque classe, notre travail interprétatif portera à la fois sur la thématique – de quoi il est question – et sur la façon dont le discours investit cette thématique – qui a parfois été appelée focus – ou, si l’on préfère, sur le mode d’inscription des occurrences dans la thématique de la classe. C’est une pratique d’ALCESTE selon une tradition d’utilisation du logiciel émanant directement de Max Reinert, telle qu’il la préconise lors de ses séminaires.

Notes

380.

La notion de pertinence connaît des emplois très différents en linguistique. Une unité linguistique est dite pertinente si sa présence ou son absence influe notablement sur l’interprétation (Franck Neveu, op. cit., p. 79). Dans le champ de la microsémantique, la pertinence correspond à l’activation d’un sème. On distingue trois sortes de pertinence (linguistique, générique ou situationnelle) selon que l’activation est prescrite par le système de la langue, le genre du texte ou la pratique en cours (François Rastier et alii, op. cit.,p. 223).

381.

Dans le domaine linguistique, la notion d’occurrence relève du discours et s’oppose à la notion de type qui renvoie à la langue. Au niveau lexical, cette opposition permet de distinguer un signifié canonique d’une réalisation contextuelle de ce signifié. Par exemple, les acceptions d’un mot observées en contexte seront autant d’occurrences sémantiques d’une signification type (Franck Neveu, op. cit., p. 74).

382.

François Rastier précise, à propos du sens lexical, que “ sa définition dépend de conditions objectives telles que le contexte (local puis global) et la situation, mais encore de conditions subjectives qui sont celles de l’interprétation : une définition ne décrit pas un être, mais les traits du sens lexical pertinents pour les objectifs de la pratique en cours” (François Rastier et alii, op. cit., p.50). Selon Christiane Chauviré et Jérôme Sackur, Ludwig Wittgenstein avait auparavant avancé l’idée que « la signification d’un mot est donnée par son rôle dans un jeu de langage, donc déterminée par les règles qui gouvernent son emploi ». Tout en précisant que « le mot n’est pas encore un coup joué dans le jeu de langage : c’est la proposition qui est un coup dans le jeu de langage. Certains coups sont possibles, d’autres sont exclus » (Christiane Chauviré, Jérôme Sackur, op.cit., p.35).