4.3.2 Code Descriptif du Corpus

4.3.2.1 Le codage en variables qualitatives pour l’ACM

Le codage de données qualitatives mais aussi numériques permet de rendre homogènes ces informations sous la seule forme de variables qualitatives, exploitées par l’ACM. Le paradoxe est bien ici qu’en réduisant l’information – en passant de l’individu à la classe constituée par la modalité – on accroît la richesse des résultats, cela permettant de faire apparaître les traits saillants d’une structure des individus au sein d’un corpus. Cependant, le codage doit répondre à certaines règles pour que cette richesse attendue des résultats soit effective. Nous citerons les deux principales :

  • Le nombre des modalités ou classes ne doit pas être trop élevé – d’autant moins que l’effectif d’individus sera faible – et ce pour une raison majeure : le nombre de facteurs sur lesquels intervient une variable est directement lié au nombre de ses modalités. Ainsi, plus une variable a de modalités, plus il sera nécessaire de considérer un espace de grandes dimensions pour rendre compte de son influence sur le corpus... ce qui ne va pas dans le sens de l’aspect synthétique de l’analyse et de la facilité d’interprétation des graphiques.

  • Le choix des classes doit se faire de façon à ce qu’elles aient un poids assez équilibré : « le principe à respecter dans cette opération est d’obtenir des classes de même effectif plutôt que des intervalles de même amplitude » (ibid., p. 89). En effet, les modalités d’effectif faible ont un effet perturbateur pas toujours pertinent au regard de l’ensemble du corpus, puisque générant des partitions très déséquilibrées au risque d’en effacer d’autres, peut-être moins ’visibles’ numériquement parlant, mais plus intéressantes du point de vue typologique.