4.1.3.2 les Analyses Statistiques Multidimensionnelles

L’importance des données auxquelles nous aurons affaire ici, non du seul point de vue du corpus de spécimen, encore peu étendu – 17 individus –, mais de celui des descripteurs – variables continues et variables nominales décomposées en plusieurs modalités chacune – nous amènera à avoir recours à ce que l’on appelle les analyses statistiques multidimensionnelles. Et c’est bien parce que « le statut de méthode scientifique [des analyses typologiques] de création d’information à partir de manipulation d’un objet statistique est difficilement contestable » (ibid., s/n), que nous devons en dire ici quelques mots.

L’étude de masses complexes d’informations ne peut être menée que par des méthodes d’analyse de données susceptibles d’en expliciter les lois d’organisation interne par confrontation réciproque, révélant une richesse infinie par rapport à un examen séparé. Dans cette perspective, les méthodes de la statistique descriptive, ne traitant qu’une ou deux variables à la fois, s’avèrent particulièrement limitées. Il faut donc avoir recours aux méthodes dites multidimensionnelles, dont l’avantage principal réside dans l’objectif de synthèse qui est le leur, à travers des outils de représentations particulièrement performants qui extraient, à partir de masses importantes de données qu’on ne peut appréhender directement, « les tendances les plus marquantes, les hiérarchisent et éliminent les effets marginaux ou ponctuels qui perturbent la perception globale des faits » (Escoffier B. et Pagès J., 1998, p. 1). Au sein de ces méthodes, les analyses factorielles occupent une place privilégiée – parfois appuyées par des méthodes de classification – du fait des représentations géométriques des données qu’elles autorisent. Leur principe repose en effet sur la transformation des proximités statistiques des éléments étudiés en distances euclidiennes.

Ainsi, bien que différentes dans leur procédure mathématique en fonction de la nature des données, les analyses factorielles que nous allons utiliser reposent sur un principe « unique : deux nuages de points, représentant respectivement les lignes et les colonnes du tableau étudié, sont construits et représentés sur des graphiques. Les représentations des lignes et des colonnes sont fortement liées entre elles » (ibid., p. 2). Nous présenterons succinctement, au fur et à mesure de leur utilisation et de l’exploitation des résultats, chacune des méthodes auxquelles nous ferons appel ; mais précisons ici d’emblée que le lecteur rencontrera en effet ce même principe : à partir de données distribuées dans un tableau rectangulaire faisant correspondre à n individus, k variables, l’analyse factorielle vise à donner une représentation spatiale des individus en fonction de leurs distances interindividuelles, calculées à partir des variables qui les caractérisent, mais aussi une représentation spatiale – souvent simultanée – des variables dont la corrélation est évaluée en fonction des individus qu’elles déterminent. Ainsi, deux individus spatialement proches le seront du fait d’une communauté ou d’une proximité importante entre les variables qui les caractérisent. De même, deux variables seront d’autant plus proches qu’elles détermineront conjointement un nombre élevé d’individus.

A partir de ces méthodes d’analyse, un travail d’interprétation des propriétés sous-jacentes aux représentations graphiques obtenues doit s’engager... une exégèse en quelque sorte, ressortissant presque d’une mise au jour des phénomènes latents structurant le corpus. Partons alors, dès à présent , à la découverte de cette partie de notre travail.