4.3.1 L’Analyse des Correspondances Multiples

4.3.1.1 Nature et objectifs

L’analyse des correspondances multiples (ACM) permet l’étude d’un corpus d’individus ou de spécimens décrits par des variables qualitatives, ou caractères, chacun formant un ensemble fini de modalités permettant de rendre compte de la nature de la variable pour chaque individu.

De même que l’ACP visait, à partir de variables quantitatives, à rendre compte de façon synthétique d’une population d’individus selon une certaine structure, l’ACM répond à l’objectif premier de réaliser une typologie des individus, s’appuyant sur la « notion de ressemblance telle que deux individus sont d’autant plus proches qu’ils possèdent un grand nombre de modalités en commun » (Escoffier B., Pagès J., 1998, p. 76). L’ACM, tout comme l’ACP, a pour principal intérêt de transformer les données statistiques de départ en propriétés géométriques autorisant des représentations graphiques synthétiques, qu’il s’agit d’interpréter.

La particularité de l’ACM est de faire intervenir dans l’analyse 3 familles d’objets statistiques : les individus, les variables et les modalités des variables. On verra que l’ACM, bien que les faisant intervenir de façon moins directe que l’analyse factorielle multiple ne le fait dans ses calculs, permet aussi de repérer une quatrième famille d’objets : les groupes de variables.

L’ACM permet donc de constituer une typologie des individus à partir de leurs ressemblances ou dissemblances. « Un individu est représenté par les modalités qu’il possède. Deux individus se ressemblent s’ils présentent globalement les mêmes modalités [...]. La présence d’une modalité rare éloigne son ou ses possesseurs de tous les autres individus » (ibid., p. 79).

L’ACM permet de dresser un bilan des liaisons entre variables, et plus particulièrement de leurs liaisons par l’intermédiaire de leurs modalités, des variables étant d’autant plus liées que leurs modalités le sont chez un grand nombre d’individus. Concernant les variables, l’ACM est aussi l’occasion de résumer l’ensemble des variables qualitatives initiales en un nombre plus restreint de variables numériques synthétiques, ce qui apparaît suite à l’interprétation des facteurs de l’analyse – de façon analogue à l’ACP, avec ses composantes principales.

L’ACM permet enfin l’étude des modalités en termes de ressemblance, et selon deux points de vue : d’une part deux modalités se ressemblent d’autant plus qu’elles sont co-présentes – ou simultanément absentes – chez un grand nombre d’individus ; d’autre part, « deux modalités se ressemblent d’autant plus qu’elles s’associent beaucoup ou peu avec les mêmes modalités » (ibid., p. 77).

On le voit, l’ACM présente des caractères beaucoup plus complexes mais aussi beaucoup plus riches que l’analyse de liaisons linéaires à laquelle aboutit l’ACP, l’accent se trouvant mis sur les modalités.

Il résulte de cette prédominance dans l’analyse, que de trop nombreuses modalités discrétisant fortement les individus pour chaque variable auraient un pouvoir synthétique trop faible et la typologie qu’elles permettraient de construire s’avérerait très pauvre. A l’inverse, en réduisant excessivement le nombre de modalités, on réunit des individus de plus en plus différents, induisant une perte notable d’information. La phase du codage – construction des variables / modalités et description des individus – apparaît donc particulièrement déterminante pour la qualité de l’analyse et l’intérêt ultérieur des résultats.