2.2.1 Méthodes et principes de l’AFCM et de la CAH

Ces méthodes sont particulièrement adaptées à l’exploration d’enquêtes de questions à choix multiples avec un grand nombre de variables et un grand nombre de sujets.

L’AFCM est une généralisation de l’analyse factorielle des correspondances, et permet de décrire de vastes fichiers de données qualitatives. L’AFCM permet de décrire les relations entre p (p>2), variables qualitatives simultanément observées sur n individus. Cette méthode permet donc d’étudier les éventuelles relations existantes entre les variables et d’en donner une représentation géométrique, c’est-à-dire en interprétant graphiquement les rapprochements et les oppositions entre les caractéristiques des individus représentées sur un plan. L’AFCM et la CAH permettent de dresser des typologies (regroupement d’individus ayant les mêmes caractéristiques). Les affinités entre réponses sont synonymes d’affinités entre sujets.

La contribution d’une modalité à l’inertie totale est inversement proportionnelle à son effectif. Il est donc préférable d’éviter les analyses avec des effectifs réduits qui perturberaient la pertinence des résultats. Dans la mesure du possible, le regroupement des modalités de faible effectif avec d’autres modalités est souhaitable.

Dans la pratique, on se contente souvent d’interpréter le premier plan factoriel (axes 1 et 2).

La contribution des individus et des variables permet l’interprétation des axes. Interpréter un axe consiste à trouver ce qui est similaire, d'une part entre tous les éléments figurant à la droite de l'origine et d'autre part, entre tous les éléments situés à la gauche de l'origine, puis d'exprimer avec concision et précision le contraste entre les deux extrêmes.

L'interprétation des proximités entre les modalités doit également intégrer le pré-requis suivant :

Si deux modalités d'une même variable sont proches, cela signifie que les individus qui ont répondu l’une ou l’autre sont globalement similaires du point de vue des autres variables

Si deux modalités de deux variables distinctes sont proches, cela peut signifier que, ce sont globalement les mêmes individus qui ont répondu l’une et l'autre.

Si deux modalités de deux variables distinctes sont éloignées, ces deux modalités s’excluent l’une l’autre et concernent des individus différents.

Les éléments actifs de l’AFCM sont complétés par des variables supplémentaires(Les éléments actifs sont ceux qui déterminent les axes). Les éléments supplémentaires ne participent pas à l’élaboration des axes mais peuvent être représentés sur les plans factoriels. L’utilisation des éléments supplémentaires en analyse des correspondances multiples permet de prendre en compte toute l’information susceptible d’aider à comprendre ou à interpréter l’organisation induite par les éléments actifs. Ceci est particulièrement intéressant lorsque l’ensemble des variables se décompose en thèmes, c'est-à-dire en groupes de variables homogènes de contenu. Le choix des variables supplémentaires dépend des hypothèses initiales.

L’interprétation d’un lien entre un axe factoriel et une variable supplémentaire repose sur la significativité de la liaison évaluée par la formule :

Elle mesure sous forme d’écarts-types la distance entre la modalité j et l’origine de l’axe factoriel α. On appelle cette quantité « valeur-test ». D’après le théorème central limite, sa distribution tend vers une loi normale centrée réduite. Ainsi, la position d’une modalité est intéressante dans une direction α donnée si le sous-nuage qu’elle constitue occupe une zone étroite dans cette direction et si cette zone est éloignée du centre de gravité du nuage. La valeur-test est un critère discriminant qui permet d’apprécier rapidement si une modalité a une position significative sur un axe. On considère généralement comme occupant une « position significative » les modalités dont les valeurs-test sont supérieures à 2 en valeur absolue, (seuil approximatif de 5%).

La CAH est complémentaire à l’analyse des correspondances, c’est la deuxième étape de l’analyse des données. Le dépassement du cadre exploratoire en constitue l’objectif même. Le but étant de préciser une typologie ou segmentation d’une partition ou répartition d’individus en classes, ou catégories. La classification repose sur le sujet alors que l’AFCM repose sur des groupes d’individus.