Risques dans l’interprétation de l’AFCM et solutions apportées par la CAH

Les représentations graphiques issues des méthodes factorielles présentent certains inconvénients, dont certains sont interdépendants :

Difficultés d’interprétation

Il est toujours difficile d’interpréter les axes ou plans factoriels au-delà des deux axes principaux.

L’interprétation des données sur trois dimensions est plus délicate pour l’œil humain.

Compression excessive et déformations

Les visualisations sont limitées à deux, ou en général à très peu de dimensions, alors que le nombre d’axes « significatifs » peut être bien supérieur. Cette compression excessive de l’espace peut entraîner des distorsions fâcheuses et des superpositions de points occupant des positions distinctes dans l’espace (les deux axes sont néanmoins ceux qui concentrent le maximum d’informations parmi tous les plans).

Manque de robustesse

Les visualisations peuvent manquer de robustesse. Notamment, un point-profil aberrant peut influencer le premier facteur et, par là, toutes les dimensions suivantes, puisque ces dimensions sont reliées au premier axe, à travers la contrainte d’orthogonalité des axes.

Graphiques factoriels inextricables

Les visualisations peuvent concerner des centaines de points et donner lieu à des graphiques chargés ou illisibles.

Synthèse:

La méthode d’approche est descriptive et non analytique du fait de l’absence de données de base.
Il s’agit d’une exploration.Les méthodes factorielles restent intéressantes et nécessaires, malgré leurs insuffisances : la faculté descriptive des axes, les descriptions sous forme de continuum géométrique restent irremplaçables.
La classification complète l’AFCM

L’avantage de la classification est qu’elle définit des classes, en prenant en compte la dimension réelle du nuage de points ; corrigeant ainsi certaines déformations dues à l’opération de projection de l’AFCM.

La plupart des algorithmes de classification, et particulièrement les algorithmes d’agglomération, sont localement robustes, au sens où les parties basses du dendrogramme produit (nœuds correspondants aux plus petites distances) sont indépendantes des éventuels points marginaux isolés.

Un trop grand nombre de sujets sur un plan rend inutile les regroupements en familles homogènes. L’appel aux capacités de gestion et de calcul de l’ordinateur pour compléter, aider et clarifier la présentation des résultats. Les classes peuvent être utilisées pour aider l’interprétation des plans factoriels en identifiant des zones bien décrites. En effet, il est plus facile de décrire des classes qu’un espace continu, même à deux dimensions. La notion de classe est de plus élémentaire et accessible à l’intuition. Les descriptions de ces classes peuvent être fondées sur d’élémentaires comparaisons de moyennes ou de pourcentages. Les nombreux points sont ainsi remplacés par quelques centres de gravité de classes.

La méthode de la classification n’est toutefois pas idéale et elle ne réussit pas toujours à montrer l’importance de certaines tendances ou facteurs latents continus. Le positionnement des classes sur les axes factoriels s’avère indispensable pour observer l’organisation spatiale des classes. La classification peut mettre en lumière l’existence de groupes d’individus et l’analyse factorielle permettre de découvrir des facteurs latents inattendus. La découverte de tels phénomènes ou dimensions cachées constitue l’objectif final de ces deux familles de méthodes et certainement le plus ambitieux. Leur utilisation en complémentarité est souvent indispensable pour atteindre l’objectif final.