4.2.2.1 La méthode de l’Analyse en Composantes Principales

Le traitement de données numériques correspondant à un ensemble de variables quantitatives mesurant un phénomène quelconque, ou en tout cas non directement explicitable – comme c’est le cas ici – s’effectue généralement par une analyse en composantes principales (que nous appelerons ACP).

Suivant la dénomination adoptée par J. De Lagarde (1998, p. 101), nous désignerons ces variables continues par le terme de critère – quantitatif –, réservant celui de caractère – qualitatif – aux variables de nature nominale présentant un nombre fini de modalités.

Objet et objectif de l’ACP : Une ACP a pour objet l’étude de données croisant des individus et les critères déterminant ces derniers, données réunies dans un tableau à deux dimensions. L’objectif exploratoire de l’ACP est double : elle vise d’une part à évaluer la ressemblance des individus entre eux à partir des critères qui les caractérisent. Deux individus sont d’autant plus proches qu’ils possèdent des valeurs proches pour l’ensemble de leurs critères. L’ACP permet d’autre part d’évaluer la liaison entre les variables quantitatives permettant de définir les individus, en identifiant celles qui apparaissent corrélées entre elles. Le nom d’analyse en composantes principales vient de cette analyse des liaisons entre variables quantitatives visant à résumer l’ensemble de celles-ci par un nombre restreint de variables synthétiques : les composantes principales. C’est donc une double typologie qui est attendue : la première réunissant les individus en classes, la deuxième mettant en avant des corrélations de critères en composantes principales.

Données et traitement des données : La transformation par le biais de l’ACP des proximités statistiques des individus en fonction de leurs critères, en distances euclidiennes permet la génération d’un nuage de points, dans lequel « un individu peut être représenté comme un point de l’espace vectoriel à k dimensions [...] dont chaque dimension représente une variable » (Escoffier B., Pagès J., 1998, p. 10). L’ensemble des individus étudiés peut donc être présenté sous la forme d’un nuage rendant compte des distances – ressemblances / dissemblances, en termes d’interprétation – respectives entre individus. Or, nos capacités de représentation spatiale achoppant devant des dimensions supérieures à 3, il est courant d’interpréter la forme du nuage et ses partitions éventuelles en procédant à des projections de celui-ci sur des plans factoriels particuliers.

En effet, l’ACP a pour but de donner du nuage – calculé dans un espace vectoriel à k dimensions (le nombre de variables quantitatives prises en compte) – des représentations bidimensionnelles approchées restituant le maximum d’information sur les positions respectives des points. Ainsi, les axes factoriels orthogonaux définissant les plans factoriels de projection du nuage sont déterminés de façon à rendre minimal l’écart entre le nuage de points, dans sa configuration multidimensionnelle, et sa projection bidimensionnelle, ce qui revient à épuiser sur celle-ci une information maximale concernant le nuage. « La projection ne pouvant que réduire la distance entre points, les axes factoriels apparaissent comme les directions telles que les distances entre points projetés ressemblent le plus possible aux distances entre les points homologues » (ibid., p. 13) du nuage.

Autrement dit, et dans les termes propres à l’analyse factiorielle : il s’agit de mettre en évidence une suite de directions – les axes factoriels – telle que le rapport entre l’inertie du nuage et l’inertie de sa projection sur ces directions soit maximum. L’ACP détermine les axes factoriels de façon à les confondre avec les composantes principales obtenues dans l’analyse des données. Ainsi, un axe factoriel correspond à un groupe de critères fortement corrélés. « Les axes factoriels étant orthogonaux deux à deux, on met en évidence une suite de variables synthétiques, les composantes principales, non corrélées entre elles, qui résument au mieux l’ensemble des variables initiales » (ibid., p. 15).

message URL dessin3.gif
Document 4 : Projection et conservation de l’inertie -exemple.

Cette propriété est d’un grand intérêt, puisqu’il en découle :

  • premièrement : que la projection du nuage selon les axes factoriels déterminés par l’ACP permet de visualiser la distribution des points selon les variables synthétiques que sont les composantes principales.

  • deuxièmement : que les axes factoriels successifs, déterminés par l’ACP, correspondent aux composantes principales qui épuisent progressivement le plus d’informations issues des variables initiales.

  • troisièmement : que, l’inertie sur chaque facteur allant décroissant rapidement, les projections du nuage de points sur les trois premiers axes factoriels – donc sa représentation tridimensionnelle dans un repère orthonormé [Ox,Oy,Oz], facilement visualisable – suffisent généralement pour en mener le travail d’interprétation.

Une fois menée cette étape, le travail d’interprétation des facteurs peut être entrepris. En effet, les résultats de l’analyse factorielle demandent à être clarifiés ; cette dernière n’est qu’un « outil d’exploration du tableau » (ibid., p. 241) de données initiales. « Chaque coordonnée factorielle dépend a priori des valeurs de l’ensemble des colonnes pour l’ensemble des lignes : elle n’est pas immédiatement compréhensible » (ibid.), de même que demeure complexe la lecture directe des données initiales du tableau. Cependant, l’ACP offre l’avantage de réorganiser ces données, de « sélectionner, par ordre d’importance décroissante, les structures les plus marquantes du tableau » (ibid.). Pour ce faire, l’interprétation – car il s’agit d’interpréter, non pas d’étudier les résultats d’une analyse factorielle – repose sur une méthodologie particulière, que nous ne détaillerons pas ici, mais à propos de laquelle le statisticien n’hésite pas à dire que le seul examen des chiffres et des figures ne peut permettre d’aboutir : « interpréter, c’est jouer de façon personnelle » (ibid., p. 242), faire des choix, éclairer les résultats par un contexte, accepter de perdre de l’information que l’on n’est pas en mesure d’expliciter pour retenir des résultats dont la pertinence et l’intérêt servent l’analyse.

Pour achever cette présentation générale de l’ACP, précisons ici qu’un travail d’interprétation exhaustif doit prendre en compte, entre autres : l’identification des individus qui ont contribué à la construction des axes, du fait de la corrélation forte de leurs variables ayant abouti à la détermination des composantes principales ; les facteurs de corrélation des variables, chacune étant représentée par un vecteur et située sur ce que l’on appelle l’hypersphère de rayon 1.

Une classification ascendante hiérarchique (CAH) peut utilement compléter l’ACP, fournissant en contre-point de l’interprétation du nuage, une partition du corpus en sous-classes basée sur des calculs statistiques spécifiques ; ceux-ci évaluent les degrés d’affinité progressive entre individus et restituent graphiquement les résultats sous forme d’un arbre dont les ramifications rendent compte des ressemblances / dissemblances entre individus et classes d’individus.

Nous détaillerons l’objet de ces outils et méthodes au fur et à mesure de la présentation de l’analyse à laquelle nous allons nous livrer maintenant pour déterminer les rapports morphologiques entre les spécimens de notre corpus.