3.3.3.2.Deuxième étape : classification des individus

Les méthodes de classification ont pour objet de regrouper les individus en un nombre restreint de classes les plus homogènes possibles. Il existe deux grandes catégories de méthodes de classification :

  • les méthodes hiérarchiques qui produisent des suites de partitions emboîtées les unes dans les autres. Plus particulièrement, la classification ascendante hiérarchique procède par regroupements successifs des unités élémentaires en fonction de leur ressemblance par rapport à un certain nombre de critères. L’algorithme ne fournit pas une partition en q classes d’un ensemble de n objets, mais une hiérarchie de partitions se présentant sous la forme d’arbres (ou dendogrammes) et contenant n-1 partitions. Le critère d'agrégation des groupes utilisé est le critère de Ward (minimisation de l'augmentation d'inertie) et la distance entre deux individus est la distance euclidienne. Le calcul est également optimisé en rapidité et place mémoire nécessaire par la méthode des «voisins réciproques».
  • les méthodes non hiérarchiques qui produisent une partition en un nombre fixé de classes. Il en existe plusieurs variantes, mais leurs principes de base sont similaires : à partir d’une partition initiale à k classes, les permutations successives d’unités élémentaires sont effectuées de façon à minimiser les différences intra-classes et maximiser les différences interclasses. L’avantage de ces méthodes est de permettre de traiter rapidement un nombre très élevé d’éléments. Mais elles possèdent aussi quelques inconvénients : étant donné que la partition finale dépend de la partition initiale, on n’est jamais sûr d’avoir trouvé la solution optimale. De plus, il faut connaître a priori le nombre de classes de la classification et le choix de ce nombre est souvent arbitraire.

Afin de contourner cette dernière difficulté, nous avons d’abord effectué, pour chaque segment enquêté, une classification ascendante hiérarchique sur les coordonnées d’individus issues de l’analyse des correspondances multiples, ce qui nous a permis d’une part de déterminer le nombre de classes « optimal », et d’autre part d’obtenir une première classification des individus, qui a ensuite été affinée par une classification par centres mobiles.

Nous présentons les résultats pour chaque segment dans le paragraphe suivant.