3.3.1.Méthode utilisée

3.3.3.1.Première étape : réalisation d’une analyse factorielle des correspondances multiples sur les trois segments enquêtés

L’analyse factorielle des correspondances multiples est une généralisation de l’analyse des correspondances (simples ou binaires) à plus de deux variables qualitatives. C’est une méthode d’exploration des dépendances entre caractères nominaux, c’est-à-dire des caractères prenant des modalités non numériques. Elle a pour but d’étudier les liens existants entre les lignes et les colonnes d’un tableau de données. Dans cette analyse, les lignes et les colonnes jouent un rôle symétrique. Cette caractéristique délimite son champ d’application : tableau de contingence, de fréquence, de notes, et plus généralement d’intensité 62 . Elle possède les propriétés suivantes (Segonne, 1998) :

  • Les taux d’inertie ne peuvent être que faibles car le nombre de dimensions du problème est élevé
  • La part d’inertie totale due à une modalité est d’autant plus grande que son effectif est faible : on évitera donc les modalités à trop faible effectif
  • La part d’inertie totale due à une variable est d’autant plus grande que son nombre de modalités est élevé : on équilibrera le découpage des variables en un nombre homogène de modalités.

Notre objectif, par l’intermédiaire de ce traitement statistique, est d’obtenir les coordonnées de chaque individu sur les axes sélectionnés. En effet, les méthodes de classification qui permettent de regrouper les individus en fonction de certains critères ne sont applicables que sur des données quantitatives. Or, la plupart de nos données sont qualitatives. Nous avons donc dû trouver une méthode permettant de transformer des données qualitatives en informations quantitatives, probablement dans notre cas au prix d’une perte d’information.

Le choix du nombre d’axes qui seront utilisés est empirique. C’est la signification de chacun des axes qui nous guident dans le choix du nombre d’axes à conserver pour l’analyse : si l’axe n n’apporte rien en terme d’interprétation, on conservera n-1 axes pour effectuer l’analyse des correspondances multiples. Pour donner une signification à chaque axe, il faut pointer pour chacun des axes les modalités qui apportent une forte contribution, car ce sont elles qui définiront la signification de l’axe, souvent sous forme d’opposition entre modalités. On vérifie ensuite pour ces modalités à forte contribution leur représentation sur l’axe à l’aide des cosinus carré : plus le cosinus carré est proche de un, plus la position du point observé en projection est proche de la position réelle du point dans l’espace.

Nous avons retenu dans un premier temps un grand nombre de variables :

  • L’activité, découpé en 2 classes : actif / inactif.
  • La zone d’habitation, découpé en 2 classes : zone centrale (Lyon + Villeurbanne) / périphérie.
  • L’âge, découpé en 3 classes : 21-34 ans / 35-49 ans / 50-64 ans.
  • Le sexe.
  • Le statut matrimonial, découpé en 3 classes : en couple, seul, autre statut.
  • La captivité aux transports en commun découpé en 2 classes : captif / non captif.
  • Les revenus, découpé en 3 classes : faibles / moyens / élevés.
  • Le nombre de déplacements, découpé en classes : 0-2 déplacements ; 3-5 ; 6-9 ; 10-12 ; 13-15 ; 16-19 ; 20 déplacements et plus.
  • La régularité de la mobilité en transport en commun, découpé en 2 classes : mobilité régulière d’une semaine à l’autre / mobilité irrégulière.
  • le lieu de travail découpé en 2 classes : zone centrale / périphérie.
  • le motif dominant des déplacements en transport en commun découpé en 2 classes : motifs contraints (domicile - travail / travail - domicile) dominants / motifs non contraints dominants.

La réalisation de nombreux essais nous a permis de sélectionner les variables les plus pertinentes, qui sont les suivantes :

  • l’activité pour les abonnés Pass Partout / la variable croisant l’activité et le motif dominant des déplacements en transport en commun pour les utilisateurs de carnets de 10 tickets et de tickets unité : en effet, pour les abonnés, le motif dominant est le domicile - travail, seuls les inactifs se déplacent pour des motifs non contraints. Utiliser comme variable le motif de déplacement revient à renforcer de manière artificielle une segmentation suivant que l’on soit actif ou inactif.
  • le sexe
  • la zone d’habitation 
  • la captivité aux transports en commun 
  • les revenus
  • le nombre de déplacements
  • la régularité de la mobilité : cette variable n’a été utilisée que pour les utilisateurs de carnets de tickets et de tickets unité. En effet, quasiment tous les abonnés Pass Partout se déplacent de manière régulière d’une semaine à l’autre en transports en commun.

Notes
62.

Segonne (1998).