4.2. Identification des déterminants de la mobilité résidentielle annuelle des ménages

Il s’agit toujours d’identifier les facteurs d’influence des décisions des ménages de changer la résidence, c’est-à-dire les caractéristiques en fonction desquelles on peut classifier les ménages par niveau ou degré de mobilité, en considérant comme unité temporelle d’analyse une période d’une année.

Pour ce faire, on a choisi comme variable à expliquer l’ancienneté d’occupation de la PR, mais on a transformé la variable originale dans une variable à deux catégories :

L’objectif est de prévoir si un ménage va changer ou pas de logement dans une période d’un an, en fonction de certaines caractéristiques qui ont une influence sur ce type de décision. On a considéré la durée d’une année en tenant compte du fait que c’est le pas de simulation proposé par URBANSIM, sachant qu’il permet aussi d’analyser de manière plus fine l’influence des différentes caractéristiques des ménages sur la décision de déménagement (si l’on avait considéré une durée de plusieurs années, cela aurait entrainé des difficultés d’identification des facteurs déterminants de la mobilité, vu qu’il y a des ménages qui déménagent plusieurs fois dans la période et qu’on ne dispose pas d’informations sur l’évolution des caractéristiques de ces ménages (nombre d’enfants, statut d’occupation du logement) d’un déménagement à l’autre).

Nous utilisons la méthode de l’analyse discriminante. Cette technique de modélisation fait partie des méthodes statistiques prédictives, étant utile pour construire un modèle de prévision d’une classe d’affectation en se basant sur des caractéristiques observées sur des unités statistiques.

La procédure génère une ou plusieurs fonctions discriminantes, qui sont des combinaisons linéaires des variables explicatives qui donnent la meilleure discrimination entre les classes (modalités) de la variable dépendante.

Les fonctions discriminantes sont générées à partir d’un échantillon d’observations pour lesquelles la classe d’affectation est connue, et peuvent ensuite être appliquées à de nouvelles observations pour lesquelles on connait les valeurs des variables explicatives, mais on ne connait pas la classe de la variable dépendante.

Dans l’analyse discriminante, on part de l’hypothèse que les classes d’affectation sont mutuellement exclusives (aucune observation n’est affectée à plus d’une classe) et collectivement exhaustives (toutes les observations sont affectées à une classe).

Dans notre démarche, la méthode de l’analyse discriminante va nous permettre de déterminer les caractéristiques discriminatrices en fonction desquelles un ménage sera affecté à l’une des deux classes de la variable ancienneté d’occupation de la PR. Cette méthode va nous indiquer les variables qui ont un pouvoir discriminatoire important, c'est-à-dire les variables qui vont entrer dans la fonction discriminante et en fonction desquelles on va décider d’affecter les unités statistiques à une classe ou à l’autre.

En appliquant la méthode pas à pas de l’analyse discriminante, le logiciel calcule des statistiques comme le F pour éliminer (ou pour introduire) et le lambda de Wilks pour chaque variable, et décide à chaque pas d’introduire ou non dans le modèle les variables en fonction de la valeur prise par ces statistiques. Le lambda de Wilks – à chaque pas, les variables sont introduites dans l’analyse en fonction de leur capacité à faire baisser cette statistique ; le rapport F – une variable est introduite dans le modèle si sa valeur F est supérieure à la valeur F d’entrée, et elle est éliminée si sa valeur F est inférieure à la valeur F d’élimination (la valeur F d’entrée doit être supérieure à la valeur F d’élimination et les deux doivent être positives).

Tableau n°9 : Variables discriminantes de la mobilité résidentielle
Pas   Tolérance F pour éliminer Lambda de Wilks
1 Age de la PR 1,000 90,491  
2 Age de la PR ,961 61,256 ,934
  Statut d’occupation du logement ,961 34,583 ,908
3 Age de la PR ,855 80,470 ,930
  Statut d’occupation du logement ,946 26,588 ,878
  Nombre d’enfants ,887 22,059 ,874

Source : Traitement SPSS

Tableau n°10 : Variables éliminées du modèle
Pas   Tolérance Tolérance minimale F pour introduire Lambda de Wilks
0 Superficie du logement 1,000 1,000 28,663 ,969
  Age de la PR 1,000 1,000 90,491 ,908
  Nombre d’enfants 1,000 1,000 6,097 ,993
  Revenu du ménage 1,000 1,000 5,981 ,993
  Statut d’occupation du logement 1,000 1,000 62,970 ,934
  Indicateur de centralité 1,000 1,000 1,700 ,998
1 Superficie du logement ,988 ,988 17,061 ,891
  Nombre d’enfants ,901 ,901 30,010 ,878
  Revenu du ménage ,997 ,997 8,077 ,900
  Statut d’occupation du logement ,961 ,961 34,583 ,874
  Indicateur de centralité ,996 ,996 ,439 ,907
2 Superficie du logement ,791 ,769 2,718 ,871
  Nombre d’enfants ,887 ,855 22,059 ,853
  Revenu du ménage ,915 ,882 1,405 ,872
  Indicateur de centralité ,925 ,893 ,848 ,873
3 Superficie du logement ,695 ,695 ,000 ,853
  Revenu du ménage ,893 ,852 ,208 ,852
  Indicateur de centralité ,904 ,852 2,668 ,850

Source : Traitement SPSS

On a appliqué la méthode pas à pas de l’analyse discriminante et on a retenu comme variables discriminantes l’âge de la PR, le statut d’occupation et le nombre d’enfants (tableau n° 9). On constate que le revenu, caractéristique économique importante des ménages, n’est pas retenu comme variable discriminante dans le modèle (tableau n° 10).

La fonction discriminante canonique s’écrit (tableau n° 11) :

D = 0,812*Age de la PR + 0,430*Nombre d’enfants – 0,456*Statut d’occupation du logement

Tableau n°11 : Coefficients des fonctions discriminantes canoniques standardisées
  Fonction
1
Age de la PR ,812
Nombre d’enfants ,430
Statut d’occupation du logement -,456

Source : Traitement SPSS

Tableau n°12 : Matrice de structure
  Fonction
1
Age de la PR ,767
Statut d’occupation du logement -,640
Superficie du logement(a) ,430
Indicateur de centralité(a) ,241
Nombre d’enfants ,199
Revenu du ménage(a) ,159

Les corrélations intra-groupes combinés entre variables discriminantes et les variables des fonctions discriminantes canoniques standardisées sont ordonnées par tailles absolues des corrélations à l'intérieur de la fonction.

a Cette variable n'est pas utilisée dans l'analyse.

Source : Traitement SPSS

La matrice de structure (tableau n° 12) nous donne les corrélations entre les variables discriminantes et la fonction discriminante (qui est une combinaison linéaire des variables discriminantes). On observe que cette fonction discriminante estimée est positivement corrélée avec l’âge de la PR et le nombre d’enfants, et négativement corrélée avec le statut d’occupation.

Tableau n°13 : Fonctions aux barycentres (moyennes) des groupes
Ancienneté d’occupation du logement de la PR Fonction
1
0 ,149
1 -1,156

Fonctions discriminantes canoniques non standardisées évaluées aux moyennes des groupes

Source : Traitement SPSS

Des valeurs de la fonction discriminante D plus élevées vont caractériser les unités statistiques de la classe 0 (la moyenne de D pour cette classe est 0,149), alors que des valeurs négatives de D correspondent aux unités statistiques de la classe 1 (la moyenne de D est -1,156) (tableau n° 13).

Cela signifie que les ménages dont la PR est âgée, avec plus d’enfants et qui sont propriétaires de leur logement ont une probabilité réduite de changer de logement dans un délai d’un an, tandis que cette probabilité est plus élevée pour les ménages jeunes, avec un nombre réduit d’enfants et qui sont locataires.

Le calage du module de mobilité résidentielle d’URBANSIM suppose le calcul des taux annuels de déménagement par type de ménage. Ces taux correspondent aux pourcentages des ménages qui ont une ancienneté d’occupation de leur logement inférieure à 1 an. On a calculé ces taux à partir des données empiriques de l’Enquête Logement 2002.

Il faut faire la précision que ces taux sont susceptibles d’évoluer dans le temps, surtout à un horizon de long terme, car les comportements des ménages, y compris en matière de mobilité résidentielle, se modifient à plus long terme. Par contre, on n’est pas en mesure de pouvoir simuler ces évolutions, à cause de l’insuffisance des données dont on dispose. En fait, pour cela, on devrait mener une analyse longitudinale des taux de mobilité résidentielle, basée sur les données de plusieurs enquêtes successives, et essayer de reconstituer la tendance d’évolution de ces taux. Compte tenu de ce dont nous avions à disposition, on se contente de cette analyse statique, en faisant l’hypothèse, dans URBANSIM, que ces taux se maintiennent constants pour toute la période de simulation, ce qui constitue une limite de notre modélisation.

On a calculé le taux annuel global (tous ménages confondus) de mobilité résidentielle, qui est de 11,4%.

A l’aide de l’analyse discriminante effectuée antérieurement, on a constaté que les variables qui sont potentiellement explicatives de la mobilité résidentielle sont l’âge de la PR, le nombre d’enfants / la taille du ménage et le statut d’occupation du logement. Les tableaux n° 10 - 24 de l’Annexe 3 illustrent les résultats des calculs de ces taux pour les variables énumérées antérieurement, et pour la variable revenu (variable que l’on considère importante dans l’analyse et que l’on va introduire dans le modèle de localisation résidentielle).

Pour s’assurer de la robustesse des résultats, on a effectué les mêmes calculs pour l’ensemble des aires urbaines de plus de 500 000 habitants (hors Île de France). On peut constater que, même s’il existe de petits écarts entre les taux calculés pour l’aire urbaine de Lyon et ceux calculés pour l’ensemble des aires urbaines de plus de 500 000 habitants (écarts dus probablement aux différences de comportement de mobilité résidentielle entre les aires urbaines), ces taux sont assez semblables et les variables explicatives des comportements de mobilité des ménages sont les mêmes (tableaux n° 25 - 39 de l’Annexe 3).

La visualisation des chiffres fournis par ces tableaux permet de conclure que les résultats obtenus initialement par l’analyse discriminante sont stables. Les variables qui expliquent les variations des taux de mobilité résidentielle parmi les ménages sont l’âge de la PR, le nombre d’enfants du ménage et le statut d’occupation du logement. On peut considérer que le pouvoir explicatif de la variable taille du ménage est repris par la variable nombre d’enfants du ménage (la présence des deux simultanément dans un modèle ayant des effets de colinéarité), et que la variable revenu n’est pas en lien significatif avec le comportement de mobilité résidentielle des ménages. Les valeurs des taux de mobilité résidentielle déterminées de façon empirique pour chaque type de ménages, en effectuant le croisement âge de la PR x nombre d’enfants x statut d’occupation, sont présentées dans le tableau n° 40 de l’Annexe 3.