4.4.3. Validation du modèle

Afin d’apprécier la qualité du modèle estimé, nous utilisons plusieurs statistiques et tests. Nous vérifions également dans quelle mesure les prédictions du modèle correspondent à la réalité observée.

Pour cela, le logiciel SPSS propose des statistiques comme le R-deux de Cox & Snell (basé sur la log-vraisemblance du modèle comparée avec celle d’un modèle constant ; il prend toujours des valeurs inférieures à 1, même pour un modèle « parfait ») ou de Nagelkerke (c’est une version ajustée du R-deux de Cox & Snell, qui prend des valeurs dans l’intervalle [0 ;1]), mais aussi d’autres tests, comme celui de Hosmer-Lemeshow (plus robuste, en raison du fait qu’il est basé sur le regroupement des observations en déciles et la comparaison de la probabilité observée avec la probabilité théorique à l’intérieur de chaque décile).

Tableau n°21 : Les R-deux du modèle
Tableau n°21 : Les R-deux du modèle

Source : Traitement SPSS

Les valeurs de R-deux (tableau n° 21) indiquent un bon ajustement du modèle estimé aux données, qui traduit la rationalité de la sélection des variables explicatives et préconise une bonne qualité de l’estimation des coefficients.

Tableau n°22 : Le test de Hosmer-Lemeshow
Tableau n°22 : Le test de Hosmer-Lemeshow

Source : Traitement SPSS

On peut faire le même constat en se rendant compte de la significativité de la valeur de la statistique de Hosmer-Lemeshow (tableau n° 22).

Tableau n°23 : Le pouvoir prédictif du modèle
Tableau n°23 : Le pouvoir prédictif du modèle

Source : Traitement SPSS

Regardant la correspondance entre ce qui est observé et les prédictions du modèle, on constate que le taux des ménages dont le choix a été correctement prévu est de 87% (tableau n° 23). Si le taux global de déménagement a été correctement prévu, il y a une confusion assez importante entre les ménages qui déménagent et ceux qui ne le font pas (le pourcentage de ménages qui déménagent pour lesquels la prévision est correcte est de 41,2%), ce qui suggère qu’il y a d’autres variables qui déterminent les ménages à changer de logement (caractéristiques des ménages non observées, caractéristiques des logements, de la localisation) qu’on n’a pas introduites dans le modèle (l’objectif du modèle était d’identifier uniquement les caractéristiques des ménages et d’établir leur influence sur la mobilité résidentielle).

Une autre méthode pour apprécier si les résultats du modèle proposé sont robustes est de caler le modèle sur des données qui caractérisent de façon plus générale le phénomène de mobilité résidentielle au niveau national et de comparer les résultats des deux estimations. Pour cela, on a considéré une base de données de l’Enquête Logement 2002 contenant les ménages de toutes les aires urbaines ayant plus de 500 000 habitants (hors aire urbaine de Paris).

Tableau n°24 : Coefficients estimés du modèle de choix de mobilité résidentielle (aires urbaines de plus de 500000 habitants)
Tableau n°24 : Coefficients estimés du modèle de choix de mobilité résidentielle (aires urbaines de plus de 500000 habitants)

Source : Traitement SPSS

Les chiffres du tableau n° 24 montrent que les variables retenues pour le cas lyonnais restent significatives, avec des coefficients qui ressemblent à ceux estimés pour l’aire urbaine de Lyon.

Tableau n°25 : Les R-deux du modèle
Tableau n°25 : Les R-deux du modèle

Source : Traitement SPSS

Tableau n°26 : Le test de Hosmer-Lemeshow
Tableau n°26 : Le test de Hosmer-Lemeshow

Source : Traitement SPSS

Les statistiques d’ajustement restent dans les mêmes ordres de grandeur, indiquant toujours une bonne qualité du modèle proposé (tableaux n° 25 et 26).

Tableau n°27 : Le pouvoir prédictif du modèle
Tableau n°27 : Le pouvoir prédictif du modèle

Source : Traitement SPSS

Enfin, on peut faire à peu près le même constat si on regarde les chiffres du tableau n° 27 (les faibles variations qui apparaissent sont très probablement liées aux différences de comportement de mobilité résidentielle entre les aires urbaines françaises).