5.2.1. Obtention et analyse d’une typologie d’IRIS en fonction des caractéristiques des ménages y résidant

Il s’agit ici de décrire les IRIS de l’aire urbaine de Lyon en termes de profil moyen des ménages résidants (cette analyse dont l’unité d’observation est l’IRIS est réalisée en faisant l’hypothèse d’uniformité des IRIS quant au nombre de ménages résidants).

On va utiliser pour ce faire la méthode de la classification ascendante hiérarchique. C’est une méthode d’analyse exploratoire qui tente d’identifier les classes d’observations (ou de variables) relativement homogènes basées sur des caractéristiques sélectionnées. Elle utilise un algorithme qui débute avec chaque observation (ou variable) dans une classe séparée et qui combine les classes jusqu’à ce qu’il n’en reste qu’une. La procédure calcule des mesures de distance ou de proximité (similarité), et le critère de classification consiste à maximiser la variance (la distance) entre les observations des classes différentes et à minimiser la variance (ou à maximiser la similarité) entre les observations de la même classe.

Ainsi, on obtient une partition des IRIS en classes homogènes selon les variables décrivant les attributs des ménages y résidant.

Tableau n°29 : Partition des IRIS en 10 classes
Tableau n°29 : Partition des IRIS en 10 classes

Source : Traitement SPSS

Suite à l’application de la méthode de la classification ascendante hiérarchique, on a débouché sur une partition des IRIS en 10 classes (tableau n° 29).

Etant donné le fait que les classes 9 et 10 contiennent respectivement 2 et 1 IRIS, on a décidé de considérer ces IRIS comme des cas atypiques et de les éliminer de l’analyse.

On a donc répété l’analyse sans ces IRIS et on a obtenu la même partition que dans le cas précédent (une partition en 8 classes des IRIS restants) (tableau n° 30), ce qui confirme la stabilité de la solution du modèle initial.

Tableau n°30 : Partition des IRIS en 8 classes
Tableau n°30 : Partition des IRIS en 8 classes

Source : Traitement SPSS

Ensuite, on a mené une analyse discriminante, pour voir quel est le pouvoir de chaque variable de discriminer entre les classes obtenues par l’analyse cluster.

Tableau n°31 : Valeurs propres des fonctions discriminantes
Tableau n°31 : Valeurs propres des fonctions discriminantes

Source : Traitement SPSS

Etant donné que le pouvoir explicatif de la première fonction discriminante est de 96,2% (tableau n° 31), on va prendre en compte les corrélations entre les variables discriminatoires et cette fonction.

Tableau n°32 : Corrélations entre variables et fonctions discriminantes
Tableau n°32 : Corrélations entre variables et fonctions discriminantes

Note : REVMEDUC – revenu médian par uc ; TAUXEMPL – taux d’emploi ; TAILLEMOYMEN – taille moyenne des ménages ; AGEMOY – âge moyenne ; NBMOYENF – nombre moyen d’enfants.

Source : Traitement SPSS

On observe que le revenu médian par u.c. est la variable qui explique la plupart des différences entre les groupes (0,999), tandis que toutes les autres variables ont un pouvoir de discrimination beaucoup plus faible (tableau n° 32).

En même temps, on observe qu’il s’agit d’une corrélation positive entre la fonction et le revenu, le taux d’emploi et l’âge moyen, et d’une corrélation inverse avec le nombre d’enfants et la taille des ménages.

Tableau n°33 : Valeurs des fonctions discriminantes dans les centroïdes des classes
Tableau n°33 : Valeurs des fonctions discriminantes dans les centroïdes des classes

Source : Traitement SPSS

Si on se réfère au profil des classes, on constate qu’on peut ranger les classes dans l’ordre croissant du revenu médian de leur population comme suit : 6, 5, 4, 1, 3, 2, 7, 8 (tableau n° 33).

La croissance du revenu dans les IRIS est généralement accompagnée d’une augmentation du nombre moyen d’actifs occupés des ménages (taux d’emploi) et de l’âge moyen de la population de l’IRIS, et d’un niveau plus bas du nombre moyen d’enfants et de la taille des ménages (et réciproquement).

Tableau n°34 : Validation du modèle
Tableau n°34 : Validation du modèle

Source : Traitement SPSS

On observe que le pouvoir prédictif du modèle est très élevé, le pourcentage d’observations correctement classées étant de 92,1% (tableau n° 34).

On a appliqué une deuxième fois l’analyse discriminante, mais cette fois avec la méthode pas à pas pour ne retenir que les variables significativement discriminantes dans l’analyse.

Tableau n°35 : Valeurs propres des fonctions discriminantes
Tableau n°35 : Valeurs propres des fonctions discriminantes

Source : Traitement SPSS

Tableau n°36 : Corrélations entre variables et fonctions discriminantes
Tableau n°36 : Corrélations entre variables et fonctions discriminantes

Note : REVMEDUC – revenu médian par uc ; TAUXEMPL – taux d’emploi ; NBMOYENF – nombre moyen d’enfants ; TAILLEMOYMEN – taille moyenne des ménages ; AGEMOY – âge moyenne.

Source : Traitement SPSS

On s’aperçoit que le modèle ne retient que trois variables pour la prévision : le revenu (qui reste la principale variable discriminante), le taux d’emploi et le nombre d’enfants (tableaux n° 35 et 36).

Tableau n°37 : Validation du modèle
Tableau n°37 : Validation du modèle

Source : Traitement SPSS

Ce deuxième modèle a aussi un pouvoir prédictif très élevé (95% des observations sont correctement classées) (tableau n° 37), ce qui suggère qu’on pourrait n’utiliser que ces trois variables pour la prédiction.

Afin de vérifier s’il existe une relation entre les profils des ménages et les caractéristiques physiques (accessibilités, occupation du sol) des IRIS où ils se localisent, on a effectué une analyse discriminante dans laquelle la variable catégorielle à prévoir reste la typologie des IRIS obtenue à partir de la classification ascendante hiérarchique effectuée antérieurement, et les variables discriminantes sont, cette fois, les caractéristiques liées aux accessibilités et aux modes d’utilisation du sol.

Tableau n°38 : Corrélations entre variables et fonctions discriminantes
Tableau n°38 : Corrélations entre variables et fonctions discriminantes

Note : TPSCTRVP – temps au centre (VP) ; MEMCOMRE/INSCRITS – taux d’élèves inscrits dont l’école est dans la même commune ; DENSPOP – densité de population ; DENSCOMMERCES – densité des commerces ; TSHABITAT – taux de surface d’habitat ; ACCTRAVAIL – % de population active dont la commune de résidence coïncide avec la commune de travail ; TSACTECON – taux de surface des activités économiques ; TSINFRATR – taux de surface des infrastructures de transport ; TSEQSPLOISIR – taux de surface des équipements sportifs et de loisir ; TSESPVERTS – taux de surface des espaces verts ; TSEQUIPEMENTS – taux de surface des grands équipements.

Source : Traitement SPSS

Tableau n°39 : Validation du modèle
Tableau n°39 : Validation du modèle

Source : Traitement SPSS

Même si certaines variables semblent avoir un pouvoir discriminatoire significatif (le taux de surface des grands équipements, le taux de surface d’habitat, l’accessibilité au centre et aux études) (tableau n° 38), le pouvoir prédictif du modèle est faible (24,4% des observations correctement classées) (tableau n° 39). Ce résultat est en fait la conséquence de deux aspects : le premier, c’est le nombre relativement élevé de catégories de la variable dépendante (10 classes d’IRIS à prévoir), qui est automatiquement accompagné par une affectation moins précise des IRIS aux classes correspondantes, mais il traduit aussi le fait qu’on ne peut pas établir une relation évidente entre l’ensemble des caractéristiques des ménages et celui des caractéristiques des IRIS.