3.1.2. Traitement des variables de position professionnelle déclarée

Parmi l’ensemble des variables relatives à la position professionnelle déclarée, nous excluons, dès à présent, celles correspondant à une « position professionnelle non déclarée » et les « non salariés - aides familiaux ». Les effectifs de population correspondant à ces deux variables ne sont pas représentatifs et /ou n’apportent aucune indication par rapport à la typologie des quartiers au regard des revenus par décile de l’aire urbaine. Comme pour le statut de la population, une analyse de similarité et de covariance est menée afin d’extraire les variables les plus pertinentes de la typologie des quartiers selon les niveaux de vie.

Toutefois, compte tenu du grand nombre de variables potentiellement explicatives, l’analyse des coefficients de corrélation n’est pas suffisante, à elle seule, pour rendre compte de la complexité des influences directes ou croisées des variables sur la typologie des quartiers. Elle tend à ne faire ressortir que les variables expliquant les classes « extrêmes » de la typologie (quartiers défavorisés ou quartiers aisés).

Afin de rendre compte d’éventuelles variables susceptibles d’apporter des éléments d’explication sur les différents types de quartiers, nous complétons notre étude par une analyse de la variance. Celle-ci consiste à faire une régression linéaire multiple sur l’ensemble des variables des positions professionnelles déclarées potentiellement explicatives de la typologie des quartiers (Encadré 17).

Encadré 17 : Modèle de régression linéaire retenu

Le logiciel d’analyse statistique utilisé (XLSTAT©) permet de réaliser une analyse de la variance et des régressions linéaires à l’aide d’un modèle dit « descendant ». Dans ce modèle, les variables explicatives sont, dans un premier temps, toutes considérées dans la régression linéaire pour expliquer les types de quartiers. Puis, les unes après les autres, les variables sont retirées jusqu’à ce que, pour toutes les variables restantes dans la régression linéaire, la probabilité d’erreur associée à la statistique T de Student soit inférieure à une valeur seuil par défaut de 5%. A chaque étape, le retrait d’une variable explicative du modèle de régression n’a qu’un impact minimal sur la variable à expliquer (la typologie des quartiers).