6.1 Choix de l’échelle d’observation et du modèle économétrique

Pour mettre en place un modèle d’estimation, nous avons dû modifier notre échelle d’observation. En effet, comme nous l’avons déjà mentionné précédemment, la relative imprécision des calculs menés à l’échelle individuelle entraînait des problèmes redoutables, avec notamment une forte hétéroscédasticité susceptible de fournir une estimation erronée des coefficients du modèle. Pour dépasser ces limites, nous avons fait le choix de raisonner à un niveau agrégé en travaillant sur des valeurs moyennes par zone. Nous avons d’abord songé à nous placer au niveau du secteur fin de tirage (523 secteurs fins sur l’aire urbaine de Lyon). Cependant, pour chacune des zones, le nombre de ménages enquêtés n’était pas le même, variant d’un seul ménage à plus de 70, ce qui posait pour certains d’entre eux un problème de représentativité statistique. Notre choix s’est donc arrêté sur l’échelle plus agrégée du secteur de tirage (au nombre de 120 sur l’aire urbaine de Lyon). Au sein de chaque secteur, on dispose de 75 ménages enquêtés, ce qui assure pour chaque secteur la même représentativité statistique. Comme le nombre de ménages est constant par secteur enquêté, les zones du centre sont relativement petites tandis que les zones périphériques sont plus vastes. Les caractérisations de la forme urbaine pour les secteurs périphériques sont donc plus grossières car elles font intervenir des valeurs moyennes sur des périmètres plus vastes. Il est tout à fait possible que cela influence tout ou partie des résultats, mais les contraintes de l’enquête ménages ne nous laissent pas la possibilité d’employer une autre méthode.

Sur cette base, notre choix s’est porté sur l’utilisation d’une régression linéaire multiple par l’utilisation de l’estimateur des moindres carrés ordinaires (MCO). Les simulations que nous effectuons seront alors basées sur l’estimation des coefficients d’élasticité associés aux variables caractérisant la zone de résidence du ménage. Avant de spécifier chacun de nos modèles, nous présentons dans un premier temps les variables explicatives utilisées et, dans un second temps, les tests statistiques permettant de valider ou non nos modèles de régression.