3.3. Les sources de données et les variables disponibles pour la modélisation des choix résidentiels

L’objectif de notre travail est de modéliser les choix des ménages en matière de mobilité et de localisation résidentielle. Les données/variables dont on a besoin pour ce faire ont été identifiées, à travers l’étude bibliographique sur les déterminants des choix résidentiels des ménages, dans le chapitre précédent. L’élaboration et le calage d’un tel modèle et les analyses statistiques préalables rendent nécessaire l’utilisation de bases de données volumineuses.

Les variables dont on aura besoin dans notre démarche de modélisation sont assez nombreuses et ne sont pas disponibles dans une même source de données, et donc ne sont pas disponibles au même niveau d’agrégation et de finesse géographique. Cette base de données de calage du modèle résidentiel est en fait le résultat d’une compilation entre les différentes sources de données et d’un travail de traitement des données, pour les amener à une forme comparable. Pour certaines variables, un travail d’adéquation aux besoins de modélisation sera nécessaire : par exemple, tenant compte du fait que l’approche retenue pour modéliser les comportements résidentiels est celle des choix discrets, il faudra que l’on transforme certaines variables continues dans des variables catégoriales correspondantes. Notons aussi que, pour un certain nombre de variables, on n’a pas la capacité de prévoir leur évolution. Or, sachant que le modèle que l’on va estimer sera ensuite intégré dans une plateforme de modélisation qui va simuler des scénarios d’évolution des phénomènes étudiés, on sera obligé de ne pas introduire dans le modèle des variables qui pourraient avoir un pouvoir explicatif, mais dont on n’est pas en mesure de prévoir l’évolution.

Les sources de données sur l’aire urbaine de Lyon dont on dispose, et à partir desquelles on va construire nos bases de données de calage sont les suivantes :

Pour chacune des sources de données évoquées, on va présenter les variables retenues pour être testées et éventuellement utilisées dans la modélisation, en décrivant brièvement la définition de chacune d’entre elles. La sélection des variables a été faite en tenant compte de trois critères : les suggestions fournies par la littérature de la mobilité et de la localisation résidentielle – voir section 2.2., les contraintes imposées par le fonctionnement d’URBANSIM (les données requises par les modules de mobilité résidentielle et localisation résidentielle d’URBANSIM et les liens avec d’autres modules (prix du foncier, développement urbain, localisation des activités, accessibilité) – voir section 3.2.3.2.) et la disponibilité de ces données dans les différentes sources.