3.3.2. Le Recensement Général de la Population (RGP) de 1999 – INSEE

Le Recensement Général de la Population constitue la source essentielle de données pour modéliser la localisation résidentielle.

On va utiliser pour caler notre modèle de localisation des ménages les données du RGP de 1999 (1999 a été choisi comme l’année de référence (initiale) dans la simulation réalisée dans le cadre du projet SIMBAD).

Un premier avantage de cette source de données, fournie par l’INSEE, consiste dans le fait qu’il s’agit d’une base de données exhaustive, ce qui garanti la précision de l’information.

Un autre avantage c’est que cette source nous permet d’avoir une présentation spatialisée de la population (des ménages) (découpage à l’IRIS ou à la commune), ce qui est essentiel pour pouvoir bâtir un modèle de localisation des ménages.

Les données du RGP nous fournissent des informations notamment sur le profil socio-démo-économique des ménages et, dans une moindre mesure, sur les caractéristiques du marché immobilier.

L’inconvénient majeur de cette source est le manque d’informations sur le revenu, qu’il faudra trouver dans d’autres sources (les données de la DGI).

L’essentiel de l’information sur le profil des ménages, qu’on va utiliser pour analyser et modéliser la localisation résidentielle, se trouve dans les variables fournies par le RGP de 1999.

Les unités statistiques d’analyse seront, dans un premier temps, les 777 IRIS de l’aire urbaine de Lyon.

En ce qui concerne les variables qui vont nous donner le profil des IRIS selon les caractéristiques socio-démo-économiques des ménages y résidant, on a considéré la répartition (fréquences relatives marginales) des ménages ou la moyenne de chaque IRIS pour les caractéristiques suivantes :

Modalités de la variable :

1 = moins de 30 ans1 = moins de 30 ans

2 = 30 – 45 ans2 = 30 – 45 ans

3 = 45 – 60 ans3 = 45 – 60 ans

4 = plus de 60 ans 4 = 60 – 75 ans

5 = plus de 75 ans

Modalités de la variable :

1 = sans actif

2 = 1 actif

3 = 2 actifs ou plus

Modalités de la variable :

1 = sans enfant

2 = un ou deux enfants

3 = 3 enfants ou plus

Modalités de la variable :

1 = propriétaire

2 = locataire

Modalités de la variable :

1 = 1 personne

2 = 2 personnes

3 = 3 ou 4 personnes

4 = 5 personnes ou plus

Le taux de motorisation des ménages est une variable qui a certainement une influence sur la décision de se localiser dans la ville, le territoire étant caractérisé par des variations du nombre de voitures (VP) possédées par les ménages y résidant en fonction de la distance à laquelle ils se situent par rapport au centre.

On a trois catégories pour cette variable :

1 = sans VP

2 = 1 VP

3 = 2 VP ou plus

L’estimation du modèle de choix de localisation résidentielle des ménages nécessite une base de données complètement désagrégée (c'est-à-dire, l’unité statistique d’analyse doit être le ménage) (il s’agit d’un modèle de choix discret, comme on l’a vu dans le deuxième chapitre).

L’INSEE fournit les données du recensement à un niveau agrégé, en général sous forme de distributions marginales des variables pour différents découpages géographiques (îlot, IRIS, commune), mais il ne met pas à disposition les données décrivant chaque ménage individuellement, pour des raisons de confidentialité.

Dans ce contexte, on a fait une demande spécifique à l’INSEE pour pouvoir obtenir des données semi-désagrégées, à savoir les distributions conditionnelles (le croisement des modalités des variables) des ménages selon les variables à introduire dans le modèle : âge de la personne de référence, taille du ménage, nombres d’actifs du ménage, nombre de voitures et statut d’occupation du logement, localisés à l’IRIS. Ces cinq variables ont été définies comme des variables qualitatives, ayant les mêmes modalités que ci-dessus.

A partir de cette base, on a généré une population synthétique de ménages, qui va servir de base de données de calage de notre modèle de localisation des ménages.