5.1.b Etudes employant des modèles linéaires multi-variés

L’avantage de cette méthode réside dans le contrôle statistique. Elle permet de modéliser des variables à expliquer (part modales, distances parcourues…) par un certain nombre de variables explicatives théoriquement indépendantes (densité, localisation, revenu…) de la mobilité. Cette méthode permet en particulier d’estimer la valeur et la significativité des coefficients de régression partiels. Chaque coefficient est estimé toutes choses égales par ailleurs, ce qui permet de rendre compte de l’effet propre de chacune des variables.

Selon la nature des variables à expliquer, le choix du modèle peut varier. Par exemple, pour des variables quantitatives continues (distance, temps de parcours), la méthode des moindres carrés ordinaires peut être appropriée. Pour des variables qualitatives, ou quantitatives discrètes, impliquant un choix entre plusieurs alternatives (choix modal), le logit multinomial constitue une possibilité adaptée. Les hypothèses sous tendant ces différents modèles sont toutefois exigeantes (Greene, 1993) :

La conséquence de la violation de l’hypothèse (1) est une surestimation de la variance des coefficients estimés du modèle : certaines variables pourtant significatives peuvent être ignorées par le modèle. La violation des hypothèses (2) et (3) entraîne une estimation erronée de la variance des estimateurs, et le non respect de la dernière hypothèse entraîne des estimations erronées des estimateurs. On le comprend, toute la difficulté de ce genre de modèle réside dans sa spécification (Bonnel, 2004) : si le modèle est largement spécifié, il y a de forts risques de multicolinéarité et s’il l’est de manière trop restrictive, on risque de ne pas saisir l’ensemble des phénomènes rendant compte de tel ou tel comportement de mobilité.

Les études employant ces méthodes statistiques pour mieux expliciter les liens entre usage du sol et mobilité sont diverses. Souvent, les échelles d’observations sont soit une zone géographique donnée (communes ou secteurs de tirage en France ; « census tract », « zip code » aux Etats-Unis), soit des ménages, soit des personnes ou même des déplacements. Selon le degré de précision et la disponibilité des données, les variables explicatives peuvent être reliées à un ensemble de variables liées à l’usage du sol, auxquels sont parfois ajoutées les caractéristiques socio-économiques des individus et éventuellement leurs préférences.

Le principal défaut de ces approches est le lien de causalité, qui est ici supposé. En effet, le sens de la causalité est simplement déterminé par le choix des variables explicatives et constitue ici une hypothèse. Le modèle n’est pas fondé sur une base conceptuelle solide permettant d’appuyer cette hypothèse. En revanche, dans les modèles de choix modaux, fondés sur le principe de maximisation de l’utilité, la base conceptuelle présente en amont permet de justifier le choix des variables explicatives c'est-à-dire celles qui influent sur l’utilité d’un mode de transport.