4.3. Corrélations entre variables et opérationnalité d’ensemble

Pour pouvoir estimer de façon fiable les paramètres du modèle, il est nécessaire que les variables soient le moins corrélées possibles. En cas de corrélation élevée entre deux variables (supérieure à 0,95), les estimations des coefficients relatifs à ces deux variables sont covariantes et l’impact de l’une se reporte sur l’autre (Rys, Vaneecloo, 1998 ; Bourbonnais, 2000 ; cf. chapitre 3). Nous avons calculé les corrélations entre variables (Tableau 39).

Tableau 39 : Tableau des corrélations entre variables
  PIB Prix du fer Prix de l’air Prix de la route Indicateur d’accessibilité routière Vitesse du fer
PIB 1 0,89 -0,90 -0,96 0,98 0,94
Prix du fer   1 -0,64 -0,83 0,88 0,80
Prix de l’air     1 0,87 -0,92 -0,93
Prix de la route       1 -0,93 -0,93
Vitesse route         1 0,96
Vitesse du fer           1

Les variables sont, comme c’est très souvent le cas pour des séries temporelles, fortement corrélées les unes aux autres : les coefficients de corrélation oscillent entre 0,64 et 0,98. Toutefois, jusqu’à 0,95, les corrélations restent acceptables. La corrélation qui pose vraiment problème pour l’estimation est la corrélation entre PIB et accessibilité routière : 0,98. Il risque d’être difficile de séparer l’impact de la croissance économique de l’impact de l’offre routière. L’une des deux variables risque de ne pas être significative et, si elles le sont toutes les deux, il existe des risques de mauvaise attribution de l’effet de l’une des variables à l’autre. Le modèle sera d’autant plus valide en projection que les deux variables resteront corrélées.