2.2.1. Une meilleure spécification du modèle

Afin de prendre en compte la spatialisation des données, on recourt souvent à l’introduction de variables explicatives comme la distance par rapport aux différents centres et des indicateurs représentant certaines caractéristiques de zones urbaines. Mais ceci n’est pas suffisant pour que les résidus ne soient plus autocorrélés spatialement. Belsley, Kuh et Welsch (1980, p. 239) montrent que, malgré l’introduction de ce type de variables par Harrison et Rubinfeld (1978), les résidus sont toujours autocorrélés (PACE, BARRY et SIRMANS, 1998, p. 6).

Par ailleurs, il est difficile de pouvoir modéliser la partie non aléatoire du phénomène à partir de quelques variables comme il est d’usage en économétrie. Deux solutions ont été envisagées mais elles débouchent toutes deux sur la proposition d’un nombre de variables explicatives trop important pour que cela puisse être réalisable.

En effet, l’analyse spatiale est réalisée sur deux dimensions, ce qui oblige à recourir à un nombre de variables explicatives très important. L’analyse des séries chronologiques est éclairante à ce sujet. En effet, les séries temporelles requièrent pour la modélisation du trend au-delà de l’évolution du temps un indicateur pour chaque année. L’analogie entre les modèles temporels et les modèles spatiaux est fréquemment utilisée. Ainsi, l’analyse de phénomènes spatiaux nécessiterait non pas autant de variables explicatives que d’observations comme pour les variables temporelles, mais le carré du nombre d’observations puisque les phénomènes spatiaux se déroulent dans deux dimensions. La seconde proposition se situe dans le cadre d’une analyse par zone. Alors si nous supposons que le nombre d’observations par zone, nécessaire pour une analyse robuste est d’au moins 20 transactions immobilières, cela revient à avoir un nombre plus réduit de variables endogènes, égal au nombre d’observations divisé par le nombre de transactions par zone, soit dans notre cas environ 75 variables. L’on convient aisément que ceci est impossible.

D’autres solutions sont également proposées. Jackson (1979) propose de modéliser le caractère spatial des données en utilisant dans la fonction des prix hédonistes une polynomiale croisant les coordonnées géographiques de chaque observation. Cette fonction polynomiale crée une surface. Mais de nombreux problèmes sont associés à cette méthode (DUBIN, 1992) :

  •  Elle provoque des distorsions à la marge de la zone afin de pouvoir mieux s’ajuster aux points situés au centre ;
  •  Les termes de la polynomiale sont souvent très corrélés provoquant ainsi de la multicolinéarité ;
  •  Une distribution inégale des données peut fausser l’ajustement ;
  •  Une autocorrélation positive des erreurs peut conduire à recourir à une polynomiale d’ordre élevé ;
  •  La polynomiale a tendance à lisser les phénomènes.

Afin d’améliorer les résultats des analyses, des méthodes plus spécifiques de modélisation des dépendances spatiales ont été développées.