3.5. La mesure de l’ajustement et les tests de spécification du modèle

3.5.1. La méthode du maximum de vraisemblance

La mesure du R2 basée sur la décomposition de la somme des carrés entre la somme des carrés expliqués et la somme des carrés résiduels ne peut pas être appliquée aux modèles spatiaux estimés à l’aide de la méthode du maximum de vraisemblance. Deux indicateurs peuvent être utilisés pour essayer de mesurer la qualité de l’ajustement. Une première mesure correspond au calcul du ratio entre la variance des valeurs prédites et la variance des valeurs observées (pseudo R2). Le second indicateur est la corrélation au carré entre les valeurs prédites et les valeurs observées.

La mesure la plus adéquate de la qualité de l’ajustement linéaire des modèles spatiaux correspond aux critères d’information. Deux critères basés sur le logarithme du maximum de vraisemblance sont utilisés : le critère d’information Akaike (AIC) et le critère de Schwartz (SC). Le meilleur à retenir est celui qui a le critère d’information (AIC) le plus faible.

Avec N le nombre d’observations et K le nombre de variables explicatives.

Afin de s’assurer de l’absence d’erreurs de spécification dans le modèle spatial, il faut réaliser les trois tests suivants :

  • le ratio de vraisemblance
    Pour mesurer la significativité du paramètre spatial calculé, il faut recourir au ratio de vraisemblance (LR). Il s’agit d’un ratio entre le logarithme de vraisemblance obtenu pour le modèle spatial et le logarithme de vraisemblance calculé pour le modèle a-spatial. Ce ratio suit un Khi-deux de 1 degré de liberté. L’hypothèse nulle correspond à l’absence d’autocorrélation spatiale dans le modèle spatial testé.
  • L’ordre du test de Wald, du ratio de vraisemblance et du multiplicateur de Lagrange.
    Ces tests ont une valeur identique lorsque la population statistique est infinie. En revanche, pour des échantillons finis, ces indicateurs varient. Ils sont généralement dans l’ordre suivant :
Lorsque ces indicateurs sont ordonnés dans cet ordre, alors le modèle spatial est correctement spécifié.
Dans le cas de l’estimation d’un modèle spatial avec autocorrélation des résidus, il faut également réaliser le test du facteur commun.
Nous savons que le modèle spatial avec autocorrélation des résidus s’écrit
. Il s’agit d’un modèle spatial autorégressif particulier :

Afin que la formulation de l’équation (7.36) corresponde à un modèle spatial avec autocorrélation, le coefficient de WX doit être égal à la négative du produit des termes Wy et X. Cette hypothèse s’appelle l’hypothèse du facteur commun. Elle est formalisée par l’hypothèse nulle :

Pour tester cette hypothèse, le premier test est un test de Wald qui suit un Khi-deux dont les degrés de liberté correspondant au nombre de paramètres de l’équation. Le second est le test du ratio de vraisemblance qui suit un Khi-deux de degrés de liberté égal au nombre de paramètres de l’équation.

Un modèle spatial correctement spécifié devrait pouvoir prendre en compte l’ensemble des interactions des observations. Afin de s’en assurer, il faut recourir à un test qui mesure, après l’estimation du modèle spatial autorégressif (d’un modèle spatial avec autocorrélation des résidus), l’importance de l’autocorrélation résiduelle résultant de la présence d’autocorrélation des résidus (de l’absence de la prise en compte de la variable autorégressive) dans le modèle spatial.

Nous présentons le test du multiplicateur de Lagrange de l’existence d’autocorrélation des résidus dans le cas du modèle spatial autorégressif. Le test équivalent peut être appliqué pour un modèle spatial avec autocorrélation des résidus afin de mesurer la présence d’autocorrélation spatiale résiduelle résultant de l’omission d’une variable autorégressive dans le modèle. Ce test est formalisé de la manière suivante :

avec
les résidus résultant de l’estimation par le maximum de vraisemblance, s2 la variance estimée des résidus, W la matrice spatiale et var(p) la variance asymptotique estimée du coefficient .

Ce test suit un Khi-deux à un degré de liberté. Si le résultat du test est significatif, cela conduit à deux conséquences. Cela signifie que la forme d’autocorrélation introduite dans le modèle n’a pas permis de prendre en compte l’ensemble de l’autocorrélation spatiale. Ceci peut s’expliquer par le fait que la matrice spatiale ne convient pas ou que le modèle spatial retenu n’est pas approprié à la forme présente d’interactions spatiales.

Comme pour la méthode des moindres carrés ordinaires, nous pouvons utiliser le test de Breush-Pagan à partir des résidus issus de la méthode du maximum de vraisemblance pour mesurer l’importance de l’hétéroscédasticité. Mais ce test ne prend pas en compte l’autocorrélation spatiale. Il est possible d’utiliser le test de Breusch-Pagan adapté aux modèles spatiaux (Anselin, 1998).