3.2 Tests de mesure

Plusieurs tests de mesure de l’autocorrélation spatiale existent. Les plus courants sont le test des couleurs et sa généralisation avec les statistiques de Moran et de Geary.

3.2.1 Test des couleurs

Ce test n’est applicable que dans le cas où les observations peuvent prendre uniquement deux valeurs et où l’on ne retient uniquement les valeurs prises par deux observations contiguës. Chacune des valeurs prises par les observations se voit affecter une couleur.

Si xi=1 i.e. si la caractéristique est présente => couleur noire

Si xi=0 i.e. si la caractéristique n’est pas présente = > couleur blanche.

Il est possible de représenter cette disposition des couleurs affectées aux observations sous forme de graphique. A titre illustratif, Jayet (1993) retient une espace régulier qui peut être schématisé par un ensemble d’hexagones avec 38 noeuds renvoyant à des observations et 49 arcs reliant ces observations. Dans le cas présent, le nombre de noeuds de couleur blanche est égal au nombre de noeuds de couleur noire soit 19 pour chacune des couleurs. Dans les trois cas de figure envisagés, seule la répartition de ces couleurs selon les noeuds change.

message URL fig510.gif
Figure 5.10 : Configurations spatiales homogènes et répartition des couleurs

Dans le cas P, la disposition des couleurs est uniforme. Les noeuds noirs sont regroupés, comme les noeuds blancs. Cette configuration manifeste une autocorrélation positive.

Dans le cas N, une stricte alternance des couleurs est de mise entre les noeuds. Un noeud blanc est suivi systématiquement d’un noeud noir et réciproquement. L’autocorrélation à ce niveau est négative.

Dans le cas O, les couleurs ne suivent pas un maillage régulier. Les valeurs des observations sont disposées de manière aléatoire. Le phénomène d’autocorrélation est absent de cette configuration.

Il est possible de compter également le nombre d’arcs reliant les noeuds selon les couleurs de ces derniers. L’arc reliant deux noeuds noirs ou blancs sera considéré comme noir-noir (NN) ou blanc-blanc (BB) et noir-blanc (NB) pour les noeuds où les couleurs alternent.

Tableau 5.1 : Résultats du décompte des arcs en fonction de leur couleur
NN BB NB A
Cas P 22 22 5 49
Cas N 0 0 49 49
Cas O 12 11 26 49
  • Dans le cas P, les arcs sont en grande majorité monochromes, soit noirs-noirs, soit blancs-blancs. Le constat réalisé sur les noeuds d’autocorrélation positive est confirmé.

  • Dans le cas N, la totalité des arcs sont bicolores traduisant une autocorrélation négative.

  • Dans le cas O, aucune configuration n’émerge renvoyant à une absence d’autocorrélation.

Il est possible construire un test sur ces statistiques.

Si Xiest une variable aléatoire qui prend la valeur 0 quand la i eme observation est blanche et 1 quand elle est noire alors on peut déterminer le nombre de NN, NB et de BB, en intégrant la matrice de contiguïté Cij.

message URL form522.gif

Il est possible de déterminer les lois de probabilité suivies par NN et NB sous l’hypothèse nulle d’absence d’autocorrélation spatiale.

Deux hypothèses sont possibles :

  • Hypothèse N : chacune des observations est une variable de Bernouilli, indépendante des autres observations avec une probabilité p pour les noeuds noirs et q =1-p pour les noeuds blancs. Dans ce cas, on fixe les arcs et on s’intéresse à la couleur qu’ils prennent.

  • Hypothèse R : Les observations sont reparties aléatoirement entre les différentes localisations. Une proportion p de ces observations a la valeur 1. Dans ce cas, on fixe une couleur et on s’intéresse à sa localisation sur les arcs.

Les statistiques NN, NB et BB, centrées réduites suivent asymptotiquement une loi normale :

message URL form523.gif

Pour chacune de ces hypothèses, on peut calculer les espérances E(NN) et E(NB) et les variances V(NN) et V(NB) des statistiques NN et NB.

Espérances et variances de NN et NB sous l’hypothèse N

message URL form524.gif
message URL form525.gif
message URL form526.gif
message URL form527.gif

Espérances et variances de NN et NB sous l’hypothèse R

message URL form528.gif
message URL form529.gif
message URL form530.gif
message URL form531.gif

avec

n : le nombre d’observations i.e. le nombre de noeuds du graphe

n1 : le nombre d’observations avec xi=1 (noeuds noirs)

n2 : le nombre d’observations avec xi=0 (noeuds blancs)

n1+n2=n, message URL form530-1.gif, message URL form530-2.gif, et p+q=1
message URL form530-3.gif
message URL Wsur2.gif le poids total des arcs
ci= message URL sommecij.gif et cj= message URL sommecij.gif
message URL form530-4.gif
message URL form530-5.gif

Dans le cas des trois configurations de répartition des couleurs des noeuds pour des hexagones, les résultats sont les suivants :

Tableau 5.2 : Moyennes et variances sous les hypothèses N et R
Hypothèse N Hypothèse R
E(NN) 12,25 19,44
V(NN) 11,92 3,59
E(NB) 24,50 12,25
V(NB) 25,16 11,97

Les résultats des tests sont présentés dans le Tableau 5.3.

Tableau 5.3 : Résultats des tests sur les 3 configurations
Cas P Cas N Cas O
Valeur de NN 22 0 12
Hypothèse N 2,2 -2,8 -0,06
Hypothèse R 5,3 -6,3 0,04
Valeur de NB 5 49 26
Hypothèse N -5,6 7,0 0,43
Hypothèse R -5,8 6,9 0,24

Avec un seuil de risque de 5 %, le quantile de la loi normale est égal à 1,96. L’hypothèse nulle d’absence d’autocorrélation est donc rejetée dans les cas P et N. En revanche, elle est acceptée dans le cas O.

Ce test des couleurs est non seulement valable pour un ordre 1 de contiguïté mais également pour des ordres plus élevés. En outre, jusqu’à présent nous avons retenu des variables qualitatives dichotomiques. Il est possible d’envisager aussi bien deux modalités que des couples de modalités. La généralisation des tests dans ces cas n’est cependant pas très aisée. Enfin, appliqué principalement sur des variables qualitatives, ce test est applicable pour des variables quantitatives transformées en variables qualitatives. Ainsi pour des niveaux de densité communale par exemple, en fixant un seuil de densité, on définit deux nouvelles variables qualitatives :

  • Noire si la densité de population communale est inférieure à x hab./km²

  • Blanche si la densité de population est supérieure ou égale à x hab./km²

Mais cette astuce de transformation conduit à perdre de l’information sur les observations. Les résultats sont, en outre, très dépendants du seuil retenu pour définir les deux variables. D’autres tests sont plus adaptés à ce genre de variables.