3.1 La notion d’interaction

Cette notion renvoie aux relations plus ou moins intenses qu’il existe entre des unités spatiales. « L’analyse des effets exercés sur une variable par les autres n’utilise pas vraiment toutes les caractéristiques de l’espace tant qu’elle n’est pas combinée avec une analyse des interactions entre observations. L’espace, en effet, n’est pas composé d’unités isolées les unes des autres. Ce qui se passe dans chacune d’entre elles peut influencer les autres : il y a interaction spatiale » (Jayet, 1993, p.7). A l’espace des observations se rajoute l’espace des interactions entre ces dernières.

Cet espace des interactions est déterminé par la proximité relative des unités. Comme l’écrit Tobler ((1979) cité par Anselin 1988, p.8) : « everything is related to everything else, but near things are more related than distant things  ».

En l’état cette notion est cependant non opératoire. L’une des étapes déterminantes de l’économétrie spatiale est de la transposer en répondant à la question : quelle formalisation retenir pour rendre compte de l’ordonnancement des unités et des variables dans l’espace ?

Une approche par le voisinage

Sur un plan formel, la première traduction qu’elle reçoit est celle de voisinage et de plus proche voisin dans le cadre de la topologie. Considérons un système S avec n unités spatiales indicées i=1, 2,..., n et une variable x pour chacune de ces unités. La série de voisins pour l’unité spatiale i est définie comme la série des unités j pour lesquels xj est comprise dans la forme fonctionnelle de la probabilité conditionnelle de xi, sachant x.

Formellement, cela s’écrit :

message URL form510.gif

avec xj les vecteur des observations de xj ∀j ∈ J et x le vecteur de l’ensemble des valeurs x.

Réciproquement pour un série de voisins j pour i cela correspond à :

message URL form511.gif

Mais aucune information n’est donnée dans ces définitions sur la position relative de ces unités spatiales. Anselin (1988, p.17) propose d’introduire cette dimension par le biais de la distance dij

message URL form512.gif

avec siun seuil pour chaque unité spatiale.

Cette approche par les probabilités conditionnelles strictes se heurte cependant à l’impossibilité de distinguer un voisinage de premier ordre et d’ordre supérieur. La notion de contiguïté permet de dépasser cette limite comme nous allons le voir.

Une approche par la contiguïté

Les premières mesures de la dépendance spatiale ont été réalisées par Moran (1948) et Geary (1954). Ils font appel à cet effet à la notion de contiguïté. Cette dernière est proche de celle de décalage temporel dans les séries chronologiques. On dira que deux zones sont contiguës si elles ont une frontière commune. Ainsi renseigné pour chacune des zones de l’espace étudié, il est possible de synthétiser ces effets spatiaux sous forme d’une matrice de contiguïté (C). Cette dernière est une matrice carrée symétrique comportant autant de lignes et de colonnes que de zones ou d’unités spatiales d’observation.

message URL form513.gif

avec

cij=1 si i et j sont des observations contiguës,

cij=0 si i et j sont des observations non contiguës.

Cette définition de la contiguïté suppose l’existence d’une carte avec des frontières clairement identifiables.

Cliff et Ord (1973) définissent d’autres formes de contiguïté en retenant un espace défini par des zones régulières. Par analogie au jeu d’échec, ces contiguïtés sont appelées le cas de la tour, le cas du fou et le cas de la dame.

La contiguïté définie sur la base de la frontière commune entre les cases. Cette situation correspond au déplacement de la tour. Dans la représentation ci-dessous, les cases B sont contiguës à la case A.

message URL fig52.gif
Figure 5.2 : Contiguïté (le cas de la tour)

En affectant des coordonnées à la partie centrale du quadrillage (Figure 5.3), il est possible de représenter la matrice de contiguïté (Figure 5.4).

message URL fig53.gif
Figure 5.3 : Coordonnées des cases de la partie centrale de l’échiquier

La matrice de contiguïté construite à partir de la répartition dans l’espace des observations donne une matrice carrée de dimension 9.

message URL fig54.gif
Figure 5.4 : Matrice de contiguïté dans le cas de la tour

La contiguïté définie sur la base des sommets communs entre les cases. Cette situation correspond au déplacement du fou. Les cases C sont contiguës aux cases A (Figure 5.5).

message URL fig55.gif
Figure 5.5 : Contiguïté (le cas du fou)

En reprenant les coordonnées affectées aux cellules pour le cas de la tour, il est possible de représenter l’occupation de l’espace dans cas du fou par une matrice carrée de dimension 9 (Figure 5.6).

message URL fig56.gif
Figure 5.6 : Matrice de contiguïté dans la configuration du fou

La contiguïté définie sur la base des sommets et des bordures. Cette situation correspond au déplacement de la dame. Les cases contiguës sont celles qui ont des sommets ou des bordures communs. Les cases B et C sont contiguës à la case A (Figure 5.7).

message URL fig57.gif
Figure 5.7: Contiguïté (le cas de la dame)

En reprenant les coordonnées affectées aux cellules pour le cas de la tour, il est possible de représenter l’occupation de l’espace dans cas de la dame par une matrice carrée de dimension 9 (Figure 5.8).

message URL fig58.gif
Figure 5.8: Matrice de contiguïté dans la configuration de la dame

Envisagée à l’ordre 1, comme cela a été fait jusqu’à présent, la contiguïté peut l’être également à l’ordre n (n étant un entier positif) pour saisir la plus ou moins grande proximité des espaces. Certaines observations peuvent être en effet proches sans être pour autant contiguës.

message URL form514.gif

avec

cij=1 si n frontières sont à franchir entre ces deux espaces.

cij=0 sinon.

Plus les observations sont éloignées, plus l’ordre de contiguïté est élevé. Il s’agit alors d’une fonction à valeurs positives vérifiant les deux propriétés suivantes :

message URL form515.gif
message URL fig59.gif
Figure 5.9 : Contiguité à un l’ordre n

Les cases C et D sont contiguës à la case A au second ordre suivant le critère de la tour. Elles sont contiguës à la case B dans le cas d’une contiguïté à l’ordre 1.

La régularité ou des non des zones géographiques comme support des observations n’est pas sans incidence. En cas de zones régulières, les contiguïtés de même ordre sont équivalentes et ont la même pondération. A contrario, pour des configurations irrégulières les frontières communes entre les espaces ne sont plus de même taille. Certains espaces, bien que non contigus, peuvent être proches. Affecter alors la même pondération aux contiguïtés de même ordre pour ces zones irrégulières n’est pas immédiatement acceptable.

Les interactions c ij peuvent être alors fonction de la longueur de la frontière commune entre les deux zones, des moyens de communications entre les deux zones, de la taille de la zone émettrice de la zone d’interaction, etc.

Cette notion de contiguïté est déclinée pour des zones, comme nous l’avons fait jusqu’à présent. Elle est envisagée également pour des données ponctuelles comme des centroïdes de zones.

Ainsi, pour la contiguïté d’ordre 1, deux observations ponctuelles sont contiguës si elles sont reliées par un arc. La contiguïté d’ordre n, pour des données ponctuelles, est le nombre d’arcs compris entre les données i et j.

message URL form516.gif

avec

cij=1 si le plus court chemin pour aller de i à j comporte n arcs

cij=0 sinon.

On parlera alors de distance de contiguïté.

Cette matrice peut être représentée sous forme d’un graphe, appelé graphe de contiguïté. Dans le cadre des cantons rhônalpins, le graphe de contiguïté établi par Jayet et al. (1999) relie par des arcs tous les centroïdes de ces derniers.

message URL carte59.gif
Carte 5.9 : Graphe de contiguité des cantons rhônalpins

Ces données ponctuelles peuvent être là aussi ordonnées suivant des formes géographiques régulières ou irrégulières.

Les interactions sont alors fonction de distances géographiques ou euclidiennes. Mais la tyrannie de la distance n’est identique en tout point. D’autres formes de distances sont alors privilégiées, plus à même de rendre compte de cette résistance au franchissement de l’espace comme des distances temps, des distances réseaux, des distances fondées sur le coût généralisé de déplacements, etc.

Les matrices de contiguïté initiale C=cij sont généralement normalisées (W). Cela signifie que la somme des lignes de ces matrices est égale à l’unité.

message URL form517.gif

avec

message URL form517-1.gif

Le concept de contiguïté binaire mis en oeuvre par Moran et Geary a ainsi évolué dans la recherche d’une meilleure prise en compte des interactions et des supports sur lesquelles elles intervenaient. Des formulations plus adaptées ont été proposées.

Dans le cas général, l’interaction entre deux observations est formalisée telle que l’interaction entre deux observations i et j, notée wij, soit une fonction de la distance.

message URL form518.gif

avec dij la distance entre les points i et j et f une fonction décroissante

La suggestion originale de Cliff et Ord (1973, 1981) consiste à combiner une mesure de la distance (l’inverse de la distance, l’exponentielle négative de la distance) et la part de la longueur totale de la frontière de la zone i commune avec la zone j.

message URL form519.gif

avec dijla distance entre les observations i et j, βij la part de la frontière commune entre i et j, a et b deux paramètres.

De manière proche, Dacey (1968) suggère de prendre en compte également la surface relative des unités spatiales.

message URL form520.gif

avec dijla distance entre les observations i et j, αij la surface de la zone i relativement à la surface totale des zones, βij la part de la frontière commune entre i et j.

Ces deux approches sont très liées à la configuration physique des unités spatiales. Elles sont moins adaptées dès lors que l’on travaille avec des données ponctuelles et dans le cas où les interactions spatiales envisagées sont déterminées par des facteurs économiques, lesquels ne sont pas toujours déterminés par les seuls éléments de configurations géographiques comme la longueur des frontières communes.

En conséquence, plusieurs auteurs ont proposé de recourir à des matrices de poids plus en lien avec les phénomènes étudiés. Bodson et Peeters (1975) introduisent un coefficient général d’accessibilité, sous la forme d’une fonction logistique. Elle intègre l’impact des voies de communication existantes entre des régions, comme les routes, les voies de chemin de fer, etc. Formellement, elle s’écrit :

message URL form521.gif

avec kj relatif à l’importance des voies de communication dans la zone j, dijla distance entre les centroïdes des deux zones, a, b et c les paramètres à estimer.

De manière courante également trois types de matrices de poids sont utilisées dans les estimations, W 1 où l’interaction entre les points est inversement proportionnelle à la distance euclidienne, W 2 où l’interaction entre les points est inversement proportionnelle au carré de la distance euclidienne entre les points, et W 3 correspondant à un seuil de distance variable selon les phénomènes observés.

Plus généralement, le choix de ces matrices de poids n’est pas sans poser problème. Il apparaît souvent comme exogène, séparé du reste de l’analyse spatiale, sans réelle justification. Cette sélection est à l’origine de difficultés dans l’estimation et l’interprétation des résultats. Ainsi, sur un plan inférentiel, certaines relations peuvent être fausses. Cependant le choix de ces matrices ne fait pas pour autant l’objet d’un consensus dans les analyses d’économétrie spatiales. Aora et Brown (1977), Hordijk (1979) proposent de retenir des matrices de poids neutres lorsque des modèles avec des résidus sont utilisés. La neutralité est saisie par la contiguïté binaire. L’utilisation de matrices de poids généraux avec une spécification a priori est aussi mise en avant.

Anselin (1980, 1984a) plaide pour un choix judicieux de la matrice de poids se rapportant aux concepts généraux de la théorie de l’interaction spatiale tels que l’accessibilité et la potentialité. « The weight matrix should bear a direct relation to a theoretical conceptualization of the structure of dependence, rather than reflecting an a hoc description of spatial pattern » (Anselin, 1988, p.21).

A partir de cette notion d’interaction, des tests de mesure de la dépendance spatiale sont développés comme nous allons le voir dans la partie suivante.