1. Le modèle linéaire général

Considérons le modèle vrai suivant :

message URL form51.gif

Il peut s’écrire sous forme matricielle, pour i = 1, 2...n, comme suit :

message URL form52.gif

avec :

Y le vecteur des n valeurs de la variable à expliquer ou variable endogène,

a le vecteur des coefficients vrais, fixes et inconnus,

X la matrice des valeurs des k variables explicatives ou variables exogènes,

b le scalaire représentant la constante

e le vecteur des erreurs inconnues et non observables

Le modèle observé peut s’écrire :

message URL form53.gif
message URL achapeau.gifest le vecteur des coefficients observés et aléatoires et, ε le vecteur des résidus aléatoires et observables. En supposant e aléatoire, on peut considérer message URL achapeau.gif comme un estimateur de a moyennant des hypothèses simplificatrices.

Ces hypothèses sont au nombre de huit. Les hypothèses 1, 7 et 8 son dites structurelles. Les autres sont appelées hypothèses stochastiques sur les résidus.

Hypothèse 1 : Nombre minimum d’observations

Il est nécessaire que le nombre d’observations n soit supérieur au nombre de variables k, plus 1 tel que : n>k+1.

Hypothèse 2 : Variables observables

Le passage du modèle vrai au modèle observé suppose que les variables x i et y i prennent des valeurs numériques susceptibles d’être observées sans erreur. Y est aléatoire par l’intermédiaire de ε.

Cette hypothèse relative à l’observation n’est que rarement remplie, en particulier pour les sciences sociales. Le statisticien, l’économiste sont dépendants en matière de données d’enquêtes, de recensements dont ils ne maîtrisent, dans un grand nombre de cas, ni la conception et ni l’exécution de la collecte des données.

Hypothèse 3 : Absence de biais systématique

La valeur observée pour Y n’est pas systématiquement surévaluée ou sous-évaluée. Cette hypothèse se traduit statistiquement par une espérance mathématique des résidus égale à zéro.

message URL form54.gif

Hypothèse 4 : Variance identique pour les résidus

message URL form55.gif

Lorsque cette hypothèse est réalisée, il y a homoscédasticité des résidus.

Hypothèse 5 : Indépendance des résidus

Les résidus relatifs à deux observations différentes i et i’ sont indépendants entre eux. Cela entraîne une covariance nulle entre les deux.

message URL form56.gif

Hypothèse 6 : Spécification de la loi pour les résidus

Les résidus sont gaussiens. Ils suivent une loi normale.

Hypothèse 7 : absence de colinéarité des variables explicatives

Les variables exogènes ne sont pas liées entre elles. La matrice X’X est une matrice inversible. Il n’est pas possible de trouver un vecteur λtel que :

message URL form57.gif

Hypothèse 8 : croissance de l’échantillon et moments empiriques de X finis

Quand la taille de l’échantillon des observations n tend vers l’infini, la matrice M tend vers une matrice finie. M est définie par :

message URL form58.gif

Si ces hypothèses sont remplies, on montre que les valeurs des paramètres de régression observables dans l’échantillon sont des estimateurs corrects et efficaces.

Cependant les phénomènes d’autocorrélation et d’hétérogénéité spatiales conduisent les estimations sur des données spatiales à être en infraction au regard de ces hypothèses, en particulier celles relatives à l’indépendance et l’homoscédasticité des résidus.