4.10.3- L’inférence statistique : le test du khi-deux (χ 2 ).

Le test du χ 2 est un cas particulier de test statistique d’hypothèses créé en 1900 par Pearson. Il permet, partant d’une hypothèse et d’un risque supposé au départ, de rejeter l’hypothèse si la distance entre deux ensembles d’informations est jugée excessive. Il est particulièrement utilisé comme test d’adéquation d’une loi de probabilité à un échantillon d’observations supposées indépendantes et de même loi de probabilité. Il permet également de mesurer l’écart qui existe entre les fréquences observées et les fréquences théoriques. Il permet aussi d’établir une liaison entre les caractères qualitatifs. La technique de contrôle de liaison entre deux variables qualitatives comporte deux étapes : l’établissement du tableau de contingence et son analyse statistique.

  • Tableau de contingence
    Il s’agit d’un tableau à double entrée qui est tel que, les totaux en lignes et les totaux en colonnes aient un sens. Ce tableau comporte autant de colonnes que la première variable a des modalités, et autant de lignes que la deuxième variable a des modalités. Les colonnes et les lignes délimitent des cases dans lesquelles on inscrit les effectifs des participants vérifiant simultanément les modalités des deux variables. On complète le tableau en inscrivant les effectifs des différentes colonnes et lignes et le total général. L’effectif théorique de chaque case s’obtient en multipliant le total de la ligne par le total de la colonne puis en le divisant par l’effectif général.
  • Tableau d’effectifs observés (fo)

L1 est la somme des effectifs marginaux pour la première ligne,

L2 est la somme des effectifs marginaux pour la deuxième ligne,

C1 est la somme des effectifs marginaux pour la première colonne,

C2 est la somme des effectifs marginaux pour la deuxième colonne,

N correspond à l’ensemble des effectifs de l’enquête.

Les symboles (a, b, c, d), symboles ayant leurs homologues correspondants (a’, b’, c’, d’) dans le tableau des effectifs théoriques sont des valeurs (observées ou théoriques).

  • Calcul des valeurs théoriques de chaque case (a’, b’, c’, d’) :
  • Tableau d’effectifs théoriques (f e )

On notera le fait que les valeurs marginales (L1, L2, C1 et C2) sont identiques pour les deux tableaux (observés et théoriques).

Formule du χ 2

le Khi-deux (χ 2 ) calculé, on calcule le degré de liberté (ddl) 

où C = nombre de lignes et L = nombre de colonnes.

coefficient de contingence

  • Remarques importantes :
    • on ne calcule jamais un χ 2 avec les pourcentages mais toujours avec des effectifs réels observés.
    • Les effectifs influent directement sur la valeur du χ 2 . En effet, lorsque les effectifs doublent, la valeur du khi-deux double également.
    • Un khi-deux non significatif ne signifie surtout pas que les deux variables sont indépendantes.
    • Le khi-deux donne la probabilité pour que la distribution observée soit liée au hasard. Il n’indique pas directement la force de la liaison. La forcede laliaison peut se mesurer par le calcul du coefficient de contingence. La probabilité n’est pas un indicateur de cette force.