IV-2-1 - Analyse de la dépendance entre propriétés

Supposons que dans un échantillon particulier on observe un certain nombre d’événements E1, E2..., Ek, avec des fréquences o1, o2, ..., ok, appelées fréquences observées. Nous calculons les fréquences e1, e2..., ek., d’apparition de ces événements de manière à ce qu’ils aient une probabilité d’apparition identique, nous les appellerons fréquences théoriques . Dans notre cas, les événements correspondent à la présence simultanée, dans une unité documentaire, de deux modalités attachées à des propriétés différentes. Nous comparerons les fréquences observées avec une distribution où les modalités apparaissent d’une manière indépendante les unes des autres, c’est à dire avec une équiprobabilité de présence.

Le test du ² va mesurer l’écart qu’il y a entre les fréquences observées et théoriques.

message URL FIG197.gif

N étant le nombre total d’observations.

Si ² = 0 (ou proche de 0), les fréquences observées sont égales aux fréquences théoriques, les variables sont donc indépendantes. Si ² > 0 alors les deux distributions sont différentes. Plus la valeur de ² est grande, plus la différence entre les deux distributions est grande. Nous ne pouvons cependant déterminer si cette différence est structurelle ou bien liée au hasard. Le test de signification peut nous donner un indice.