2.Les différentes méthodes de sondage (Ardilly, 1994)

Sondage probabilistique

Les sondages probabilistiques possèdent deux avantages majeurs :

  1. La connaissance des probabilités d’appartenance à l’échantillon de chaque individu de la population permet de calculer une marge d’erreur sur les résultats obtenus ;
  2. Le tirage aléatoire fournit aux utilisateurs des résultats une protection contre une sélection biaisée de l’échantillon (avec bien sûr des risques de biais dus au questionnaire ou aux non-réponses qui subsistent)

Toutefois, pour réaliser un sondage aléatoire simple ou stratifié, il est nécessaire de disposer de la base de sondage, ce qui est rare.

Sondage aléatoire simple

Il s’agit de tirer dans la population (de taille N) un échantillon de taille fixée (n) sans remise. Les critères de sélection étant simplement les identifiants, chaque personne a la même probabilité d’être sélectionnée. Il est donc préférable d’utiliser cette méthode sur des populations relativement homogènes.

Il est en fait assez rarement utilisé car si la population est très hétérogène par rapport au problème étudié, les résultats obtenus par l’intermédiaire de ce type de sondage peuvent être peu précis. Si on possède des informations sur les individus qui composent la population permettant de les répartir en sous-groupes plus homogènes, on aura intérêt à utiliser le sondage stratifié. D’autre part, lorsque l’on ne dispose pas de base de sondage ou pour réduire les coûts de l’enquête, on utilisera plutôt des sondages par grappes ou à plusieurs degrés. Cependant, il sert de base pour des méthodes de sondage aléatoire plus complexe.

La précision des résultats dans un sondage aléatoire simple est facile à calculer. Elle sert d’approximation au calcul de la précision des résultats, par exemple dans le cas de sondages empiriques où, théoriquement, on ne pourrait pas calculer la précision des résultats.

Sondage stratifié

Si les individus de la population initiale sont très « différents », les uns des autres, il peut être intéressant de constituer des strates homogènes au sein desquelles sont réalisées des tirages aléatoires simples.

La stratification consiste  :

  • à utiliser une information supplémentaire X (appelée variable de contrôle ou variable de stratification) que l’on possède sur chacun des individus de la population, information permettant de réaliser une partition de cette population en classes appelées strates. La stratification améliorera d’autant la précision que les strates seront homogènes par rapport aux variables étudiées.
  • A tirer un échantillon aléatoire de taille fixée dans chaque strate ; l’estimation finale est alors obtenue en agrégeant les résultats obtenus dans les différentes strates et en tenant compte de la taille de population dans les différentes strates.

Plusieurs techniques existent pour calculer la taille de l’échantillon par strate, mais la plus courante est l’allocation proportionnelle. Il s’agit de prendre une proportion d’individus dans la strate h (par rapport à la taille de la strate) équivalente à la proportion de population dans cette strate (par rapport à la population totale), ce qui s’exprime de la manière suivante :

avec : nh : taille de l’échantillon dans la strate h

n : taille de l’échantillon

Nh : taille de la strate h dans la population totale

N : taille de la population totale

Cette répartition peut paraître naturelle, mais elle n’est pas toujours la meilleur. On peut adopter d’autres types de répartition de l’échantillon. Ce choix va dépendre des objectifs de l’enquête.

Sondage empirique : présentation de la méthode des quotas

La méthode de sondage empirique la plus utilisée en France est la méthode des quotas. Elle est généralement moins coûteuse que les méthodes aléatoires où l’enquêteur, en cas d’absence doit revenir jusqu’à trois ou quatre fois à l’adresse qui lui a été indiquée. D’autre part, elle ne nécessite pas l’existence d’une base de sondage, mais seulement des informations statistiques sur la population enquêtée. Cette méthode vise à confectionner une « maquette » de la population étudiée. Cette construction se fait à partir de la connaissance statistique de caractères qualitatifs ou de variables quantitatives considérés comme importants vis-à-vis des variables étudiées. Le principe de la méthode des quotas est donc très simple : on choisit quelques caractéristiques dont on connaît la distribution dans la population étudiée (pour une enquête courante sur les individus en France, on choisira généralement des critères tels que l’âge, le sexe ou la catégorie socioprofessionnelle du chef de ménage), puis on donne à chaque enquêteur un plan de travail qui lui impose le respect de certaines proportions au sein de ses enquêtés.

Le choix des personnes enquêtées est laissé à l’initiative de l’enquêteur, sous réserve qu’il respecte la répartition fixée. La tâche sera assez facile pour les premières interviews ; elle peut être plus délicate en fin d’échantillon, où il faudra trouver des individus appartenant à une catégorie déterminée sur chacun des critères.

Le choix des critères sera limité par les informations statistiques dont on dispose sur la population étudiée et qui permettent de fixer la répartition à obtenir pour obtenir l’échantillon. Ces informations pourront provenir de grandes enquêtes publiques (recensement de l’INSEE) ou d’études spécifiques antérieures. Il faudra en outre veiller à ce que les définitions appliquées par les enquêteurs pour choisir es personnes à interroger soient les mêmes que celles qui ont servi pour établir les statistiques utilisées.

Concernant le choix des variables qui tiennent lieu de quotas, il faut respecter les principes suivants :

  • Les quotas doivent être aisément identifiables ;
  • Il ne faut multiplier les quotas sous peine d’introduire des biais supplémentaires en compliquant de manière exagérée le travail des enquêteurs ;
  • Parmi les variables dont on connaît la distribution statistique dans la population, il faut choisir les critères les plus liés au problème étudié (à condition qu’ils soient aisément identifiables par l’enquêteur).

La méthode des quotas est donc moins coûteuse et plus rapide qu’une méthode aléatoire. Toutefois, elle donne des estimations biaisées : les différentes catégories de population présentent des probabilités différentes et inconnues d’être touchées par un enquêteur. Pour se prémunir contre ce biais, il faut donner à l’enquêteur des consignes visant à se rapprocher le plus possible des conditions de tirage à probabilités égales (par exemple, travailler après 19 h, les samedi et dimanche…), et par le contrôle a posteriori du travail des enquêteurs.