§1. Problème du biais de sélection : définition des deux sources de biais de sélection

Le problème du biais de sélection ne se pose pas exclusivement lors de l’analyse de données qualitatives. De façon générale, on dit d’un échantillon qu’il est censuré ou tronqué lorsqu’une partie de l’information concernant la variable dépendante (discrète ou continue) est manquante. Reprenons l’exemple présenté dans Smits [2003]. L’auteur illustre le problème des données manquantes au travers d’une étude qui aspirerait à estimer l’effet du niveau d’éducation des femmes sur leur niveau de revenu. Le problème qui se pose dans ce cas est que de nombreuses femmes ne sont pas engagées dans un travail rémunéré et par conséquent, risquent de ne pas avoir de revenu à déclarer. Or, si une proportion importante de ces femmes n’a pas de revenus en raison de l’absence ou du faible niveau d’éducation, l’estimation de la régression de l’éducation sur le revenu comme variable dépendante risque de générer des mesures biaisées de la relation existant entre ces deux variables [Smits, 2003 : 2].

La seconde version du biais de sélection nommée « biais d’hétérogénéité » met l’accent sur les cas où l’information concernant la variable dépendante est disponible pour tout l’échantillon mais, la distribution des enquêtés par rapport à l’ensemble des catégories d’une ou plusieurs variables indépendantes a été réalisée de manière « biaisée ». Ce problème pourrait être observé dans le cas de l’analyse de l’effet de la migration sur le revenu basée sur un échantillonnage aléatoire. Une régression simple de la migration sur le revenu serait dans ce cas source de biais dans la mesure où les personnes ayant décidé de migrer se distingueraient sur bien d’autres plans mesurés ou non lors de l’étude, par rapport à ceux qui n’auraient pas adopté cette stratégie. Notons que littérature économique dans le domaine de la microfinance a largement attiré l’attention sur le biais d’hétérogénéité comme principal obstacle méthodologique à l’évaluation de l’impact des dispositifs de microfinance [Hulme, 1997].

Smits [2003] précise toutefois que la première forme de biais de sélection peut être surmontée efficacement, la seconde ne pourra en revanche l’être que partiellement [id.]. Dans les deux cas, l’estimation sera réalisée grâce au recours à la procédure d’Heckman [1976, 1979], méthode d’estimation en deux étapes. Nous présentons dans ce qui suit notre modèle et montrons en quoi le recours à une procédure de contrôle du biais de sélection s’est avérée nécessaire 208 , les principes généraux de la procédure d’Heckman sont ensuite expliqués.

Notes
208.

Malgré la disponibilité d’algorithmes efficaces, la procédure d’Heckman est encore fréquemment utilisée.