Section 2. Considérations méthodologiques de l’analyse quantitative

La désignation de variables qualitatives se justifie lorsque l’on évoque des variables à valeurs discrètes, variables prenant leurs valeurs dans l’ensemble des entiers naturels [Thomas, 2000]. Cette catégorie de variables constitue la majorité des informations disponibles dans les enquêtes pour deux principales raisons. La première tient à leur facilité de collecte et la deuxième découle de l’essor des modèles économiques « expliquant des événements et non des réalisations de variables continues » [Thomas, 2000 : IX]. La nature de la variable qualitative est la résultante du travail de codification lors de l’élaboration du questionnaire d’enquêtes ou de la saisie des données, en cela elles « représentent souvent la vision qu’a leur créateur du problème à traiter » [ibid : 2]. On distingue deux grandes classes de variables discrètes :

Par convention les variables dichotomiques prennent le plus souvent la forme 0 ou 1, le chiffre 1 indiquant l’existence de la caractéristique. Par exemple la variable comportant l’information concernant le sexe de l’individu sera égale à 0 s’il s’agit d’un homme et à 1 s’il s’agit d’une femme 207 . Le nombre des valeurs ou options prises par des variables polytomiques dépendra quant à lui de l’étendue des catégories à représenter. Répondant à une grande variété d’exigences pour l’analyse, les variables polytomiques seront de différentes natures, spécificités qui devront être prises en compte lors des phases de traitement et d’analyse. Pour reprendre les exemples présentés dans Thomas [2000], les différentes catégories de variables qualitatives polytomiques sont :

Ajoutons que dans le cadre de l’analyse économique ou statistique, les variables qualitatives peuvent êtres utilisées en tant que variables explicatives (indépendantes) ou expliquées (dépendantes). Ceci signifie que dans le premier cas, les variables seront considérées comme endogènes (engendrées par le modèle) alors que dans le deuxième cas, elles seront dites exogènes ou prédéterminées [ibid : 4]. Cette distinction dans l’utilisation implique de mobiliser des techniques adéquates lors de la phase d’estimation afin d’obtenir une régression de qualité.

L’objectif n’étant pas de détailler, ici, l’ensemble des procédures disponibles dans le cadre de l’analyse économétrique des variables qualitatives, nous nous bornerons donc à la description des outils mobilisés pour rendre notre estimation fiable sur le plan économétrique (§1 et §3) et à la spécification du modèle économétrique estimé (§2), ces précisions méthodologiques sont les pré-requis de la rigueur scientifique mais éclairent également les résultats auxquels nous parvenons (Section 3).

Notes
207.

L’attribution des valeurs 0 ou 1 dépend de la caractéristique que le chercheur souhaite observer. L’estimation contient l’information sur le comportement de la variable dans les cas où la caractéristique est observée, c’est-à-dire dans les cas où la variable prend la valeur 1 et par comparaison à l’absence d’observation de la caractéristique (la valeur de la variable est 0).