B. La quantification au travers de l’agrégation statistique et la mise en relation économétrique

L’usage de la statistique constitue la première étape du travail de quantification des données d’enquête. Basée sur des catégorisations de la réalité observée, une enquête statistique consiste à observer une certaine population et à déterminer sa répartition selon un certain nombre de critères ou caractères statistiques. Lorsque le caractère statistique est un nombre résultant d’une mesure (âge, taille, nombre d’enfants, revenu, etc.) on parle de caractère quantitatif, quand ce caractère n’est pas chiffré (sexe, type d’activité exercée, etc.), on parle de caractère qualitatif ou catégoriel. Or, une fois choisies les variables à mesurer et une fois l’information collectée au travers du travail de terrain, nous obtenons une série de données brutes.

Deux sous-domaines de la statistique se préoccupent de la manière dont ces données sont utilisées : la statistique descriptive et l’inférence statistique. La première fournit divers outils permettant de décrire les données. Quant à la seconde, elle constitue à partir du traitement descriptif des données à appliquer à la série concernée des méthodes probabilistes visant à extrapoler, c’est-à-dire à généraliser, les résultats obtenus sur un sous-échantillon représentant une portion restreinte de la population concernant à la population globale dont ce sous-échantillon est représentatif. Nous nous limiterons dans ce travail à l’usage de la statistique descriptive.

En revanche, si l’on souhaite mettre en lumière et exprimer quantitativement des relations entre divers phénomènes issus des données empiriques, il faut avoir recours à l’économétrie. Nous utiliserons pour cela une régression linéaire multiple. Cet instrument cherchera à déterminer dans notre cas, une relation linéaire entre plusieurs variables explicatives (ou exogènes) et une variable déterminée (ou endogène) à partir d'un ensemble de n observations qualitatives ou quantitatives. On suppose donc que la variable dépendante y est fonction de m variables x 1,... , x m :

La forme générale est la suivante :

où i = 1,2,...,n

avec Yi : variable expliquée (ou à expliquer)

Xi : variable explicative

bi : paramètres à estimer

ui : erreur aléatoire non observable

La méthode de régression multiple va estimer les paramètres bi .

Le recours à ces instruments interviendra différemment tout au long de ce travail : si la statistique descriptive sera mobilisée tout au long pour appuyer et parfois éclairer nos analyses qualitatives, l’économétrie ne sera quant à elle mobilisée qu’à un seul moment de la démonstration.