2.3.1 Estimation et biais d’attrition

Le chapitre introductif présente en détail la base de données utilisée dans nos estimations et analyses statistiques. L’échantillon a été constitué par un tirage aléatoire de 613 entreprises en 1990 (11% de la population mère). Ces entreprises sont suivies en amont à partir de 1986 et en aval jusqu’à 1996). Au final, il reste 428 entreprises pour 1986 et 416 pour 1996.

Ce mode de constitution de l’échantillon peut entraîner un biais dans les estimations si le mécanisme de sélection est endogène, c’est à dire lié au comportement étudié. En effet, l’échantillon n’est pas constitué par un tirage aléatoire des entreprises pour chacune des années. Les caractéristiques déterminant le fait que les entreprises sortent de l’échantillon après 1990 ou ne sont pas présentes avant 1990 sont peut-être liées au phénomène étudié (i.e. l’accès au crédit). Dans ce cas, la correction de ce biais d’attrition suppose la prise en compte du processus de sélection dans l’estimation du modèle.

Une première solution consiste à appliquer la méthode en deux étapes proposée par Heckman (1979). Cependant, comme l’indiquent Guillotin et Sevestre (1994, page 127), ’‘la généralisation de cette méthode lorsqu’on travaille sur données de panel et que l’on souhaite prendre en compte l’existence de spécificités individuelles non observées se révèle extrêmement lourde à mettre en oeuvre’’. Aussi, proposent-ils d’utiliser la solution proposée par Nijman et Verbeek (1992): « ‘ils suggèrent d’estimer le modèle en incluant comme régresseur(s) supplémentaire(s) une variable indicatrice valant 1 si l’individu est présent sur toute la période, et/ou une autre variable indicatrice valant 1 si l’individu était présent à la période précédente ou encore le nombre de périodes de présence de l’individu [...] la significativité des coefficients associés à ces variables est alors un indice de l’existence de biais de sélection et leur inclusion est censée permettre une correction de ce biais...’ ».

A la suite de Sabatier (2000), nous adoptons une méthode intermédiaire: nous estimons la probabilité de présence continue dans l’échantillon. Cette probabilité est alors introduite comme variable explicative dans le modèle estimé.

La variable expliquée est égale à un lorsque l’entreprise est présente sur toute la période et zéro sinon. Les variables explicatives correspondent aux caractéristiques des entreprises pour l’année 1990, seule année où toutes les entreprises sont présentes. Elles comprennent les ratios masse salariale sur effectif, capital sur effectif, solde d’exploitation sur capital, frais financiers sur chiffre d’affaires, investissement sur capital, exportations sur chiffre d’affaires, des variables indicatrices de la taille (grande / petite), du statut (privée marocaine / étrangère / publique), de la localisation (Casablanca / hors Casablanca), du secteur favorisé ou non (AA / A / E / EE).

Comme la variable endogène est une variable bivariée, l’estimation utilise un modèle Probit binomial. Les résultats de l’estimation sont donnés au tableau suivant:

Tableau 24. Estimation de la probabilité de présence continue dans l’échantillon
Modèle Probit binomial
613 entreprises - 1990
Constante 0,452
0,518
Salaires / employés 0,005 * *
0,029
Capital / effectif 0,0002
0,573
Solde / capital 0,013
0,380
Frais financiers / chiffre d’affaires -3,916 * * *
0,001
Investissement / capital -0,394
0,153
Grande 0,601 * * *
0,000
Privée marocaine -1,106
0,104
Etrangère -0,948
0,169
Casablanca -0,018
0,875
Exportation / chiffre d’affaires -0,577 * * *
0,005
Secteur très favorisé (AA) Référence
Secteur favorisé (A) 0,503 * * *
0,006
Secteur peu favorisé (E) 0,553 * *
0,013
Secteur non favorisé (EE) 0,474 * *
0,027
Logarithme de la vraisemblance -379
Pseudo R2 0,104
[Note: Les probabilités de rejet sont indiquées en petit caractère. *: significatif au seuil de 10%,
**: significatif au seuil de 5%, ***: significatif au seuil de 1%.]
Tableau 25. Valeurs observées et prédites par le modèle
Prédites
0 1
Total
Observées 0 257 71 328
1 149 136 285
Total 406 207 613

Les entreprises ayant une plus forte probabilité de présence continue dans l’échantillon sont les entreprises de grande taille, peu endettées, rémunérant bien leurs employés, exportant peu et appartenant aux secteurs les moins favorisés.