2.2. Le modèle économétrique

L’effet d’un passage par une convention de conversion est mesuré à partir du modèle causal de Rubin (1974) élargi ; il permet de tenir compte de deux formes de sélection endogènes successives : participation à une convention de conversion et retour à l’emploi.

2.2.1. Présentation du modèle

Le passage par une convention de conversion est représenté par une variable indicatrice T ₀ qui prend la valeur 1 si le chômeur licencié adhère à une convention, et la valeur 0 dans le cas contraire. Cette variable est supposée être déterminée par un indice latent T ₀ * lui-même linéairement dépendant d’un vecteur de variables explicatives Z ₀ et d’un résidu V ₀ , de sorte que l’on peut écrire :

T ₀ = 1 (T ₀ * > 0) = 1 (Z ₀ θ ₀ + V ₀ > 0) (1)

où θ ₀ est un vecteur de paramètres inconnu, et 1(.) est une fonction indicatrice prenant la valeur 1 si l’expression entre parenthèses est vraie, et 0 sinon.

La transition vers un CDI est la variable sur laquelle nous souhaitons mettre en évidence un effet de la convention. Elle est l’équivalent de la variable de résultat dans la terminologie de Rubin (1974). Cette transition peut intervenir soit à l’issue de la période passée dans le dispositif de convention, soit au terme de la période de chômage. La corrélation non nulle (positive ou négative) que le résidu V ₀ de l’équation d’accès au dispositif peut entretenir avec le résidu affectant l’équation de la variable de résultat est à l’origine du biais de sélection à l’entrée dans le dispositif. Pour tenir compte des transitions directes vers l’emploi qui surviennent à l’issue de la période passée en convention de conversion, nous introduisons une seconde variable dichotomique T ₁ qui prend la valeur 1 si l’adhèrent au dispositif trouve un emploi directement à l’issue de la convention, et la valeur 0 dans le cas contraire. Cette variable est supposée être déterminée par un indice latent T ₁ * lui-même linéairement dépendant d’un vecteur de variables explicatives Z ₁ et d’un résidu V ₁ , de sorte que :

T ₁ = 1(T ₁ * > 0) = 1(Z ₁ θ ₁ + V ₁ > 0) (2)

où θ ₁ est un vecteur de paramètres inconnu. Si le résidu V ₁ est supposé être distribué selon une loi normale standard N(0,1), la probabilité pour qu’un travailleur licencié de caractéristiques observables (Z _0, Z ₁ ) adhère à une convention de conversion et trouve directement un emploi à l’issue de la convention de conversion est égale à :

Dans cette expression, T ₂ est une variable dichotomique qui prend la valeur 1 si l’emploi trouvé relève d’un CDI et la valeur 0 s’il s’agit d’un emploi précaire, Z ₂ est un vecteur de covariables observables,  ₂ est un vecteur de paramètres associé (inconnu), et V ₂ est un résidu supposé suivre une loi normale standard N(0,1). Avec cette spécification séquentielle, la probabilité d’adhérer à une convention de conversion et d’être embauché sur un CDI au terme du dispositif est donc égale à :

Lorsque les résidus (V ₀ , V ₁ , V ₂ _{) sont distribués selon une loi normale trivariée standard, le modèle correspondant est un probit trivarié. Remarquons qu’une autre possibilité aurait été de modéliser la situation suivant la convention (embauche directe sur CDI , embauche sur CDD, ou bien passage en chômage) à l’aide d’un modèle probit multinomial à trois modalités. Cette solution, qui peut être jugée plus cohérente du point de vue des logiques de décision sous-jacentes, présente toutefois le défaut d’accroître le nombre de variables aléatoires (quatre au lieu de trois dans le modèle probit trivarié), et d’être de ce fait plus difficile à mettre en œuvre
⁹⁸
. Une dernière possibilité eût été d’utiliser un modèle probit ordonné à trois modalités : entrée en chômage, embauche sur CDD, embauche sur CDI. Mais le choix d’un ordre particulier, supposé refléter les préférences unanimes des travailleurs, fût en ce cas particulièrement arbitraire.}

Dans ce modèle, l’issue du chômage est soit l’embauche sur CDI, soit l’embauche en emploi précaire. Les durées de chômage précédant ces transitions sont représentées par deux variables aléatoires distinctes, notées (Y ₁₁ , Y ₁₂ ) et (Y ₀₁ , Y ₀₂ ) selon que le chômeur licencié passe ou non par une convention de conversion. Chacune de ces variables, ou plus exactement son logarithme, est supposée être engendrée par un modèle de régression linéaire de la forme :

où Xjk est un vecteur de variables explicatives, βjk est un vecteur de paramètres associé à Xjk, et Ujk est un résidu centré ⁹⁹ . Les résidus Uj ₁ et Uj ₂ (j = 0, 1) peuvent être corrélés, de sorte que le modèle de durée de chômage engendrant les transitions du chômage à l’emploi pour chacun des deux groupes (bénéficiaires et non-bénéficiaires du dispositif) est un modèle de durée à risques concurrents dépendants (Han et Hausman, 1990). Ce modèle de durée, qui repose sur l’hypothèse d’une distribution log-normale pour les durées, est un modèle à hasards accélérés, et non à hasards proportionnels (Lancaster, 1990, Florens, Fougère et Mouchart, 1996). Dans ce modèle, la dépendance entre les durées latentes associées aux différents types de transitions (ici, du chômage vers les CDI et du chômage vers les CDD) provient de la corrélation qui les lie. Dans les modèles à hasards proportionnels, cette dépendance découle généralement de la présence de composantes corrélées d’hétérogénéité non observée, composantes qui affectent proportionnellement les fonctions de hasard marginales des durées latentes.

La séquence des événements correspondant au modèle statistique est représentée sur la figure 1. Ce modèle comporte sept équations simultanées, les trois premières (notées (1)-(3) ci-dessus) portant sur des variables dichotomiques, les quatre autres (représentées par l’équation générique (4)) correspondant aux durées de chômage latentes associées à des transitions du chômage vers un emploi sur CDI ou un emploi précaire.

Figure 1. La séquence des événements pris en compte par le modèle

La séquence d’événements décrite par la figure 1 montre que seules certaines des variables endogènes du modèle peuvent être observées. Considérons trois exemples. Si le travailleur licencié est directement embauché en CDI à l’issue d’un passage par une convention, seules sont observées les variables dichotomiques endogènes (T ₀ , T ₁ , T ₂ _{). Pour un travailleur bénéficiaire du dispositif qui entre en chômage à l’issue de la convention puis en sort pour être embauché en CDD, sont observées les variables (T

₀

,

T

₁

,

Y

₁₂

_{). Enfin, si le travailleur licencié n’a pas accès au dispositif et est toujours en chômage à la fin de la période d’observation, seule la variable T

₀
est pour lui observée ; les deux durées de chômage (Y

₀₁

, Y

₀₂
) sont censurées à droite.}}

Nous faisons l’hypothèse que les résidus de ce modèle à équations simultanées sont distribués selon une loi normale multivariée, de moyenne nulle et de matrice de variances covariances Σ dont la forme est la suivante :

Cette matrice de variances et covariances est celle qui a été effectivement estimée. Nous avons essayé d’estimer des matrices plus générales, contenant moins de zéros, mais ces tentatives sont restées sans succès, les procédures de maximisation des fonctions de vraisemblance correspondantes n’ayant pu converger. Nous n’avons pu faire autrement que d’imposer, dans la version estimée du modèle, l’indépendance entre le résidu V ₁ de l’équation d’embauche directe au terme de la convention et tous les autres résidus du modèle. En particulier, le modèle dans lequel ce résidu est potentiellement corrélé au résidu V ₀ de l’équation d’accès au dispositif n’a pu être estimé, bien qu’il soit en principe identifié au moyen de l’hypothèse de normalité des perturbations. Pour le reste, le modèle retenu présente l’avantage de laisser libres les corrélations entre le résidu V ₀ de la principale variable de sélection, à savoir celle représentant l’accès au dispositif que nous souhaitons évaluer, et tous les autres résidus du modèle (à l’exception de V ₁ ). Par ailleurs, ont pu être également estimées les corrélations entre les résidus des durées associées aux transitions du chômage vers les emplois en CDI et CDD dans les deux « régimes », avec et sans passage par une convention de conversion. Cette spécification correspond à l’éventuelle dépendance des « risques concurrents » dans les modèles de durée de chômage relatifs à ces deux régimes.

Notes

98.

Cette spécification alternative doit être estimée par maximum de vraisemblance simulée. Nos tentatives pour estimer ce modèle alternatif sont restées infructueuses. A l’inverse, pour le modèle probit trivarié, nous avons pu obtenir sans trop de difficultés la convergence de l’algorithme de maximisation.

99.

Le vecteur X _0k de régresseurs affectant le logarithme de la durée de chômage lnY _0k associée à une transition de type k pour un individu n’adhérant pas à une convention peut être différent du vecteur X _1k de régresseurs influençant le logarithme de la durée de chômage lnY _1k du même individu s’il adhérait à une convention.