2.2.1. Présentation du modèle

Dans ce modèle, le passage par une convention de conversion est représenté par une variable indicatrice T qui prend la valeur 1 si le chômeur licencié adhère à une convention, et la valeur 0 sinon. Cette variable est supposée être déterminée par un indice latent T * lui-même linéairement dépendant d’un vecteur de variables explicatives Z et d’un résidu V, de sorte que l’on peut écrire :

T = 1(T * > 0) = 1(Zθ + V > 0) (1)

θ est un vecteur de paramètres inconnu, et 1(.) est une fonction indicatrice prenant la valeur 1 si l’expression entre parenthèses est vraie, et 0 sinon.La durée de la période de chômage est la variable sur laquelle on met en évidence un effet de la convention. Elle est ici l’équivalent de la variable de résultat dans la terminologie de Rubin (1974). Elle est en réalité représentée par deux variables aléatoires distinctes, notées Y 1 et Y 0 , selon que le chômeur licencié passe ou non par une convention de conversion. Chacune de ces deux variables, ou plus exactement son logarithme, est supposé être engendré par un modèle de régression linéaire de la forme :

lnYj = Xj βj + Uj , j=0,1(2)

X j est un vecteur de variables explicatives a priori différent de Z, β j est un vecteur de paramètres associé à X j , et U j est un résidu centré 79 . Les résidus V, U 0 et U 1 sont supposés suivre une loi normale de moyenne 0 et de matrice de variances et covariances Σ, telle que :

Les paramètres θ, β j , σ j et ρ j (j = 0, 1) sont estimés par la technique du maximum de vraisemblance. Dans l’échantillon considéré, certaines durées de chômage sont censurées à droite car les individus correspondants sont restés continûment en chômage depuis le 2ème trimestre 1995 jusqu'à la date de fin d’observation. En ce cas, on sait seulement qu’ils sont passés ou non par une convention de conversion et que la durée de leur période de chômage est supérieure à l’intervalle de temps qui sépare leur entrée en chômage de la date de fin d’enquête. Ces observations censurées ne sont pas pour autant écartées de l’estimation. Elles sont incorporées dans la procédure sous la forme d’une fonction de survie représentant la probabilité que la durée de chômage soit supérieure à Y j (j=0,1) au sens du modèle statistique défini par (2) et (3). La censure à droite est indiquée par une variable C qui prend la valeur 1 si la durée de chômage est incomplète, 0 sinon. De ce fait, pour un échantillon de taille N, indicé par i (i=1,...N), la fonction de vraisemblance s’écrit :

Pour rendre ce modèle plus flexible, l’hétéroscédasticité des variances et covariances des résidus a été autorisée. Plus précisément, les hypothèses de spécification suivantes ont été faites :

th(.) est la fonction tangente hyperbolique qui permet de contraindre la corrélation à être comprise entre -1 et 1, δj et j étant des vecteurs de paramètres à estimer.

Notes
79.

Le vecteur X 0 de régresseurs affectant le logarithme de la durée de chômage lnY 0 d’un individu n’adhérant pas à une convention peut être différent du vecteur X 1 de régresseurs influençant le logarithme de la durée de chômage lnY 1 du même individu s’il adhérait à une convention.