4.2.1 Présentation des données et spécification des modèles économétriques testés.

Le modèle économétrique que nous nous proposons de tester porte sur l’émergence d’un conflit et la durée du conflit. La probabilité d’entrer en conflit est caractérisée par deux indicateurs : la firme a-t-elle eu à faire face à des grèves au cours des trois années sur lesquelles porte l’enquête, et le conflit le plus marquant sur cette même période a-t-il été une grève ? La durée de la grève n’est disponible que si le conflit le plus marquant déclaré par l’employeur est effectivement une grève. L’ensemble des estimations permet de tester les prédictions de la théorie des grèves en jeu séquentiel. Il ne permet cependant pas de réfuter les conclusions en termes de salaire espéré ou de profit espéré, car nous ne disposons d’aucune mesure de cette valeur dans les différentes enquêtes.

Nos estimations sur l’émergence d’un conflit et sur la durée de la grève ont été effectuées à partir des données individuelles issues de l’appariement des enquêtes Employeur de REPONSE 1992 et 1998. L’échantillon étudié comprend 593 établissements.

De par la nature originale de nos données et au vu des résultats obtenus, notamment par Huberman & Young, (1995), nous avons centré notre recherche sur l’étude de l’impact des variables spécifiques à l’entreprise et à la négociation. Nous avons donc sélectionné parmi les variables disponibles, des variables sur la diffusion de l’information dans l’entreprise, sur l’organisation de la production dans l’entreprise, sur la représentation salariale, sur les conflits ainsi que des variables de contrôle telles que la taille de l’entreprise ou le secteur.

Le panel comprend malheureusement moins d’informations que les enquêtes initiales. D’une part, toutes les entreprises n’ont pas été interrogées deux fois et, d’autre part, beaucoup de questions ont été reformulées (et leurs réponses ne sont alors pas comparables), ou ne sont pas communes aux deux vagues d’enquête.

Deux estimations sur l’émergence des grèves sont réalisées. Nous disposons de deux questions sur l’émergence de la grève : la firme a-t-elle connu une grève au cours des trois années précédant les enquêtes ou une grève peut-elle être considérée comme le conflit le plus marquant que l’entreprise ait connu dans les trois années précédant l’enquête. Des réponses à ces questions ressortent des façons différentes d’appréhender le risque de grève. Ces estimations concurrentes sont toutes deux fondées sur un modèle binomial de type Probit. Puis nous estimons la durée de grève grâce à un modèle linéaire tenant compte de la correction nécessaire aux données de panel. Les durées de grèves n’étant disponibles que si l’employeur a déclaré la grève comme le conflit le plus marquant, il convient de contrôler l’existence d’un éventuel biais de sélection. Pour ce faire, la méthode classique de correction du biais de sélection d’Heckman (1979) est utilisée. Il s’agit de considérer le modèle binomial sur la grève en tant que conflit le plus marquant comme première étape du modèle. La correction est réalisée en intégrant l’inverse du ratio de Mill issu du Probit de sélection comme variable explicative de la durée de grève dans la seconde équation

Dans toutes les estimations, nous avons tenu compte du fait qu’il s’agit de données de panel qui comportent à la fois une dimension individuelle et une dimension temporelle. Les estimations sur la probabilité de grève incorporent un effet spécifique d’entreprise, via l’introduction d’un effet aléatoire. L’estimation de la durée de grève intègre, quant à elle, un effet fixe individuel, auquel on a ajouté la dimension temporelle via l’introduction d’une indicatrice de période puis d’un effet fixe temporel.

Le graphique ci-dessous retrace les estimations effectuées.

message URL Graphique0.gif
Graphique 1 : La structure des estimations

Encadré II : Quelques éléments sur le modèle linéaire sur données de panel

  • Si on dispose d’un panel de N individus (i∈[1,N]) ou entreprises suivi sur T années (t∈[1,T]), on considère une spécification linéaire de la forme : message URL form69.gif est une perturbation aléatoire supposée d’espérance nulle.
    Le choix le plus fréquent effectué en économétrie des données de panel consiste à adopter une spécification en terme de modèle à erreurs composées :
    message URL form70.gif sont des perturbations aléatoires non corrélées
    Ainsi la prise en compte d’effets spécifiques individuels ou temporels n’est pas effectuée en premier ordre :
    E(yit)=Xitb
    Le coefficient b est indépendant de l’individu i ou de l’année t, ainsi l’observation pour l’individu i à l’année t des variables explicatives Xit suffit à caractériser, par rapport aux autres observations de y, l’observation yit de la variable expliquée.
    αi caractérise l’individu ; sa prise en compte signifie que dans les variables omises (supposées indépendantes des Xit) figure une ou des variable(s) caractéristique(s) de l’individu.
    γtcorrespond à l’omission dans la liste des variables explicatives de variables dont la valeur est identique pour tous les individus en un point donné du temps.
    A la suite de Mundlak (1978) il est possible de se demander si le modèle à effets aléatoires est fondé et s’il n’est pas plus judicieux de retenir le modèle à effets fixes qui n’est autre que le modèle de la covariance, où les effets individuels sont certains.
    Il est possible de montrer que si les effets sont certains l’estimateur des double within ou estimateur intra-individuel-temporel est l’estimateur le plus efficace sans biais, alors que si les effets sont aléatoires , le meilleur estimateur sans biais est l’estimateur des moindres carrés généralisés.
    Tester l’indépendance entre effets spécifiques et variables explicatives revient à tester la validité de la spécification en termes d’erreurs composées contre le modèle correspondant aux hypothèse de Mundlak. Il est possible de tester cette indépendance par le test d’Haussman. Ce test repose sur la différence entre un estimateur convergent et efficace sous l’hypothèse de bonne spécification mais non convergent sous l’hypothèse alternative ( cas où l’estimateur des MCG est convergent, efficace et asymptotiquement normal si il n’y a pas de corrélation entre effet spécifique et explicatives H 0 ) et un estimateur convergent sous les deux hypothèses (cas de l’estimateur within)
    Sous H0, la statistique message URL form71.gifoù SCR0 (SRCM) est la somme des carrés des résidus de l’estimation du modèle à effets aléatoires (à effets fixes) et dl0 (dlM) le degrés de liberté associé.
    Dans tout travail empirique, la question de l’existence de l’effet spécifique (individuel tout d’abord) précède celle de son indépendance. On se pose alors la question de l’existence d’un effet spécifique avant de faire le test Haussman. Le test d’existence d’un effet spécifique s’effectue à partir des variances estimées des résidus des régressions within et between. Dès que la variance estimée des résidus de la régression between est supérieure à celle de la régression within, on rejette l’absence d’effets spécifiques.

Encadré III : Quelques éléments sur les modèles Probit

  • Le modèle classique
    A la base d’un modèle qualitatif à choix discret, il y a un modèle de type U i *= β i ’+ ε i, avec U i * une variable non observable et ε i une erreur distribuée normalement de moyenne 0 et de variance égale à 1.
    Dans le cas de notre étude, U i * pourrait représenter l’utilité pour le syndicat, notée U 1 * dans le cas où il fait grève et U 2 * dans le cas contraire. Cette utilité n’est pas observable. U*apparaît comme une variable latente. On peut par contre observer le fait qu’il fasse grève ou pas ; cet événement sera noté y. La variable y est dichotomique, elle prend la valeur 1 si l’événement étudié est survenu, i.e. si U1>U0, 0 dans le cas contraire.
    Ainsi la probabilité pour que la grève survienne dans une entreprise s’écrit : message URL form72.gif
    Ce type de modèle est estimé par la méthode du maximum de vraisemblance.
    S’il y a n entreprises dans l’échantillon et si les observations sont indépendantes alors la probabilité jointe s’écrit : message URL form73.gif
    La fonction de vraisemblance est alors : message URL form74.gif et son logarithme message URL form75.gif.
    Le modèle sur données de panel
    Le modèle structurel d’un Probit sur données de panel non cylindrées peut s’écrire : message URL form76.gif
    Si les εit sont normales, identiquement distribuées, alors un probit classique s’applique, dans le cas contraire il faut modéliser l’hétérogénéité. Pour ce faire, des effets aléatoires sont introduits dans le modèle.
    On peut écrire εit sous la forme:
    εitii+uit, où αi représente l’effet individuel et λi l’effet temporel.
    On a: message URL form77.gif
    Si σ σ 2 et σ λ 2 sont non nuls, alors un probit classique produit une estimation biaisée du vecteur β.Supposons que l’hétérogénéité non observée provient uniquement d’un effet individuel pour simplifier la présentation.
    Si les αi sont corrélés avec les xi, on doit spécifier une distribution de α conditionnelle à x pour éliminer le biais d’estimation. On peut noter (Heckman, 1981) que, conditionnellement à αi, les termes d’erreur message URL form78.gif sont indépendants et normalement distribués avec une espérance αi et une variance égale à 1. On peut alors écrire: message URL form79.gif
    avec: message URL form80.gif est la densité de probabilité de αi (variance: σ σ 2)

Encadré IV : Correction du biais de sélection : la méthode d’Heckman

  • Soit le modèle Y=Xb+u, avec Y la durée de grève, X représentent les caractéristiques individuelles qui influencent cette durée, u représentent les résidus qui suivent une loi normale. Dans l’enquête REPONSE les durées de grèves sont renseignées uniquement si la grève a été déclarée par l’employeur comme le conflit le plus marquant. De fait, notre analyse est réduite à ce type de conflit.
    Soit l’équation de sélection suivante, U*=Wγ+ ε, avec U* une variable non observable et ε une erreur distribuée normalement de moyenne 0 et de variance égale à 1.
    Dans le cas de notre étude, U* pourrait représenter la désutilité subie par l’employeur quand il fait face à une grève. Cette désutilité n’est pas observable.U*apparaît comme une variable latente. On peut par contre observer le fait qu’il déclare cette grève comme le conflit le plus marquant ; cet événement sera noté z. La variable z est dichotomique, elle prend la valeur 1 si l’employeur a effectivement déclaré la grève comme le conflit le plus marquant, i.e. si, 0 dans U*>0 le cas contraire.
    Les grèves pour lesquelles l’employeur n’a pas déclaré qu’elle étaient le conflit le plus marquant ne sont pas observées. Les données sont disponibles uniquement si U*>0, donc si z=1.
    Si on suppose que u et ε suivent une loi normale bivariée avec un coefficient de corrélation ρ, on a : message URL form81.gif
    φ et Φ désignant respectivement la fonction de densité et la fonction de distribution de la loi normale standard.
    Heckman (1979) montre que l’inclusion de λ, appelé ratio de Mills, dans l’équation caractérisant Y permet une estimation non biaisée des coefficients b : message URL form82.gif