2.2.2 Etape Analytique : principe de la régression logistique

Á l’issue des analyses exploratoires, une étape analytique, sur la totalité de l’effectif (2014) au moyen d’une régression logistique est présentée pour comparer stagiaires et témoins.

La régression logistique est un modèle statistique qui a pour objectif, à partir d’un fichier d’observations, de produire un modèle qui prédise les valeurs prises par une variable catégorielle binaire, à partir d’une série de variables explicatives quantitatives/qualitatives.

Cette méthode permet de déterminer les variables liées à la présence en stage pour les deux genres, toutes choses égales par ailleurs. Pour cela, les variables significativement liées à la présence en stage, lors de l’analyse univariée, sont introduites dans un modèle multivarié, avec des variables relatives à l’accident et à l’infraction : variables d’intérêt. Les variables qui deviennent non significatives à 5 % sont enlevées une à une, selon la méthode descendante pas-à-pas, en commençant par la valeur la moins significative (p le plus grand). On calcule ainsi des odds-ratios (OR) associés à chaque facteur, et leurs intervalles de confiance (IC) à 95 %.

La valeur des OR associés à chaque variable explicative, exprime le risque de participer à un stage d’une modalité par rapport à une autre, choisie comme classe de référence. Exemple : nous calculerons le risque des jeunes, par rapport aux 60 ans et plus, qui ici seront choisis comme classe de référence (supposée la moins à risque).