2.2 Méthodes d’analyses

Toutes les analyses ont été menées avec le logiciel SAS, version 9.1.

Toutes les analyses de l’échantillon des témoins sont menées sur un échantillon redressé afin d’avoir une structure d’âge par genre semblable à celle de la population des détenteurs d’un permis de conduire.

Deux grandes étapes d’analyses sont présentées, l’étape exploratoire descriptive avec les méthodes statistiques simples ainsi qu’une l’Analyse Factorielle des Correspondances Multiples (AFCM) et une Classification Ascendante Hiérarchique (CAH), puis l’étape analytique, par régression logistique.

La première analyse descriptive présente

chez les conducteurs tout-venant le niveau des infractions déclarées commises, dangereuses et sanctionnées, en comparaison avec un état des lieux de 1983 (Biecheler), chapitre

une description des infractions pour les stagiaires (AFC), chapitre

pour les stagiaires et les témoins, l’ensemble des variables mesurées et la comparaison des deux échantillons en analyse univariée, pour chaque genre chapitre .

pour les scores de personnalité, la distribution chez les témoins qui peut être considérée comme une proposition de nouvel étalonnage, paragraphe .

une analyse plus fine sur les infractions pour les 2 échantillons (stagiaires et témoins), paragraphe , comprenant un calcul des risques relatifs (stagiaires/témoins) pour chacune des infractions, et une analyse de la concordance des réponses, paragraphe .

Concernant les infractions une analyse porte exclusivement sur l’échantillon des stagiaires (point b), ce dernier étant le groupe d’intérêt. L’AFCM est suivie d’une Classification Ascendante Hiérarchique CAH.

Pour les points a et c, dans chaque groupe hommes et femmes sont comparés, puis pour chaque genre, stagiaires et témoins font l’objet d’une seconde comparaison. Les comparaisons sont faites selon la nature des données au moyen d’un test de comparaison de moyennes (test de Student) et du test du Khi2 pour les variables qualitatives ¹²². Pour les infractions, nous adoptons le principe conservateur de Bonferroni qui consiste à abaisser le risque d’erreur. Dans notre cas, nous avions fixé le risque d’erreur classiquement à 5% mais nous donnerons l’indication au lecteur avec un risque à 0,2 % selon le modèle de Bonferroni qui consiste à diviser le risque d’erreur de (5%) par le nombre de variables testées (22). Le risque de significativité est abaissé à 0,002. Enfin, nous avons calculé des risques relatifs des stagiaires par rapport aux témoins pour chacune des 22 infractions. Chaque valeur du risque relatif compare donc stagiaires VS témoins sur le risque de commettre chaque infraction.

Enfin une analyse multivariée (régression logistique) établit les facteurs de risque de présence en stage pour chaque genre, chapitre . L’analyse est ici de type cas/témoins dans laquelle on calcul des odds ratios, qui sont une bonne approche des risques relatifs étant donné que la présence en stage est un phénomène rare : pour l’année 2005, moins de 100 000 personnes ont suivi un stage soit moins de 2 ‰ des détenteurs de permis.