2.1.5 Codage et création de variables

Variables sociodémographiques 

Nous avons procédé à des regroupements pour permettre des comparaisons avec l’INSEE ou encore le Ministère, (Âge, CSP…).

Les classes d’âge utilisées sont les suivantes : 18-24 ans, 25-34 ans, 35-44 ans, 45-59 ans, 60 ans et plus.

Pour le traitement des données, les niveaux d’études sont regroupés en trois classes :

Classe 1 : primaire, secondaire, BEP/CAP constitue le groupe un des « petits niveaux »,

Classe 2 : Niveau Bac et Bac + 1

Classe 3 : Niveau supérieur (regroupement des catégories Bac + 2, Etudes supérieures).

Les professions font l’objet d’un regroupement en quatre catégories : (1) professions à caractère indépendant (autonome), (2) employés et ouvriers, (3) cadres (4), sans activité (chômeurs, étudiants, retraités, au foyer).

Pour le nombre de frères et sœurs la première tranche est fixée à zéro pour l’enfant unique, la seconde à 1 et 2 et la classe supérieure est fixée à 3 et plus, (la valeur « 3 » correspond au dernier quartile dans le groupe des témoins).

Variables transport :

Type de permis : la variable à trois modalités de réponse a été transformée en 3 variables indépendantes : être titulaire du permis voiture, du permis moto, ou du permis poids lourd.

Année d’obtention du permis : la variable brute a été organisée en 4 classes selon les quartiles observés dans la population des témoins (avant 1970, de 1970 à 1991, de 1992 à 2001, de 2002 à 2005).

Nombre de points invalidés et à venir : afin de calculer le nombre réel de points sur le permis, nous avons créé une nouvelle variable qui correspond à la différence entre le nombre de points maximal d’un permis (12 ou 6 points) et la somme des points déjà retirés administrativement (Q15) et de ceux qui sont en cours de traitement (Q16) (l’infraction a déjà été commise et sanctionnée).

Avoir eu un accident : La distinction a été faite entre l’accident corporel (Q19) et l’accident matériel (Q21). Tout en conservant l’information relative à chacune de ces questions, traitées dans un premier temps isolément, une variable supplémentaire a été créée en regroupant les accidents matériels et corporels. Cette dernière a été nommée : « Antécédent d’accident ».

Création d’un score « je fais » (q38)

Ce score correspond aux infractions déclarées commises avec un gradient en deux et quatre modalités.

Pour chacune des 22 infractions, un score à quatre modalités de réponse. « 0 » pour « jamais », un score « 1 » pour « plutôt jamais », un score « 2 » pour « plutôt souvent » et un score « 3 » pour « souvent ». Le score théorique d’infraction peut ainsi varier de 0 à 63. Le score en deux classes comporte les classes suivantes : (0-6 et >6). Le seuil de 6 isole le dernier quartile observé chez les témoins.

Le second score fait l’objet d’un regroupement des réponses « jamais, plutôt jamais » et « souvent, plutôt souvent ». Les infractions déclarées commises sont scorées par l’attribution d’un score « 1 » quand elles sont déclarées plutôt souvent et souvent, elles ont un score « zéro » quand elles sont déclarées jamais et plutôt jamais, commises. Le score peut ainsi varier de 0 à 21. Les scores en quatre classes, déterminés par la distribution en quartiles des réponses des témoins s’étendent de : (0 à 12) score inférieur, de (13 à 19) score intermédiaire, de (20 à 26) score élevé.

Création de variables « réponse concordante/discordante »

Une variable en huit catégories a été créée en fonction des choix de réponses simultanées à l’infraction déclarée commise, sanctionnée et dangereuse, afin de saisir la cohérence des réponses du sujet et le lien entre le comportement, le danger et la règlementation.

Ainsi nous avons la typologie suivante :

Tableau 10 : Typologie des « réponses concordante/discordante »
Appellation Infraction Danger Sanction
1. discordant complet
« je fais, c’est dangereux, c’est sanctionné »
Oui (3-4) Oui (3-4) Oui (3-4)
2. concordant complet je fais
« je fais, ce n’est pas dangereux, ce n’est pas sanctionné »
Oui (3-4) Non (1-2) Non (1-2)
3. discordant sanction concordant danger je fais
« je fais, ce n’est pas dangereux, c’est sanctionné »
Oui (3-4) Non (1-2) Oui (3-4)
4. concordant sanction discordant danger je fais
« je fais, c’est dangereux, ce n’est pas sanctionné »
Oui (3-4) Oui (3-4) Non (1-2)
5. concordant complet je ne fais pas
« je ne fais pas, c’est dangereux, c’est sanctionné »
Non (1-2) Oui (3-4) Oui (3-4)
6. discordant complet je ne fais pas
«  je ne fais pas, c’est pas dangereux, ce n’est pas sanctionné »
Non (1-2) Non (1-2) Non (1-2)
7. discordant danger concordant sanction je ne fais pas
« je ne fais pas, ce n’est pas dangereux, c’est sanctionné »
Non (1-2) Non (1-2) Oui (3-4)
8. discordant sanction concordant danger je ne fais pas
«  je ne fais pas, c’est dangereux, ce n’est pas sanctionné »
Non (1-2) Oui (3-4) Non (1-2)

Par exemple la classe 1 regroupe les conducteurs qui déclarent commettre l’infraction tout en déclarant qu’elle est à la fois dangereuse et fréquemment sanctionnée.

Création de scores pour les variables de personnalité à l’EPI :

Les dimensions de l’Introversion/Extraversion (E), du Névrosisme/stabilité émotionnelle (N), de la cohérence/sincérité (L) ont été scorées. Le test est élaboré de façon à attribuer un score « 0 » ou « 1 » aux réponses. Selon la question, zéro peut transcrire un « oui » ou un « non ». Chaque score correspond à la somme des réponses de la dimension. Nous avons élaboré un programme de correction informatisé en reprenant ce même principe. Pour chaque échelle, une note «1» est affecté à chaque réponse attendue et une note « 0 » aux autres, nous avons ainsi obtenu trois scores E, N et L. La distribution des effectifs ne permet pas de conserver l’étalonnage en onze classes d’Eysenck. Les effectifs sont trop faibles vers les bornes inférieures. En outre, nous ne sommes pas dans le cadre d’un bilan individuel mais dans le cadre d’une étude sur le comportement collectif.

Pour le calcul des scores de l’EPI les seuils ont été fixés par regroupement des onze classes de Conformément au test d’origine, on distingue un étalonnage femme et un étalonnage homme.

Les bornes des scores ont été fixées a priori avant de regarder les distributions. L’intérêt principal porte sur les extrêmes (les centristes constituant l’aspect général).

L’AFCM a tout d’abord été menée avec des scores en 4 classes « faible, moyen, haut, très haut » pour le facteur E et N. Puis, afin de vérifier la stabilité de nos résultats, nous avons relancé l’analyse en trois classes correspondant, pour les deux sexes, aux premiers et derniers quartiles puis au 90è percentile de la distribution des témoins.

Pour les hommes :

Les scores N ≤ 5, font l’objet du regroupement dans la première classe (score faible) ; les scores compris entre 6-9 sont regroupés en classe 2 (score moyen), ceux compris entre 10 et 14 correspondent à la classe 3 (score élevé) et enfin les scores supérieurs à 15 correspondent à la classe 4 (score très élevé). Cette dernière classe supérieure, représente 10 % de l’effectif des témoins.

Pour les femmes :

En psychométrie on constate régulièrement que les scores en neuroticisme des femmes, indépendamment du pays d’appartenance sont plus élevés que ceux des hommes. Les bornes du score N ne sont pas identiques à celles des hommes. La première classe comprend les scores inférieurs à 7, la seconde ceux compris entre 7 et 9, la troisième, ceux entre 11 et 15 et la dernière ceux ≥16.

Etalonnage commun aux hommes et aux femmes :

Les scores E et L font l’objet d’un regroupement identique pour les deux genres. Le facteur E, initialement en 10 classes, est regroupé en seulement 4 classes qui correspondent aux scores faibles (entre 0 et 7), moyens (entre 8 et 13), élevé (entre 14 et 16) et très élevé (entre 17 et 24). Le score L a également fait l’objet d’un regroupement en 2 classes (inférieur à 4 et score supérieur à 4).