1.1.2.2. Analyse du questionnaire

Dans un premier temps nous avons considéréles questionnaires pour lesquels le diagnosticne faisait aucun doute, avec des différences marquées entre les jumeaux, portant notamment sur la couleur des yeux, des cheveux, les groupes sanguins, différences allant de pair avec la certitude des sujets eux-mêmes, basée sur leur absence de ressemblance et souvent aussi l’avis de l’entourage.

Nous n’avons retenu un diagnostic pour les monozygotes que si toutes les réponses convergeaient, avec une concordance des diagnostics établis d’après les critères de Lykken, Magnus et Lévy, ou si le diagnostic qui avait été fait à la naissance pouvait être accepté avec certitude, sur la foi du carnet de santé.

Après le premier temps de l’analyse des questionnaires, quinze paires de jumeaux restaient à classer dans l’une des catégories monozygote ou dizygote. Pour quatre d’entre elles, les informations étaient incomplètes, au moins en ce qui concernait un des jumeaux. Pour les autres, le questionnaire avait été correctement rempli, mais il subsistait un doute, quant au diagnostic, en fonction des critères retenus.

Nous avons, ensuite, procédé à une analyse discriminante, avec le logiciel Statistica, portant sur l’ensemble des sujets pour lesquels le diagnostic était connu, soit dix neuf paires de jumeaux monozygotes et dix sept paires de dizygotes, avec un certain nombre d’observations supplémentaires correspondant aux sujets dont le diagnostic restait incertain, et que nous souhaitions discriminer, et aux germains.

Nous avons entré dans l ‘analyse discriminante, pour chaque paire, les coefficients moyens de ressemblance actuelle (CMD) et dans l’enfance (CMB) ainsi que le coefficient de ressemblance comportementale (CMC) et la croyance personnelle (MPERS). Les moyennes de ces différentes variables, en fonction du diagnostic, quand il est connu, sont données dans le tableau ci-dessous et illustrées par la figure 15, page suivante.

Tableau 21. Moyennes des coefficients (variables dépendantes), en fonction des groupes :
  CMB CMC CMD MPERS
MZ 0.695 0.569 0.526 0.74
DZ -0.187 -0.045 -0.594 -1.00

Nous avons procédé à une analyse incrémentielle ascendante.

Elle comporte quatre étapes qui incluent successivement toutes les variables, pour un F d’inclusion>1 (avec un niveau de tolérance laissé à 0.01, valeur par défaut, qui limite la redondance des variables).

Tableau 22. Synthèse de l’analyse discriminante :
  Lambda de Wilks Lambda partiel F d’exclusion
CMD 0.101 0.640 17.37
CMC 0.072 0.901 3.41
CMB 0.074 0.875 4.45
MPERS 0.070 0.924 2.56

Aux lambdas partiels les plus faibles correspondent les plus forts pouvoirs discriminants : il apparaît que c’est CMD, coefficient de ressemblance dans l’enfance, qui contribue le plus à la discrimination du modèle. Vient ensuite CMB, ressemblance actuelle, puis CMC, ressemblance comportementale, enfin MPERS, croyance personnelle, qui a la contribution la plus faible. Les coefficients de ressemblance physique sont donc les variables majeures pour distinguer monozygotes et dizygotes.

Figure 15.: Position des monozygotes et des dizygotes, en fonction des valeurs moyennes des coefficients de ressemblance.
Figure 15.: Position des monozygotes et des dizygotes, en fonction des valeurs moyennes des coefficients de ressemblance.

Les coefficients de la fonction discriminante entre monozygotes et dizygotes, pour chacune des variables entrée dans l’analyse, sont donnés dans le tableau suivant  :

Tableau 23. Coefficients de la fonction discriminante
  CMD CMC CMB MPERS CONSTANTE
Coefficients bruts 3.37 1.12 2.02 0.66 -0.81
Coefficients standardisés 0.68 0.35 0.39 0.30  

Cette fonction rend compte de tout le pouvoir discriminant du modèle. Elle est plus lourdement pondérée par CMD et CMB, c’est à dire les coefficients de ressemblance physique.

Les coefficients des fonctions de classifications figurent dans le tableau ci-dessous :

Tableau 24. Fonctions de classification
Variables de classement CMD CMC CMB MPERS CSTE
MZ 10.72 7.32 15.53 0.92 -11.28
DZ -14.22 -0.96 0.59 -3.96 -6.92

Elles permettent, pour chaque observation, d’établir un score d’appartenance à chacun des groupes et de classer l’observation dans le groupe qui correspond au score le plus élevé.

L’analyse discriminante reclasse tous les monozygotes et tous les dizygotes connus dans leur catégorie respective. Le taux de classification est donc correct à 100%.

La discrimination des jumeaux, pour lesquels le diagnostic est inconnu, est possible pour vingt deux d’entre eux, qui se répartissent en quatre paires de dizygotes , et sept paires de monozygotes.

La classification obtenue, pour toutes les paires, et le carré des distances entre chaque paire et le centroïde de groupe ou centre de gravité défini par les moyennes respectives des groupes pour chaque variable (distance de Mahalanobis) sont donnés dans l’annexe P.

La figure 16 illustre ce résultat ; nous avons choisi, pour chaque paire, de représenter le carré de la distance aux centroïdes des deux groupes, monozygotes et dizygotes.

Nous voyons que, dans la plupart des cas, la distance à l’un des centres de gravité des groupes est grande, alors qu’elle est extrêmement petite en regard du centre de gravité de l’autre groupe.

C’est pour la paire 37 que les deux distances sont les plus proches, mais la distance au centroïde des monozygotes est tout de même nettement plus grande et l’analyse discriminante permet de classer la paire en tant que dizygotes avec un risque d’erreur inférieur à 1%.

Tous les germains, sauf six paires, les paires 105, 106, 116, 117, 119 et 120, pour lesquelles les données du questionnaire étaient incomplètes, ont été classés dizygotes, ce qui est attendu.

Quatre paires de jumeaux, les paires 7, 8, 9 et 32, pour lesquels des informations étaient manquantes, demeurent non classés et nous tenterons de les classer après analyse de l’écriture.

Une analyse discriminante des sujets en fonction des coefficients individuels donne exactement les mêmes résultats de classement. Elle permet en outre pour deux des quatre paires de jumeaux non classés de classer un jumeau de la paire. Dans les deux cas, le jumeau est classé monozygote (paires 7 et 32).

Figure 16. Classification en fonction de la distance de Mahalanobis
Figure 16. Classification en fonction de la distance de Mahalanobis

Une grande distance au centroïde des dizygotes et une courte distance au centroïde des monozygotes caractérisent les monozygotes

Une grande distance au centroïde des monozygotes et une courte distance au centroïde des dizygotes caractérisent les dizygotes