Afin de mesurer les conséquences de ce flou d'appellation sur le codage des professions, j'ai tout d'abord codé avec le même dictionnaire les professions déclarées par les mêmes individus et au même moment dans les listes électorales et dans les listes nominatives. J'ai ensuite regroupé les différentes CSP, non pas en 13 groupes comme je l'ai fait pour la nomenclature retenu dans l'ensemble des analyses de cette recherche mais en 10 groupes. En fait la réduction de 13 à 10 groupes s'imposait en raison des données disponibles : trois groupes que j'utilise normalement ne représentent pour la population considérée que des effectifs beaucoup trop faibles ( les agriculteurs, les services et les retirés) et j'ai donc agrégé ces quelques cas au groupe divers. Après ce travail de codage, j'ai procédé à une série d'analyses des correspondances multiples portant sur les 661 couples de professions et sur l'âge auquel le couple était enregistré. Dans ces analyses, l'individu statistique est le couple de professions. Chaque individu est défini par trois variables : la profession déclarée dans les listes électorales, celle déclarée dans les listes nominatives, l'âge de la déclaration 618 . L'objectif de ces analyses n'est pas de découvrir la logique de l'espace social mais d'observer comment les diverses professions se répartissent sur le plan factoriel, et en particulier de mesurer la distance qui sépare sur le plan factoriel les mêmes professions selon l'origine de leur déclaration ( listes électorales ou listes nominatives). Si cette distance est faible, cela signifiera que par delà les remarques faites précédemment sur le flou d'appellation, ce flou n'a pas de conséquence grave sur le codage, et qu'il n'entraîne pas, une fois les professions agrégées, de distorsion importante. Enfin un tel résultat, une distance minimale entre la même catégorie professionnelle enregistrée pour le même individu au même âge, impliquerait que les résultats sont en grande partie indépendants de la source utilisée, en l'occurrence ici, les listes nominatives et les listes électorales. Ce point pourrait paraître anodin à quiconque ne s'est pas directement confronté au couplage de sources mais pour tous ceux qui ont expérimenté ce genre de recherche, il apparaîtra comme essentiel.
La première de ces analyses des correspondances multiples porte sur les variables professionnelles et sur l'âge à l'observation. Comme le montre à l'évidence le plan factoriel défini par l'axe 1 et l'axe 2, la proximité des professions identiques mais enregistrées dans les deux sources différentes est avérée. Les distances observées pour toutes les catégories sont minimes, et à l'exception de la catégorie divers, composite par construction, les coordonnées sur les deux premiers axes, mais aussi sur les deux suivants, sont quasiment identiques pour les diverses catégories, quelle que soit la source. Dans cette première analyse, la date de l'observation a été intégrée comme variable active. L'âge (tous les individus appartiennent à la même cohorte et la date de l'observation donne donc leur âge) est une variable mal expliquée par l'axe 1 et l'axe 2 et qui s'éloigne beaucoup moins de la situation d'indépendance (l'origine des axes) que les variables socio-professionnelles. Le début de carrière est cependant légèrement négatif sur l'axe 1, se situant dans l'espace des professions manuelles, alors que les âges supérieurs à 50 ans, occupent des positions légèrement positives sur ce même axe ; cela est la manifestation du lien qui existe entre la maturité et certaines catégories
professionnelles telles que négociants, cadres supérieurs ....
Afin de mieux mesurer l'influence de rage dans la distorsion de codage qu'induit l'utilisation de l'une ou de l'autre source, j'ai calculé l'indice de dissimilarité entre les distributions dans l'une et l'autre source avant et après 45 ans. Cet indice, défini comme la demi somme des écarts absolus des deux distributions, est faible pour la totalité du fichier, il n'est que de 10 pour les 661 couples, mais surtout, il n'est que de 9,8 avant 45 ans mais de 13 après.
L'examen des distributions permet d'observer quels sont les groupes où se situent les écarts maximums.
jusqu’à 45 ans | après 45 ans | |||
groupe professionnel | % élec | % rec | % élec | % rec |
services publics | 0,5 | 0,8 | 0,7 | 1 |
négociants, industriels | 6,8 | 8,5 | 13 | 17 |
cadres supérieurs | 3,3 | 2,5 | 1,4 | 1,7 |
petits commerçants | 6,6 | 9,3 | 11 | 10 |
techniciens, c. moyens | 9,6 | 8,7 | 11 | 13 |
employés | 28 | 22 | 23 | 20 |
ouvriers ou artisans | 24 | 22 | 19 | 14 |
ouvriers | 17 | 17 | 17 | 13 |
manoeuvres | 1,9 | 3,8 | 0,7 | 4,7 |
divers | 2,5 | 5,7 | 3,7 | 5,1 |
D'une part, les listes électorales surestiment les employés et diminuent le poids des négociants et industriels, et ce avant comme après 45 ans et d'autre part, elles sous-enregistrent les manœuvres surtout après 45 ans. Ce dernier point est particulièrement aigu pour cette cohorte qui est une cohorte de travailleurs déjà âgés lorsque la crise arrive et qui, pour résister à la conjugaison du chômage conjoncturel et structurel des années 1930, doit parfois accepter une déqualification qui échappe aux listes électorales.
L'examen de cette première analyse conforte de manière assez probante l'hypothèse d'une absence d'impact du flou d'appellation, une fois les données agrégées. Ce résultat infirme toute une série de méfiances sur la qualité des sources et en particulier réduit la portée de toutes les réserves que j'ai pu faire sur le caractère conservateur des listes électorales par rapport aux listes nominatives. Il n'est pas question d'ignorer ce caractère conservateur, indubitable, mais il faut se garder d'en surestimer la portée.
J'ai procédé à trois autres analyses. La première est identique à la précédente mais n'intègre pas la date de l'observation 619 . La seconde porte sur les 268 couples de professions observés avant la guerre ( c'est-à-dire avant que les individus n'aient atteint l'âge de 36/39 ans), la troisième sur les 368 couples observés après la guerre. Les trois plans factoriels obtenus confirment avec force la validité des résultats précédents. Cette série d'analyses permet de dégager quelques conclusions générales sur l'organisation de l'espace social. Pour l'ensemble de cette recherche, une catégorie joue un rôle central, la catégorie des employés, véritable carrefour social. Cette catégorie est située à proximité de la catégorie des techniciens et cadres moyens , de celle des négociants et industriels, de celle des cadres supérieurs enfin, suggérant la fréquence des échanges au sein de ce groupe. Mais surtout ces analyses qui se confortent l'une l'autre soulignent la solidité de cette conclusion essentielle : l'homogénéité et la similarité de l'espace social n'est pas remis en cause par la source qui sert à le construire. Une fois agrégés, les résultats professionnels sont pour l'essentiel indépendants de la source (listes électorales ou listes nominatives du recensement) et le flou constaté ne remet pas en cause la validité d'ensemble des résultats. Cette conclusion ne doit pas alimenter des dérives positivistes mais elle montre tout autant qu'une attitude hypercritique n'est pas plus justifiée.
Les professions sont codées de 1 à 10, les âges d'observation de 1 à 8.1 = observation en 1896, 2= observation en 1901 ... 8 = observation en 1936.
La taille de la matrice à diagonaliser passe donc de 28 (10 modalités professionnelles observées dans les listes nominatives, plus 8 dates d'observation) à 20