VII. LES CARACTÉRISTIQUES DE LA SOCIÉTÉ LYONNAISE

Afin de dégager les caractéristiques générales de la société lyonnaise, j'ai procédé à quatre analyses factorielles des correspondances multiples (ACM) portant sur chaque coupe transversale. Dans un second temps, après avoir dégagé les grandes lignes de l'évolution, l'analyse portera sur les relations que les variables entretiennent entre elles. En effet l'analyse multivariée ne permet pas toujours, et cela est bien le cas ici, de bien dégager la nature de certaines relations et il est nécessaire de procéder à des analyses bivariées 664 . Il demeure cependant que les ACM sont les seules aptes à saisir, de manière synthétique, les tendances générales.

Les quatre analyses des correspondances multiples (ACM) utilisent exactement les quatre mêmes variables. La variable groupe professionnel comprend 12 modalités. La variable zone de résidence en comprend 15. Six classes d'âges constituent la variable âge et la variable commune de naissance regroupe 6 modalités 665 . Au total, les quatre analyses portent donc sur les quatre mêmes variables et sur trente neuf modalités (12+15+6+6). ce qui revient à dire que l'inertie des tableaux analysés est toujours la même 666 . L'intérêt de procéder de la sorte est de pouvoir vérifier si, pendant quarante ans, l'organisation des variables reste toujours la même et, si ce n'est pas le cas, d'en mesurer les variations éventuelles. C'est utiliser l'analyse factorielle, ou plus exactement une série d'analyses, comme un outil dont l'objectif n'est pas uniquement la découverte de relations mais plutôt la mesure de la permanence des relations 667 .

Croquis n° 54 : ACM, données de 1896
Croquis n° 54 : ACM, données de 1896
Croquis n° 55 : ACM, données 1911
Croquis n° 55 : ACM, données 1911
Croquis n° 56 : ACM, données 1921
Croquis n° 56 : ACM, données 1921
Croquis n° 57 : ACM, données 1936
Croquis n° 57 : ACM, données 1936

Examinons les valeurs propres, correspondant aux quatre premiers facteurs 668 des quatre analyses différentes. En cas d'indépendance des variables retenues, les trente neuf valeurs propres auraient toutes la même valeur, égale à l'inertie totale (ici 8,75) divisée par le nombre de valeurs propres (ici 39) soit 0.224 669 .

Les valeurs propres des quatre analyses
  1896 1911 1921 1936
Valeur propre 1 0,378 0,391 0,376 0,369
Valeur propre 2 0,373 0,362 0,367 0,354
Valeur propre 3 0,348 0,346 0,347 0,318
Valeur propre 4 0,342 0,341 0,328 0,308

Globalement les quatre séries sont comparables : les niveaux sont identiques, toujours supérieurs au niveau d'indépendance calculé ci dessus. La diminution des valeurs propres de la première à la quatrième n'est pas très rapide. Cela signifie qu'aux quatre dates, il y a une liaison entre les quatre groupes de modalités mais que cette liaison n'est pas exceptionnellement forte, ou pour le dire autrement, que chaque modalité, un groupe professionnel ou une zone de résidence par exemple, se caractérise par rapport aux modalités des autres variables par une certaine hétérogénéité. Par exemple, au sein du groupe ouvrier, certains sont nés dans des minuscules communes rurales, d'autres dans des petites villes, d'autres dans des grandes villes, d'autres à Lyon, tous n'habitent pas le même quartier et bien sûr, tous n'ont pas le même âge. La position de la modalité ouvrier tient compte de cette hétérogénéité et sa proximité avec une autre modalité ne signifie pas que les deux modalités se recoupent mais qu'il y a de grandes chances pour que la première modalité soit surreprésentée dans l'univers de la seconde, ou inversement. Par exemple, si l'on observe une nette proximité entre les hommes de 41-50 ans et la modalité rural profond (c'est à dire hommes nés dans les communes de moins de 500 habitants agglomérés au chef lieu), ce qui est le cas en 1921, cela ne signifie pas, à l'évidence, que tous les quadragénaires soient nés dans ce type de communes mais que ces deux modalités ne sont pas indépendantes. En 1921, 81 quadragénaires sont nés dans ce type de communes. Si les deux modalités étaient indépendantes, il n'y en aurait que 67. Ce que signale la proximité, c'est cette surreprésentation de 14 individus.

Notes
664.

Philippe Cibois insiste sur ce point dans ses études sur l'analyse multivariée.

665.

Ce sont celles qui ont été définies précédemment mais communes rurales et bourgs ruraux ont été regroupés. Le rural profond correspond donc aux communes de moins de 500 habitants agglomérés au chef-lieu et le rural à celles comprises entre 501 et 2000 habitants. J'ai éliminé les individus dont on ignorait la taille de la commune de naissance du fait des non-réponse qui, surtout à l'occasion des trois premières coupes, comprenaient une majorité de jeunes soldats. Cela contribuait à perturber le premier axe des analyses et mettait en évidence une relation triviale : le lien entre les électeurs les plus jeunes et les non-réponses.

666.

Cette inertie est égale au nombre de modalités divisé par le nombre de variables moins 1, soit ici (39/4)-1. c'est a dire 8.75. Les quatre ACM portent sur des tableaux qui ont autant de lignes que d'individus actifs (845 en 1896. 979 en 1911, 1041 en 1921 et 1327 en 1936) et trente neuf colonnes où ne figurent que des 0 ou des 1.

667.

Cette manière de procéder m'a été suggérée par les séminaires sur l'analyse des données organisés par l'Ecole d'été de Grenoble (1979-1980) animée par Frédéric Bon, Guy Romier. François d'Aubigny et Bernard Bouhet. Les analyses de Frédéric Bon afin de tester la solidité des axes gauche-droite ou libéral-autoritaire dans la structuration des données électorales étaient très éclairantes.

668.

Le nombre de facteurs dépend directement de la taille de la matrice. D'une matrice de 39 colonnes ( correspondant aux 39 modalités), 39 facteurs peuvent être extraits. Il est évident que seuls les premiers sont les plus importants pour l'analyse. Leur extraction se fait dans l'ordre décroissant : le premier est plus important que le second, le second que le troisième ...

669.

Par exemple en 1896. (valeur propre/inertie totale)*100, (0,378/8,75)*100 » 4.32 Que signitient-ils ? On sait que dans le cas des ACM. la part d'inertie expliquée par les premiers facteurs est, en raison même du codage logique.- c'est à dire n'utilisant qu'un code binaire, 0 ou 1 - beaucoup plus faible que dans les analyses factorielles des correspondances portant sur des tableaux de contingence. Sur ce point voir L.Lebart, A.Morineau, N. Tabard, Techniques de la description statistique, méthodes et logiciels pour l'analyse des grands tableaux, Dunod, 1977, particulièrement chapitre IV, p. 123 et sq (Analyse des correspondances multiples) et chapitre VI, p. 216 et sq. Les auteurs soulignent p. 130 que "l'analyse des tableaux sous codage disjonctif conduit toujours à des taux d'inertie faible, qui donnent une idée beaucoup trop pessimiste de la part d'information extraite." Voir aussi Philippe Cibois, l'analyse des données en sociologie, PUF. 1984, p.111 et sq.