VII. 2. 1. Un corpus en variables, Modalisa et le test du χ².

Modalisa ’, logiciel de création et de saisie d’enquêtes, donne la possibilité de créer ses propres variables et ses propres croisements de données pour obtenir graphiques et tableaux croisés. Il nécessite cependant l’élaboration, au préalable, d’une liste de variables considérées comme potentiellement heuristique et pertinentes pour l’analyse du corpus. Nous dressons donc une liste de quatre variables pour nos observations: la visibilité, les titres de presse people, les dates de parutions et les personnages. Pour la première, trois types de visibilités émergent : les visibilités centrales (l’homme politique apparaît dans une photographie dominant toutes les autres), les visibilités moyennes (l’homme politique est mis en scène dans une ou plusieurs photographies de second plan) et, enfin, les visibilités non-iconiques (l’homme politique est visible par la simple évocation de son nom en Une).

[Tableau 9 : Nombre d’Unes Politiques par titre sur la période du 14 mai 2007 au 30 avril 2010.]
[Tableau 9 : Nombre d’Unes Politiques par titre sur la période du 14 mai 2007 au 30 avril 2010.]

Les deux variables suivantes correspondent au titre people et à sa date de parution. Les définitions et les catégorisations de la presse people opérées plus tôt nous permettent de rassembler certains titres entre eux. Les modes de visibilité des personnages peoples – mode mimétique haut et mode mimétique bas – constitue un premier rapprochement. Ainsi, ‘ Paris-Match ’, ‘ VSD ’, ‘ Point de Vue ’et ‘ Gala ’ sont confrontés à ‘ Voici ’, ‘ Closer ’, ‘ France-Dimanche ’et ‘ Ici-Paris1134. Un regroupement plus précis clarifie les lignes éditoriales quant à la politisation de leur Unes et la médiatisation des hommes politiques : ici, nous les rassemblons par deux1135, pour permettre des différences de traitements plus fines au sein d’un même mode et pour distinguer, ‘ Paris-Match ’et ‘ VSD ’, ‘ Point de Vue ’et ‘ Gala ’, ‘ Voici ’ et ‘ Closer ’, et enfin, ‘ France-Dimanche ’et ‘ Ici-Paris ’. Nous avons fait le choix de conserver les neuf titres1136 figurant dans notre corpus principal et de ne pas observer des titres créés par la suite comme ‘ Oops ’, ‘ Psst ’ ou ‘ Celebrity ’. Ce choix est doublement motivé. Tout d’abord, ces titres peoples récents n’auraient pas eu le même nombre de numéros que les autres ; la comparaison aurait été plus compliquée et moins significative. Ensuite, l’un des objets de notre thèse est la campagne présidentielle ; ouvrir nos perspectives à des titres qui n’existaient pas alors semblait peu pertinent. Nous avons fait le choix de catégoriser, par ailleurs, les dates de parution des titres en fonction de l’année et du numéro de la semaine, afin de pouvoir opérer des comparaisons même si les dates de parution diffèrent de quelques jours1137. La dernière variable de codification de nos observations identifie cinquante-sept personnages politiques mis en scène dans ces Unes. Nous opérons une distinction entre deux formes de visibilité de ces personnages. La « visibilité confondue » consiste en la visibilité d’un personnage sans tenir compte du type de visibilité : nous confondons une apparition en Une centrale, une photo de second plan ou la simple évocation de son nom. A l’inverse, la « visibilité différenciée » permet de distinguer les modes d’apparition du personnage.

[Tableau 10 : Les 57 personnages et leur nombre d'apparition en Unes]
Tableau 10 : Les 57 personnages et leur nombre d'apparition en Unes
  Effectifs Fréquence   Effectifs Fréquence
Carla Bruni 187 23,1% Marie-Laure de Villepin 1 0,1%
Nicolas Sarkozy 154 19,1% Daniel Cohn-Bendit 1 0,1%
Cécilia Sarkozy 124 15,3% Judith Martin 1 0,1%
Rachida Dati 89 11,0% Hugo Chavez 1 0,1%
Ségolène Royal 48 5,9% Dimitri Medvedev 1 0,1%
Barack Obama 34 4,2% Andrée Sarkozy 1 0,1%
Jean Sarkozy 26 3,2% John Mc Cain 1 0,1%
Michelle Obama 20 2,5% Chantal Jouanno 1 0,1%
Jacques Chirac 14 1,7% Frédéric Mitterand 1 0,1%
François Hollande 11 1,4% Thomas Hollande 1 0,1%
François Fillon 8 1,0% Roselyne Bachelot 1 0,1%
Rama Yade 8 1,0% Georges W. Bush 1 0,1%
Pierre Sarkozy 8 1,0% Benyamin Netanyahou 1 0,1%
Louis Sarkozy 6 0,7% Charles de Gaulles 1 0,1%
Bernard Kouchner 3 0,4% Mazarine Pingeot 1 0,1%
Dominique De Villepin 6 0,7% Fadela Amara 1 0,1%
Dominique Strauss Kahn 4 0,5% Valery Giscard d'Estaing 1 0,1%
Bernadette Chirac 4 0,5% Jean-Louis Borloo 1 0,1%
François Baroin 3 0,4% Philippe Seguin 1 0,1%
Bertrand Delanoë 3 0,4% Martine Aubry 1 0,1%
Brice Hortefeux 3 0,4% Raymond Barre 1 0,1%
Pal Sarkozy 2 0,2% Danielle Mitterand 1 0,1%
Claude Pompidou 2 0,2% Marisa Borini 1 0,1%
Bill Clinton 2 0,2% Tony Blair 1 0,1%
Hilary Clinton 2 0,2% Arnaud Montebourg 1 0,1%
Sylvio Berlusconi 2 0,2% Marie-Dominique Cullioli 1 0,1%
Simone Veil 2 0,2% Natasha Obama 2 0,2%
Malia-Ann Obama 2 0,2% Christine Lagarde 1 0,1%
Jeanne-Marie Martin 2 0,2%      

C’est par le croisement et le regroupement de ces personnages et des titres de  presse people qu’émergent les résultats qui nous permettent de considérer leur visibilité, la presse people et sa politisation. ‘ Modalisa ’ est un logiciel qui permet ces regroupements et offre, par ailleurs, des indicateurs statistiques confirmant ou non leur pertinence. Nous nous servirons essentiellement du test du χ², test statistique construit à partir d’un risque et sur une hypothèse1138. L’objectif de ce test est de croiser deux variables et prouver leur indépendance. Pour cela, le test se base sur l’écart entre le tableau observé (qui croise deux variables, une en colonne, une en ligne) et un tableau virtuel, qui serait obtenu dans le cas d’une parfaite indépendance entre ces deux variables. Il confronte alors cet écart au nombre de degrés de liberté du tableau, qui dépend du nombre de lignes et de colonnes (exprimé par le sigle ‘ ddl ’ par Modalisa ou ‘ df ’ pour les logiciels anglophones). Cet écart est établi à partir d’une probabilité d’erreur. En général, le seuil à partir duquel on considère le résultat comme réellement significatif, c’est à dire le niveau « acceptable » de la probabilité de se tromper, est fixé par convention et habitude à 5 %. Pour cela, il faut comparer le χ² obtenu (tableau observé) au χ² critique (tableau virtuel), c'est-à-dire le χ² du cas d’une indépendance parfaite. Le seuil critique est une donnée fixée selon le degré de liberté et la probabilité d’erreur, ces données ne dépendent donc pas des variables et sont au préalable établies dans une table de χ²1139. Quand le chercheur produit lui-même ses calculs, il compare le χ² obtenu avec les χ² critiques selon le degré de liberté de son tableau, ce qui lui permet de trouver la probabilité d’indépendance de ses variables. Ainsi, la table du χ² indique qu’avec un degré de liberté de 2 et pour un χ² obtenu de 2,4, ce χ² obtenu se trouve au-dessus de la probabilité d’erreur de 20% (mais en dessous du seuil critique de la probabilité d’erreur de 10%). Avec un tel résultat, il y a 20% de chance que la dépendance observée soit fausse : cette marge d’erreur est trop importante pour nous permettre d’affirmer une dépendance entre les deux variables croisées.

Modalisa ’ propose directement le seuil de probabilité d’erreur dépassé. Ainsi, la valeur ‘ p ’ proposée par ‘ modalisa ’ nous permet de voir immédiatement s’il y a dépendance ou pas. Plus cette valeur est proche de zéro, plus le χ² est significatif. Nous considèrerons que toute valeur ‘ p ’ supérieure à 0,05 ne sera pas acceptable pour affirmer une dépendance et limiterons donc la vérification de nos hypothèses au seuil des 5% de marge d’erreur.

Considérons un exemple à partir d’une hypothèse de notre corpus : les dix personnages les plus visibles dans notre corpus apparaissent plus souvent en photo sur les Unes. Pour cela, nous transformons la variable des personnages politiques construite sur 57 modalités (une pour chaque personnage) en une variable basée sur deux modalités : les dix plus visibles, d’un côté, et les autres, de l’autre. De là, nous croisons la variable  « les personnages politiques : les 10 plus visibles VS les autres » et la variable « types de visibilité ». Nous espérons alors que le test du χ² échoue pour être en mesure de déterminer une influence entre ces deux variables. Modalisa nous indique que notre hypothèse est prouvée.

‘Khi2=13,8 ddl=2 p=0,001 (très significatif)’

Sans nous attarder sur le calcul du χ², notons que ‘ Modalisa ’ nous indique que le χ² est égal à 13,8, ce qui correspond au seuil critique significatif pour un degré de liberté égal à 2 (notre tableau est composé de 3 lignes et 2 colonnes, soit (3-1) x (2-1) = 2) et une marge d’erreur de 0,001. Ainsi, nous sommes en mesure d’affirmer que le type de visibilité et l’importance de la visibilité du personnage sont dépendants et s’influencent l’un et l’autre1140 et que cette affirmation a 0,1% de chance d’être erronée. Dans cette logique, le test du χ² permet de confirmer ou confronter nos analyses et nos interprétations.

[Tri croisé 1 : Titres selon mode de visibilité / Visibilités confondues : les 10 plus visibles VS les autres]
[Tri croisé 1 : Titres selon mode de visibilité / Visibilités confondues : les 10 plus visibles VS les autres]

Pourtant, le manuel de ‘ Modalisa ’ prévient son utilisateur : « ‘ il ne faut pas confondre significativité et fiabilité du Khi2 : le Khi2 peut être significatif et non fiable ’ ». Lorsque le logiciel considère que le résultat n’est pas fiable, il informe à coté du résultat du χ² : (‘ Val. théoriques < 5 ’) et refuse de conclure sur la significativité du χ², comme il le fait, dans l’exemple cité plus haut, avec un « ‘ très significatif ’ ». Ce qu’il faut comprendre, ici, c’est que le χ² nécessite des effectifs élevés pour être fiable, ‘ Modalisa ’ refuse donc toute significativité si un des effectifs a une valeur théorique1141 inférieure à 5. Cette limite dans la fiabilité du χ² se révèle importante au regard de notre corpus.

Si nous désirons comparer la visibilité des dix personnages les plus visibles par rapport à la visibilité des quarante-sept autres et de croiser cela avec les modes de visibilités et ‘ Public ’, on constate que ‘ Modalisa ’ refuse de confirmer la significativité du χ² malgré une probabilité de 0,001 parce qu’une cellule a une valeur théorique inférieure à 5 (celle qui croise ‘ Public ’ et les autres). Or, ce problème de fiabilité est très fréquent dans notre corpus malgré un nombre de données important. Ce problème est dû en majeure partie à la particularité du magazine ‘ Public ’. Dans le tableau n°9, intitulé : « ‘ Nombre de Unes Politiques par titre sur la période du ’ ‘ 14 mai 2007 au 30 avril 2010 ’ », quelques pages plus tôt, on voit que, sur les 155 semaines de notre corpus, tous les titres mettent en scène un personnage politique dans au moins 44 numéros (ce seuil est celui de ‘ France-Dimanche ’) à l’exception de ‘ Public ’ qui a seulement 9 Unes politiques sur 155. A cela s’ajoute le fait que, dans ces neuf Unes, l’hebdomadaire ne met en scène que quatre personnages différents : Nicolas Sarkozy et Carla Bruni à six reprises, Rachida Dati, sur deux Unes et Jean Sarkozy, une seule fois. Par ailleurs, son mode de visibilité particulier nous empêche de pouvoir le regrouper avec un autre titre, pour atténuer ses faibles effectifs dans un groupe pertinent. De ce fait, de nombreux tri-croisés sont jugés non fiables par ‘ Modalisa ’. On le remarque d’ailleurs avec notre exemple, car dès que nous supprimons ‘ Public ’, la confirmation « ‘ très significatif ’ » est aussitôt énoncée par le logiciel. Nous avons poussé l’expérience au bout en associant ‘ Public ’ à chaque mode de visibilité, puis à chaque groupe de deux titres, puis enfin, à chacun des titres quand ceux-ci sont isolés les uns des autres : à partir du moment où ‘ Public ’ est regroupé avec un autre titre ou dès que celui-ci est supprimé, le résultat du χ² est fiable et devient : « ‘ très significatif  ’» avec la valeur ‘ p ’ égale à 0,001.

Deux conclusions de cette expérience et de ce problème de fiabilité posé par ‘ Public ’s’imposent. Premièrement, les faibles résultats de ‘ Public ’ ne changent pas les tendances dessinées par les autres titres ni celles de leurs regroupements. Deuxièmement, si, lors de la campagne présidentielle, aucune particularité de ‘ Public ’ quant à sa politisation et la médiatisation des personnages politiques ne se révélait, la période qui suit voit émerger de nouveaux éléments permettant de distinguer, une nouvelle fois, ce magazine des autres. Ainsi, dans ce chapitre, nos analyses laisseront de côté cet hebdomadaire, non pas parce qu’il inverse les tendances et les résultats mais parce que sa faible médiatisation des personnages politiques et sa moindre politisation dans la période post-campagne nous amènent à le traiter comme un cas particulier.

La question de la fiabilité et de la marge d’erreur se pose enfin dans sa pertinence et sa validité dans le cadre de notre étude. En effet, nous ne tentons pas de nous servir de ce corpus pour produire des généralités hors de lui mais le considérons dans sa clôture et sa consistance. La marge d’erreur repousse les limites de l’échantillonnage. Or, notre corpus n’est pas le produit d’un échantillon, mais rend compte de l’intégralité des données que nous étudions ou que nous souhaitons étudier. Nos données sont donc fiables parce qu’elles sont celles de la réalité de notre étude. Le problème posé par l’épreuve du χ² semble dépassé : c’est le test de significativité qui s’avère heuristique.

‘« Le χ² est donc extrêmement sensible aux effectifs : plus ceux-ci sont élevés, plus le risque de se tromper en rejetant l’hypothèse d’indépendance est faible, et donc plus la valeur du p est petite. Un χ² non significatif peut donc signifier soit qu’on ne peut rejeter l’hypothèse d’indépendance entre les lignes et les colonnes du tableau (dans le cas où les pourcentages lignes ou colonnes sont très proches les uns des autres), soit qu’il n’y a pas indépendance mais que les effectifs dont je dispose ne me permettent pas d’en être sûr statistiquement (dans le cas où les pourcentages lignes ou colonnes sont sensiblement différents).1142»’

Le risque des petits effectifs est celui de la non-significativité. Cependant, quand ceux-ci infirment l’indépendance des variables, la probabilité de se tromper n’existe pas. Ainsi, pour toutes ces raisons, nous rejetons la limite de la valeur théorique inférieure à 5.

Pour résumer, ce corpus quantitatif, Modalisa et le test du χ² offrent de nouvelles perspectives à notre étude qui écartent nos considérations sémiotiques et sociologiques pour un temps. Une telle investigation confrontée à nos analyses qualitatives permettra ensuite d’avancer dans la réflexion sur la notion de peopolisation et sur son incarnation dans notre corpus et dans l’espace public français.

Notes
1134.

La particularité de ‘ Public ’, appartenant à la fois à ces deux modes, nous amène à souvent ignorer cet hebdomadaire dans l’analyse. Si une telle éviction peut paraître surprenante, nous verrons, par la suite, qu’elle se justifie, et reviendrons sur ce cas particulier.

1135.

Ce rassemblement, par deux est justifié par leurs définitions au Chap. III-2-7.

1136.

Les huit titres cités ici et Public.

1137.

Pour les semaines charnières entre deux années, l’année dans laquelle le numéro du magazine est identifié, peut différer de l’année de parution. Il est important de souligner la difficulté pour la catégorisation semainière des numéros de ‘ Closer, ’ due à une parution anarchique : certaines semaines voient paraître deux numéros, d’autres aucun. Notons, par ailleurs, que les jours de parution de ce titre n’ont cessé d’être modifiés lors de notre période d’investigation.

1138.

Notre référence principale pour cette explication du test du χ² est : HEALEY, J., ‘ Statistics. A tool for social research ’, USA : Wadsford group, 2002.

1139.

Ces données ont été reproduites, Annexes. D. 1.

1140.

Le χ² ne nous permet pas de dire quelle variable influence et laquelle est influencée.

1141.

Les valeurs théoriques sont les effectifs calculés de telle sorte que chaque case représente à la fois la proportion du « total colonne » et du « total ligne » par rapport à la somme du tableau.

1142.

BARNIER, J., « Tout ce que vous n’avez jamais voulu savoir sur le χ² sans jamais avoir eu envie de le demander », 2010, p.25. [En ligne : http://alea.fr.eu.org/git/?p=doc_khi2.git;a=blob_plain;f=khi2.pdf]