5.2. L’implication statistique entre variables : la classification hiérarchique, implicative et cohésitive

Distinguons d’emblée l’implication statistique entre variables et la classification hiérarchique, implicative et cohésitive :

  • l’implication statistique entre variables est une méthode ;
  • la classification hiérarchique, implicative et cohésitive est le nom du logiciel (CHIC) analysant les données par la méthode de l’implication statistique entre variables.

Nous nous appuyons sur les travaux de Régis Gras 169 , qui a conçu la méthode et le logiciel, pour cette étape ultime de l’analyse des représentations sociales. Le logiciel est un outil de traitement de données qui permet de mettre en évidence des associations entre des variables comme des comportements observés, des réponses à des questionnaires, des opinions, des degrés d’intensité. De plus, « l’implication statistique est un outil puissant pour travailler sur les représentations sociales et mettre en évidence leur structure organisatrice » 170 . L’outil informatique produit un graphe qui structure en réseau l’ensemble des variables. Il fournit une hiérarchie des classes de variables qui se « regroupent » par leurs ressemblances ou par leurs implications, « le graphe implicatif qui structure les variables considérées en chemin, signe d’une certaine nécessité d’une relation entre les comportements » 171 . Il est adapté à la mise en évidence du noyau central et des éléments périphériques. Le graphe produit est un graphe de similitude 172 qui visualise la hiérarchie des différents constituants de la représentation sociale. « L’analyse statistique implicative, d’une part, permet de déceler les règles pertinentes à partir d’un test d’hypothèses sur des données variées, d’autre part, offre, selon une démarche calquée sur la classification hiérarchique classique, une représentation hiérarchique des métarègles et une analyse des contributions des attributs et individus aux différentes associations » 173 .

L’implication statistique entre variables permet de « prédire la façon dont un individu ayant répondu à une variable répondra à d’autres variables » 174 . Une attitude est dépendante d’une autre. Travaillant sur du matériel humain à démarche cognitive, nous avons tenu compte d’une non conformité de certaines réponses. Régis Gras parle de l’observation d’une « quasi-implication et que ce type d’écart est inhérent à toutes recherches s’appuyant sur une démarche cognitive » 175 .L’implication statistique entre variables dégage la contingence entre les situations, son but est de hiérarchiser des réponses cognitives dans une structure, elle porte sur le croisement d’un ensemble de variables et d’un ensemble de sujets.

La méthode de l’implication statistique entre variables permet aussi bien de « valider et conforter des hypothèses formulées à priori, mais également quelques fois de les invalider » 176 , elle a pour but :

  • de dégager des règles entre les variables ;
  • de mesurer la qualité de ces règles (c’est la quasi-implication) ;
  • de représenter les structures issues des règles (graphes) et métarègles (hiérarchie) ;
  • de mesurer la qualité des structures obtenues ;
  • de mesurer la relation des éléments entre eux.

Pour obtenir tous ces éléments, l’implication statistique entre variables, par le calcul des variables mises en jeu, fournit :

  • l’arbre des similarités, qui forme des couples de variables à un premier niveau. Les couples se constituent par un critère de similarité ou de ressemblance des variables. L’arbre associe ensuite des couples déjà formés (qui sont alors considérés comme une seule variable) pour former d’autres couples à un second niveau. Plus on avance dans l’analyse et moins les similarités sont fiables. A un certain niveau de l’analyse, les associations ne sont plus à considérer compte tenu de leur fiabilité aléatoire. Les classes obtenues permettent au chercheur d’interpréter les associations ;
  • le graphe implicatif, qui donne une image des liens existants. Un certain nombre de flèches apparaissent, permettant l’analyse de l’intensité de ces liens (CHIC propose quatre niveaux d’intensité) sachant qu’un comportement A va entraîner un comportement B. Dans le cas présent, Régis Gras 177 parle de « quasi-implication » : A entraîne presque B ;
  • l’arbre cohésitif, qui associe les variables en classes de variables, dégage leur cohésion. Il se traduit par une hiérarchie descendante qui emboîte les classes. Plus on « descend » dans les associations et moins elles sont fiables.

Ces trois éléments sont utilisés dans le quatrième chapitre de la quatrième partie de notre thèse et permettent un retour sur l’hypothèse émise.

Notes
169.

Les publications de Régis GRAS figurent dans la bibliographie.

170.

BAILLEUL M. 2001. « Des réseaux implicatifs pour mettre en évidence des représentations », Mathématiques et Sciences humaines, 154-155, pp 31-46.

171.

GRAS R. 1996. L’implication statistique Nouvelle méthode exploratoire de données, Grenoble, La pensée sauvage, p. 127.

172.

GUIMELLI Ch, ROUQUETTE M.-L. 1992. « Contribution des schèmes cognitifs de base à l’analyse structurale des représentations sociales », Bulletin de psychologie, 405, pp 196-202.

173.

GRAS R., KUNTZ P., BRIAND H. 2001. « Les fondements de l’analyse statistique implicative et quelques prolongements pour la famille de données », Mathématiques et Sciences humaines, 154-155, pp 9-29.

174.

GRAS R. 1996. L’implication statistique Nouvelle méthode exploratoire de données, Grenoble, La pensée sauvage, p. 11.

175.

Communication au colloque de l’Université Lumière Lyon 2 : statistiques en sciences sociales, juin 2002.

176.

GRAS R. 1996. Ibid, p. 128.

177.

GRAS R., L’implication statistique Nouvelle méthode exploratoire de données, Grenoble, La pensée sauvage, 1996, p. 83.