La statistique comme discipline-objet de la recherche en statistique dans son application à la recherche en sciences de l’éducation

Nous pensons que la recherche en sciences de l’éducation peut rencontrer des problèmes méthodologiques qui appelleraient eux-mêmes des recherches dans le domaine de la statistique. L’histoire de la statistique illustre bien, par exemple, la part des recherches en psychologie expérimentale dans son développement. Certes la panoplie des outils offerts actuellement paraît largement satisfaire les besoins des chercheurs en sciences de l’éducation. Mais rien ne dit que des points de vue nouveaux n’enrichiraient pas ces recherches. Par exemple, dans cette perspective, nous avons tenté d’importer une approche, par ailleurs bien connue à partir des travaux de Warner (Warner 1965), préservant l’anonymat des individus interrogés sur des questions sensibles. Ceci est l’objet de l’article Respecter l’anonymat : suggestion pour une mise en œuvre de méthodes de collectes des données respectant le secret de la réponse.  [1992b]. Force est de constater qu’il n’a pas rencontré beaucoup d’échos. Sa mise en œuvre, dans une recherche, ne relève peut-être d’aucune des configurations déjà prévues ce qui conduirait à des transformations générant des problématiques statistiques.

Mais les questions qui nous intéressent le plus et devant lesquelles nous n’avons pas encore de réponse suffisamment générale sont celles attachées aux statistiques de rang. Il nous semble que, dans nombre de recherches en sciences de l’éducation, le rang constitue une variable particulièrement bien adaptée [1996a p.67-68]. Ainsi quand nous souhaitons savoir s’il existe une tendance à l’accord dans un groupe relativement à des choix préférentiels comme dans l’exemple ci-dessous, où il est demandé à cinq stagiaires de ranger par ordre décroissant d’importance les énoncés relatifs aux raisons qui les ont conduit à suivre un stage. Dans le cas présenté, les cinq individus ont fourni une réponse complète, c’est à dire une des 8 ! permutations. Le test de concordance de p rangements de n objets de Friedman [ 1996a p.93] ou celui de M. G. Kendall [ 1996a p.91-93] permettent de tester l’hypothèse H0 d’indépendance des jugements contre l’hypothèse alternative H1 de tendance à la concordance des jugements. La statistique utilisée est d’une forme mathématiquement connue et a été tabulée. Ceci permet de travailler à un niveau de risque de première espèce  connu. Des difficultés commencent à apparaître quand les individus posent quelques ex æquo.

Tableau 0 - 1 : Exemple de recueil des rangements préférentiels
  items Énoncés des items
individus n°1 n°2 n°3 n°4 n°5 n°6 n°7 n°8 1 Actualiser ses connaissances théoriques professionnelles
Stagiaire01 1 3 5 8 6 7 2 4 2 Sortir de la routine quotidienne
Stagiaire 02 4 1 7 5 6 2 8 3 3 Se confronter à des situations de formation
Stagiaire 03 4 1 6 3 2 8 5 7 4 Compléter sa formation
Stagiaire 04 1 6 4 2 3 8 7 5 5 Espérer une meilleure reconnaissance professionnelle
Stagiaire 05 5 2 3 4 7 8 6 1 6 Se donner l’occasion de mieux comprendre les difficultés rencontrer dans l’exercice du métier
Sommes des rangs 15 13 25 22 24 33 28 20 7 Avoir une occasion de rencontrer des collègues et d’échanger
                  8 Espérer améliorer les pratiques professionnelles quotidiennes

Mais un problème que nous avons rencontré dans une étude menée par un étudiant, est apparu avec le protocole suivant que nous adaptons à notre exemple : Choisir les quatre items qui correspondent le mieux à votre situation et les ranger dans l’ordre décroissant d’importance. Dans cette circonstance, la statistique mise en œuvre requiert un traitement particulier pour obtenir un test d’hypothèse analogue au cas précédent.

Nous avons même vu, dans une autre étude, un cas beaucoup plus général dans la mesure où les individus n’avaient pas choisi le même nombre d’items à ranger et avaient mis des ex æquo. Nous n’avons pas trouvé, à ce jour, de traitement général de ce cas. Pour cela reste une problématique statistique à laquelle nous souhaitons continuer à nous confronter. Il s’agirait de bâtir un test de concordance des rangements de kp objets pris parmi n objets selon p critères synthétiques. Chacun des p individus détermine un critère synthétique et le nombre k varie d’un individu à l’autre. Nous avons ébauché quelques solutions partielles très insuffisantes en cherchant une statistique qui s’appuie sur les sommes de scores calculés à partir des rangs obtenus par chaque objet, ces scores étant obtenus à partir d’une règle du type :

  Les ki objets rangés Les n-ki objets non rangés
Rangs donnés par l’individu i
1 i  p qui a choisi ki objets parmi les n présentés
1 2 3 ki  
Scores n n -1 n -2   n -ki +1 0

À ce stade, le problème reste ouvert pour nous.

Pour continuer, nous souhaiterions aborder la question des variables qualitatives et de leurs traitements. Ce type nous apparaît comme particulièrement adapté aux études des phénomènes éducationnels où la mesure quantitative s’avère souvent difficile et parfois peu pertinente. Mais alors plus de moyenne ni de variance ! L’inconfort semble ressurgir car nous avons pu constater maintes fois que des chercheurs n’hésitent pas à coder numériquement les modalités dans une visée quantitative. Du codage numérique à la mise en œuvre des traitements réservés aux variables quantitatives, il n’y a qu’un pas que d’aucun n’hésite nullement à franchir. Plutôt que de s’évertuer à tolérer de telles pratiques, nous souhaiterions promouvoir des recherches visant explorer le champ des exploitations possibles de telles variables qualitatives. Nous ne savons pas encore en quoi la modalité ‘« tout à fait satisfaisant’ » codée 4 pouvait être la somme de quatre modalités ‘« tout à fait insatisfaisant’ » codée 1 ! Nous ne parvenons pas à comprendre que la satisfaction soit la somme d’insatisfactions élémentaires.

Plus nous aurons de connaissances relatives aux traitements des variables qualitatives, plus nous disposerons d’outils adaptés aux recherches en sciences de l’éducation.

Enfin en ce qui concerne les questions de la représentativité et de la significativité que nous avons abordées dans [1997f], nous pensons qu’ici aussi des recherches pourraient être conduites dans le domaine particulier des théories du sondage et de l’échantillonnage. En effet, les recherches en sciences de l’éducation font fréquemment référence à des échantillons de petite taille n obtenus, d’une part, difficilement par des méthodes aléatoires et, d’autre part, généralement par tirage sans remise au sein de population de taille finie N. Les conditions classiques d’application des tests statistiques ou des estimations statistiques ne sont guère remplies. Aussi l’exploitation d’outils plus adéquats serait à mieux considérer, et s'ils font défaut, ce serait l’occasion de développer de tels outils au travers d’une collaboration avec des statisticiens professionnels.

Pour achever cette discussion, nous reprenons cette phrase de Michel Develay (Develay1992 p.90) ‘« Nous sommes convaincu que le didactique et le pédagogique constituent deux domaines en interactivité forte, au sein des sciences de la décision…’ ». Or évoquer ces sciences de la décision renvoie aux sciences statistiques qui constituent un pourvoyeur de méthodes, de techniques et de notions particulièrement adéquates à la construction de modèles décisionnels. Tout un pan de la statistique est articulé à la thématique de la prise de décision en situation incertaine et sur informations partielles. Et là, il nous paraît utile de mieux cerner les outils pertinents à mobiliser dans la modélisation des situations didactiques et pédagogiques. Ces modèles seront d’autant plus performants qu’ils pourront intégrer des niveaux de complexité de plus en plus élevés. Dans la boîte à outils statistiques, cela correspond à la possibilité de prendre en compte simultanément plusieurs variables éventuellement de nature distincte. Ceci justifie à nos yeux l’intérêt d’une recherche en statistique appliquée à la recherche en sciences de l’éducation.