2.2. Un lien permanent avec le support mathématique

C’est cet aspect de proximité de la statistique avec l’environnement quotidien de l’élève mais sans oublier le lien permanent et indispensable avec le support mathématique théorique que nous signale le rapport de la Commission de Recherche sur l’Enseignement des Mathématiques en précisant que (KAHANE, 2000, p. 51) « La statistique traite de données expérimentales ou d’observation, à étudier dans leur contexte (data with contexts) : sa spécificité est d’établir des liens entre ces données et la théorie mathématique des probabilités, d’expliquer ainsi le passé et de prévoir l’avenir. »Aborder le traitement statistique avec les élèves de cycle III de l’école élémentaire pourrait paraître limpide au point de le limiter à la mise en jeu de la statistique exploratoire ou descriptive dont l’objet (p. 51) « est de représenter graphiquement, de résumer, de classer des données expérimentales ou d’observation. » Mais il est important d’approfondir l’avis donné par cette même commission qui recentre notre regard sur l’aspect scolaire tout en lui garantissant une logique de cursus global, c’est à dire de cohérence d’apprentissage sur toute la scolarité de l’élève. Elle précise ainsi (p. 51) : « Confronter des données à des modèles probabilistes pour en expliquer la structure et faire de la prévision est l’objet de la statistique inférentielle. La modélisation ne peut se faire en aveugle », c’est-à-dire sans observer, résumer, étudier la structure des données expérimentales : des allers et retours sont nécessaires entre leur exploration et leur modélisation stochastique. Cependant, si les deux composantes exploratoire et inférentielle sont au cœur de la pratique de nombreux statisticiens professionnels, celles-ci se sont développées au point que chacune a aussi ses domaines de recherche et ses champs d’applications propres et autonomes. Ainsi en statistique exploratoire, des outils tels la classification, l’analyse descriptive multivariée peuvent être employés pour eux-mêmes, sans modélisation stochastique. Le traitement de l’information chiffrée, c’est à dire le calcul d’indices à partir de données brutes (pourcentages divers, taux de natalité, etc.) qui est la partie la plus ancienne de la statistique descriptive, ne nécessite pas systématiquement des prolongements de nature probabiliste.

Et pourtant (p. 52), « Il ne faut pas pour autant oublier le lien essentiel de la statistique et des probabilités. » Cette nécessité des “allers et retours” entre exploration et modélisation des résultats, nous oblige à anticiper deux niveaux de distinction à opérer pour structurer le contact que les élèves auront avec cet apprentissage :

  • Le premier sera de distinguer d’une part, l’image spontanée des statistiques qui inondent les éléments d’information quotidiens, et d’autre part, la statistique, outil enseigné.
  • Le second sera de préciser le rapport entre statistique et probabilités.