4.1.2. Appréhender la notion de hasard et mettre au centre la variabilité

Contrairement à une opinion fortement répandue, notre conception du hasard est erronée. C’est une notion à construire pour ne pas arrêter notre jugement à la première impression ! Quand on capture des animaux “au hasard” en chassant, ce seront les plus faibles que l’on attrapera. Si l’on questionne les habitudes alimentaires pendant la journée, on privilégie de la sorte tous ceux qui ne sont pas ou plus en situation d’activité professionnelle ! etc. Notre spontanéité ne nous conduit pas immédiatement, à porter un regard objectif aux populations observées ! Dans ce sens, une expérience nous est donnée par Nicole Vogel de l’IREM de Strasbourg. Dans le bulletin n°54, d’octobre 2004, des publications des revues pédagogiques de la Mission laïque française, Activités mathématiques et scientifiques (pp. 59-63), elle nous montre combien notre perception du hasard est faussée ; elle présente une expérience s’appuyant sur « Comment peut-on imiter le hasard ? Comment une suite de vrais lancers de pile ou face, se distingue-t-elle d’une suite “choisie au hasard”»? Pour cela, elle demande à une classe de terminale ES, de lancer cent fois une pièce de monnaie et de noter la suite des résultats des cent lancers en indiquant P pour pile et F pour face. Le bilan de l’expérience montre que dans la réalité, les séries de lettres semblables qui se suivent, peuvent atteindre des chaînes de 11 lettres identiques alors que les élèves voulant imiter le hasard n’osent pas dépasser des chaînes égales au plus à 6 lettres identiques successives ! Ce qui fait dire à Nicole Vogel que :

‘« on peut même adopter le critère suivant pour distinguer une suite expérimentale d’une suite inventée : s’il n’y a pas de séquence de longueur au moins 6, on se trompe peu en décidant que la suite est inventée (surtout si elle n’a pas non plus de séquence de longueur 5) et s’il y a une séquence de longueur 6 ou plus, on peut penser que la suite est expérimentale. Les imitateurs ont une mauvaise intuition du hasard ! » ’

En effet, elle donne les précisions suivantes : « La probabilité de trouver une séquence de longueur au moins 6 dans une suite de 100 lancers est environ égale à 81 % […] et que la probabilité de trouver une séquence de longueur au moins 5 dans une suite de 100 lancers est environ égale à 97 % ». Le calcul fournit les résultats suivants pour une suite de 100 lancers :

Tableau 34 : Longueur des chaînes d’apparitions identiques dans le jeu de pile ou face
Longueur de la plus longue séquence : au moins 4 5 6 7 8 9 10 11 12
Probabilité arrondie au centième 1,00 0,97 0,81 0,54 0,31 0,17 0,09 0,04 0,02

Et elle conclut par : « On voit donc que certains événements de très forte probabilité sont peu intuitifs… On se rend ainsi compte qu’il n’est pas du tout évident de choisir «au hasard» ! (p. 60).

Le terme même d’aléatoire n’est que récemment devenu commun car dans l’ouvrage de Varga (VARGA, 1973), l’auteur est obligé, encore à cette époque, d’en donner une définition ! De plus, il paraît difficile de faire entrer les étudiants en contact avec l’aléatoire ; Jean-Pierre Raoult, (RAOULT, 2004), à l’Université d’été d’ANIMATHS de Saint-Flour, le 26 août 2004, relatait une problématique de la table ronde organisée par la SFDS et animée par Gilbert SAPORTA (p.7) : « Il y a comme un cercle vicieux : on veut faire comprendre les variables aléatoires via la simulation,[et] pour comprendre la simulation, il faut savoir ce qu’est une variable aléatoire (et aussi des variables aléatoires indépendantes). » Ce qui fait dire à Jean-Pierre Raoult : « Quoi regarder ? Comment regarder ? », si l’on sait en plus que « les générateurs de nombres au hasard dans les ordinateurs sont en fait déterministes. »

L’idée de hasard est à relier à celle de variabilité. Cette insistance fait consensus. Pour Daniel Schwartz (Schwartz, 1994), « la variabilité est la raison d’être de la statistique » ; pour Jean-Pierre Kahane, (Kahane, 2000), « Le mot variabilité peut être considéré comme le premier mot de la statistique ». Pour Claudine Vergne (VERGNE, 2004, p. 3) :

‘« prendre conscience de la variabilité d’un phénomène, ce n’est pas seulement constater que les résultats sont sujets à variation, c’est concevoir que, à notre échelle d’observation, les résultats sont nécessairement variables et imprévisibles, c’est accepter de prendre en compte les fluctuations, c’est faire le deuil de la certitude et s’engager dans le monde de l’incertain. On peut alors, […], accéder à une maîtrise relative de l’incertitude pour estimer, prévoir et prendre des décisions avec risque consenti ». ’

De plus, pour Claudine Vergne, faire aborder la variabilité aux élèves, se construit (p. 4) : « Une condition essentielle de variabilité d’un thème d’étude est celle de l’existence, relativement à ce thème, d’un corpus suffisant de situations problèmes permettant à l’enseignant de construire des organisations mathématique et didactique ». D’où l’importance de l’existence de banques de données ainsi que de leur exploitation par de fréquentes lectures. Nous constatons donc que pour tous ces auteurs, ayant recherché les éléments de base, distinctifs d’une pensée statistique, l’accord se réalise autour de la notion essentielle de “variabilité”. Celle-ci a pour corollaire d’autres obligations comme le souligne le document d'accompagnement du programme de mathématiques de la classe de seconde de Juin 2000 (hors-série n° 6 du 12 août 1999) : « l’esprit statistique naît lorsque l’on prend conscience de la fluctuation d’échantillonnages ». Mais la confrontation usuelle à celle-ci, conduit-elle « naturellement à accepter l’idée d’une loi théorique fixe liée à cette expérience ? ». Analyser une situation statistique, ce n’est pas s’arrêter aux données perçues (les statistiques) mais se hisser au-dessus pour comprendre les lois qui semblent gérer ces manifestations apparentes (la statistique). Cette préoccupation, cœur de la recherche de Jean-Claude Régnier, prend aussi tout son sens par la distinction à faire entre les notions de corrélation et de causalité (GAUVRIT, 2007). D’autres questions didactiques sont ensuite posées par les chercheurs comme Omar Rouan (ROUAN, RÉGNIER, 2004) qui met en avant la nécessité de connaître l’histoire de la statistique, de ses applications actuelles, de répertorier les types de problèmes ouverts à la statistique, de varier les champs d’application, d’établir des heuristiques en statistique, de réfléchir à une gradation de la difficulté des élèves en fonction des questions abordées ; il cite par exemple les questions faciles (types de caractères, construction d’un tableau à partir de données brutes, la moyenne de ces données) et les questions plus difficiles (le pointage de la population de référence, la construction de l’histogramme, le calcul de la médiane pour des données présentées en intervalles). Il préconise de rechercher une moins grande présence de formalisme (voir expérience italienne en annexe n°5.7, qui conforte au passage nos remarques concernant la réponse des étudiants à la statistique en fonction de leur parcours scolaire, ainsi que le rapport des enseignants envers elle et la nécessité d’une formation et d’une imprégnation lente à et par la statistique), et de mettre en avant un rapprochement entre enseignants, élèves et chercheurs. Il reste également la prise de conscience de la double dualité entre : les approches “fréquentiste” et “bayésienne” d’une part, et les références aux probabilités ou à la statistique d’autre part. Pour cette dernière, Jean-Claude Girard au colloque EMF de Tozeur (Tunisie), avance (GIRARD, 2003) : « la présentation de la théorie des probabilités se fait par l’intermédiaire d’une modélisation des situations aléatoires. La méthode utilisée fait une large place à la simulation. La liaison entre l’enseignement de la statistique et celui des probabilités reste à établir ; cette mise en place nécessitera du temps ». Comment l’élève peut-il faire le lien entre le modèle théorique choisi pour représenter le déroulement de la réalité et la réalité elle-même ? Réfléchissons donc à l’idée de modélisation.