La signification de la mathématisation chez R. A. Fisher

Fisher s’inscrit explicitement dans la lignée des biométriciens et il reprend à Francis Galton l’idée que la biométrie est cette discipline qui, par excellence, se trouve être sensible à la variabilité des phénomènes biologiques. En conséquence, elle cherche à conserver au maximum cette variabilité dans ses formalisations 62 . Et c’est le « concept contemporain des distributions de fréquence » qui, selon Fisher, incarne mathématiquement la prise en compte par la pensée contemporaine de cette variabilité essentielle 63 . Mais, comme cela a été souvent rappelé 64 , le problème spécifique qu’il rencontre à Rothamsted est celui du traitement statistique des petits échantillons. Dans ce dernier cas, il n’est en effet plus possible de négliger l’écart entre une valeur théorique et une valeur estimée. Il lui faut donc suivre le chemin déjà tracé par William S. Gosset (1876-1937, alias « Student ») en 1908 et prendre en compte l’erreur probable dans l’estimation des paramètres des courbes de distribution de fréquence, comme dans l’estimation de la moyenne par exemple 65 .

C’est là que Fisher, en se distinguant de la perspective de Karl Pearson, adopte une perspective délibérément informationnelle 66 sur les mesures effectuées. Comme, à cause de la petitesse des échantillons, il lui est nécessaire de distinguer, d’une part, la population hypothétique des observables et, d’autre part, les observations elles-mêmes, Fisher s’habitue à considérer qu’il faut faire le tri entre ces maigres et disparates données en fonction de leur qualité informationnelle au regard des paramètres estimées. La mathématisation qui en résulte s’éloigne donc d’un degré de ce qui pourrait être sinon vu comme un paramètre naturel représenté mathématiquement. En ce sens, il s’agit d’une représentation mathématique d’une information glanée sur le vivant mais pas directement d’une représentation mathématique du vivant. Pour préciser notre interprétation, maintenant que nous avons succinctement rappelé le contexte et la solution technique proposée par Fisher, tâchons de reconstituer l’itinéraire épistémologique qui a pu mener Fisher à de telles considérations.

Notes
62.

[Fisher, R. A., 1948], p. 218.

63.

“the modern concept of frequency distributions”, [Fisher, R. A., 1948], p. 218.

64.

[Desrosières, A., 1993, 2000], p. 353.

65.

Dans l’article célèbre “The probable error of a mean” paru dans Biometrika ([Gosset (alias ‘Student’), W. S., 1908]). Voir l’hommage que lui rend Fisher in [Fisher, R. A., 1925, 1946, 1947], pp. 18-19. Dans cet article, Gosset postule dès les premières phrases que « toute expérience doit être regardée comme constituant un individu parmi une population d’expériences qui pourraient être effectuées dans les mêmes conditions » et ainsi qu’une « série d’expériences est un échantillon extrait de cette population » (“Any experiment may be regarded as forming an individual of a ‘population’ of experiments which might be performed under the same conditions. A series of experiments is a sample drawn from this population”, [Gosset (alias ‘Student’), W. S., 1908], p. 1.

66.

Sur l’importance du rôle de Fisher dans l’émergence de la notion scientifique d’information, nous renvoyons à l’étude fouillée de [Segal, J., 1998], chapitre Ib. Pour notre part, nous ne suivrons pas ici les avatars de cette notion d’information, mais nous essaierons en revanche d’en évaluer le rôle dans l’introduction au cœur de la méthode expérimentale de ce qui deviendra le « modèle statistique ». Dans ses travaux, J. Segal montre que Fisher a d’abord été inspiré par le sens le plus commun du terme information, celui de simple renseignement, avant d’en venir à une définition mathématique rigoureuse.