La modélisation de la croissance des plantes selon Fisher

Dès lors, comment Fisher applique-t-il en particulier sa technique statistique aux problèmes de la croissance des plantes ? Pour répondre à cette question, il faut préalablement garder en l’esprit le fait que sa perspective de biologie mathématique appliquée vise avant tout la découverte des « causes » et la quantification de leurs poids relatifs dans la croissance végétale. De plus, comme son contexte de travail est agronomique, ses objets biologiques sont surtout des plantes herbacées. La valeur résultante mesurée pour évaluer leur croissance se réduit, pour le blé par exemple, à un simple décompte du nombre de boisseaux par récolte et par hectare ⁸⁶ . N’est donc pris en compte, comme résultat de la croissance de la plante, que ce qui intéresse a priori la production agricole : ici, le grain de blé. La représentation de la plante en tant que telle ne présente pas d’intérêt pour lui. L’approche informationnelle se confirme ici en ce que l’expérimentateur ne mesure dans le phénomène global que ce qui l’intéresse, et cela toujours en vue d’une action précise, anticipée, c’est-à-dire dont les effets sont déjà grossièrement prévus et/ou souhaités : par exemple, l’épandage d’engrais pour accroître la production.

Moyennant cette quantification très limitée, pragmatiquement orientée, de la croissance, et toujours dans le cas du blé, Fisher classe d’abord en trois grandes catégories ces différentes « causes de variation dans la production de blé » ⁸⁷ qui se trouvent être indépendantes de l’épandage d’engrais : 1) la variation annuelle due principalement au temps qu’il a fait dans l’année, 2) la détérioration du sol et 3) les changements lents. Ce sont ces derniers changements auxquels Fisher, à la fin des années 1910, ne sait pas encore assigner de causes mais au sujet desquels il veut justement tester plusieurs hypothèses causales. La résolution de ce problème est un des objets principaux de sa série d’articles sur la variation de la production de blé qui paraîtront à partir de 1921. Fisher y applique une technique d’analyse de variance au moyen de laquelle il évalue les contributions de chaque facteur dans la variation de croissance du blé ⁸⁸ . Cela lui permet de montrer le rôle vraisemblable (au sens rigoureux de mot « vraisemblance » [“likelihood”] qu’il introduit à l’époque) que joue l’envahissement lent mais progressif des semis par les mauvaises herbes.

L’analyse ou réduction de la variance
La technique des plans d’expérience telle qu’elle a été développée par Fisher à partir des premiers travaux de W. S. Gosset est souvent présentée comme synonyme de la technique d’« analyse de la variance » alors que Fisher met cette dernière au point plutôt dans un contexte de génétique des populations, aux alentours de 1918. En fait, cette technique peut être considérée comme référant ensuite spécifiquement à la partie d’analyse statistique des plans d’expérience.
Pour la mettre en œuvre ⁸⁹ , à partir des mesures et par la méthode des moindres carrées, on procède d’abord à une estimation des paramètres de la population infinie. Ensuite, on évalue les différences ou résidus entre les résultats observés et les résultats estimés. La variance de ces résidus s’appelle variance de l’erreur ou variance résiduelle. La technique d’analyse ou de réduction de cette variance repose tout entière sur le principe que les variances s’ajoutent lorsque les effets des différents traitements ou facteurs opérant sur la plante sont indépendants. Dans ce dernier cas, on montre que « la somme des carrés des résultats observés est égale à la somme des carrés des résultats ajustés augmentée de la somme des carrés des résidus » ⁹⁰ . Autrement dit, il apparaît que l’on peut complètement séparer l’erreur résiduelle des autres contributions à la variance et ainsi directement travailler à la réduire. De façon plus générale, lorsque l’on a plusieurs paramètres indépendants à estimer, on peut montrer que la somme des carrés des résultats observés est égale à la somme des différentes sommes des carrés des résultats ajustés à chacun des paramètres. On peut donc séparer les contributions de ces différents paramètres dans la variance globale et l’on parle alors plus généralement de décomposition ou d’analyse de la variance.

On voit donc que le travail de Fisher consiste principalement à démêler les causes qui paraissent sinon enchevêtrées dans les phénomènes de croissance biologique que l’on mesure. Un des objectifs plus large du travail de Fisher est en fait de donner à terme la possibilité aux agronomes de prédire la production en blé en fonction des relevées météorologiques. Mais encore faut-il pour cela avoir extrait les causalités parasites qui interfèrent avec le facteur climatique : c’est bien justement le sens de tout son travail statistique.

On peut une fois de plus faire remarquer ici que puisque l’objectif est seulement d’y démêler des causes et non pas d’en représenter le processus, la nature précise de la plupart des causes n’est pas assignée : seules celles qui intéressent l’agronome sont précisément qualifiées. Ainsi, avec l’outil statistique, il est également possible de regrouper un grand nombre de causes relativement hétérogènes sous une même loi de variation pour peu que ces variations, prises en bloc, soient en fait globalement indépendantes de celles qui intéressent l’expérimentateur ⁹¹ . La « cause », on le voit, n’est donc pas traitée comme une entité réelle, en soi, et qu’il faudrait découvrir ou dévoiler. Comme les mots qui figurent dans une information à support syntaxique purement structural, la cause est délimitée dans ses contours mais elle n’est pas définie en sa nature. De même que pour le signe linguistique au sens de Ferdinand de Saussure, sa définition est informationnelle au sens où elle est essentiellement différentielle : elle est de n’être pas une autre. On comprend dès lors que le seul travail que l’on puisse effectuer sur de telles causes ne soit que de la nature d’une discrimination. Ainsi, pour Fisher, la cause est bien une simple « matrice causale » puisque elle est simplement aperçue et réalisée au travers de la grille informationnelle que donnent les mesures du plan d’expérimentation. L’importance d’une cause dans un processus peut certes être inférée à partir des mesures, mais seulement à la condition que l’expérimentateur ait au préalable, d’une part, déjà prévu et qualitativement discriminé cette cause dans son discours au moment de la préconception du plan d’expérience et, d’autre part, que sa contribution se révèle quantitativement forte après analyse de la variance, comme c’est en effet le cas des mauvaises herbes dans la production de blé.

Notes

86.

Voir [Fisher, R. A., 1921a], p. 110.

87.

“The causes of variation in wheat yields”, [Fisher, R. A., 1921a], p. 109.

88.

[Fisher, R. A., 1921a], p. 111.

89.

Pour ce rappel, nous nous sommes aidé de la présentation didactique de [Vessereau, A., 1947, 1960, 1988], pp. 174-175.

90.

[Vessereau, A., 1947, 1960, 1988], p. 176.

91.

Voir notre encadré.