Construire un caractère non directement observable : une probabilité objective

Il reste à exprimer, dans ce scénario, comment interviennent les caractères pour la constitution de la fertilité. Or, on ne peut pas exprimer la fertilité directement en fonction du nombre des cerises présentant tel ou tel caractère sur tel arbre, mais seulement en fonction de leur distribution statistique. Mais de quoi la distribution statistique des caractères est-elle finalement l’indice ? De Reffye choisit de supposer qu’elle est l’indice de la manifestation de lois de probabilités simples et identiques, quel que soit l’arbre, comme la loi binomiale 1471 . C’est cette supposition qui est d’abord traitée à titre d’hypothèse testable. Les caractères dont les taux de présence ou d’absence statistiques sont observés et mesurés sur les arbres permettent ainsi de remonter à leur probabilité d’apparition. L’approche modéliste a donc pour conséquence de nous obliger à adopter une interprétation quasi-objectiviste des probabilités 1472 puisque ce sont ces probabilités qui serviront à leur tour à définir la fertilité globale de l’arbre. Autrement dit, on ne s’arrête pas à la mise en évidence des probabilités et à l’estimation de leurs valeurs. C’est cela qui impose de traiter les probabilités, que le scénario hypothétique nous a commandé d’introduire, comme des objets ou quasi-objets. Malgré le fait qu’elles ne représentent pas la mesure d’une entité physique concrète, on les traite quasiment comme des mesures d’objets biologiques car on les fait entrer dans un processus algébrique qui seul nous donnera ce que l’on cherche finalement à évaluer, en l’occurrence la fertilité de l’arbre.

Philippe de Reffye parvient ainsi à définir quatre paramètres dont les trois premiers sont estimables en champ par des échantillons représentatifs prélevés systématiquement et à des dates précises (qui sont fonction du degré de maturation des cerises) sur les caféiers. Ces quatre paramètres sont :

De Reffye montre alors que, tous les paramètres clés ayant été pris en compte, la fertilité totale d’un arbre s’écrit simplement comme le produit de ces quatre paramètres ou probabilités :

f = U * P1 * r * P2

Une grande partie du travail du second article de 1974 et de la thèse de 1975 a alors consisté à tester les hypothèses de ce modèle mathématique à l’aide des distributions fournies par les échantillons mesurés sur les arbres :

‘« On cherche alors si les proportions trouvées entre les trois catégories de cerises peuvent provenir d’une loi binomiale. » 1474

La validité du modèle probabiliste est donc testée. De Reffye utilise pour ce faire les tests de significations notamment le test du χ2 (classique en statistique inférentielle depuis les travaux de Karl Pearson publiés en 1900 1475 ). Tous les ajustements qu’il trouve semblent satisfaisants. En ce qui concerne P1 et P2, il met au jour des valeurs caractéristiques pour chaque espèce et pour chaque forme hybride de caféier. Ainsi c’est telle loi binomiale, avec son paramètre ou probabilité P, qui devient, aux yeux de de Reffye, une caractéristique « de l’arbre lui-même tout entier » 1476 . Cela atteste selon lui d’une détermination principalement génétique de ces probabilités. L’approche modéliste n’a donc pas qu’une incidence descriptive ou purement déracinée pour l’agronome qu’est de Reffye. Car elle nous offre une grille de lecture transversale qui nous apprend à voir autrement les phénomènes élémentaires sans forcément nous obliger à les considérer microscopiquement : dans la mesure où l’on observe que des rameaux différents développent, dans un même arbre, les mêmes probabilités P1 et P2 (phénomène inappréciable sans cette grille de lecture qu’est justement le modèle), l’observation guidée par le modèle a priori permet de suggérer l’idée de processus causaux à échelle globale, c’est-à-dire à l’échelle de l’arbre entier, donc qui ne peuvent être commandés en dernier ressort que par la génétique. Le modèle est donc loin d’être une fiction pour de Reffye. De surcroît, en ce qui concerne les déviations à la loi binomiale qui peuvent apparaître, elles sont interprétées par de Reffye comme provenant de causes de nature écophysiologique : ce peut être l’altitude par exemple 1477 . Et c’est le taux de ces déviations qui est rapporté dans le paramètre U.

Notes
1471.

Une loi binomiale intervient lors d’épreuves répétées sur des événements complémentaires. Ainsi, si l’univers se réduit à deux événements, lorsque l’on répète n fois le tirage aléatoire entre ces deux événements, les probabilités respectives de ces deux événements, p et 1-p, se composent pour former celles de leurs différentes combinaisons. Les valeurs de ces probabilités composées sont alors égales aux termes successifs du binôme de Newton ((1-p) + p )n (d’où le nom de loi binomiale) : la probabilité globale que l’événement dont la probabilité élémentaire est p se répète k fois sur n tirages est donc Pk = Cn k pk (1-p)n-k.

1472.

L’interprétation objectiviste est celle qui consiste à voir dans les mesures statistiques la manifestation d’un hasard objectif intervenant dans les phénomènes eux-mêmes. Elle va souvent de pair avec une perspective modéliste selon l’historien et sociologue des sciences Ian Hacking [Hacking, I., 1990, 2001], p. 98 : « the fundamental distinction between ‘objective’ and ‘subjective’ in probability – so often put in terms of frequency vs. belief – is between modelling and inference. » L’interprétation subjectiviste attribue ces fluctuations aléatoires à l’impossibilité de notre total contrôle ou de notre totale connaissance des conditions dans lesquelles nous mesurons ces phénomènes. Or, l’approche modéliste de la fructification semble pouvoir donner raison aux deux. Tout dépend du niveau ontologique que l’on choisit de valoriser. Si l’on juge plus réel, c’est-à-dire plus ontologiquement fondé, le niveau des processus physico-chimiques, on considérera que l’échelle plus agrégée de manifestation des caractères de la fructification, en faisant intervenir des lois de probabilité, hérite de l’ignorance dans laquelle nous sommes à l’égard de ces phénomènes élémentaires. On optera alors pour une interprétation subjectiviste du modèle de fructification et on ne verra pas là de rupture majeur avec le courant dominant de la biométrie française. Mais si l’on ontologise préférentiellement le niveau de la graine et du fruit, ce qui peut aussi se justifier, par exemple dans un cadre agronomique (c’est ce que l’on appelle alors faire de la science « pragmatique » : mais cette qualification est finalement très relative comme on le voit), alors c’est ce niveau de la graine qui sera considéré comme élémentaire. Et, à ce niveau, on pourra tout aussi bien considérer qu’on a affaire à un hasard « objectif », d’où une interprétation que nous pouvons qualifier en ce cas de quasi-objectiviste. Par là le formalisme se trouve presque ré-enraciné.

1473.

Dans notre présentation, nous simplifions le modèle de de Reffye, dans la mesure où il faudrait tenir compte, comme lui, du fait qu’il y a deux loges dans une cerise et non une seule. Mais cette considération ne ferait que compliquer le calcul sans modifier pour autant les principes généraux mis en œuvre.

1474.

[Reffye (de), Ph., 1975], p. 7.

1475.

[Giegerenzer, G. et al., 1989, 1997], p. 79.

1476.

[Reffye (de), Ph., 1975], p. 10.

1477.

[Reffye (de), Ph., 1975], p. 13.