Modéliser, c’est former des hypothèses

Pour formuler ce genre de modèles a priori, il faut pouvoir se donner des hypothèses sur les rapports qu’entretiennent les observables. On s’arrange alors pour trouver précisément des observables tels qu’ils permettent de faire des hypothèses menant à des modèles simples et calculables : hypothèse de la nature discrète des caractères observables (dans ce cas précis, un transfert de la méthodologie propre à la génétique formelle devient possible), hypothèse d’indépendance, hypothèse de simple additivité des observables… Remarquons bien que l’on choisit parmi les observables ceux qui permettent de faire une hypothèse de formalisation rigoureuse et manipulable. On ne fait donc pas l’inverse : on ne choisit pas l’hypothèse ou le style de formalisation d’abord pour choisir seulement ensuite les observables qui pourraient bien y correspondre. L’approche de Reffye sera encore modéliste au sens de la modélisation statistique déracinée, c’est-à-dire au sens précis que Ronald A. Fisher a donné dès 1922 à l’expression de « loi mathématique hypothétique » 1469 . Pour quelles raisons ? On sait que le développement des graines de caféiers admet trois différentes issues possibles. En effet :

‘« Le développement des graines à l’intérieur de la cerise peut aboutir à trois possibilités :’ ‘1) les avortements précoces’ ‘2) les avortements tardifs’ ‘3) les graines normales. » 1470

Ces différentes issues sont donc bien distinctes. À ce titre, elles permettent de définir un modèle probabiliste où des aspects aisément repérables pour le caféiculteur sont mis en avant. Pour ce faire, de Reffye définit d’abord ce qu’il appelle la fertilité d’un arbre donné : c’est son pourcentage de transformation d’ovules en graines. Comme nous l’avons vu, il serait souhaitable de prédire cette fertilité ou, tout au moins, d’être capable de l’évaluer au fur et à mesure de l’avancée de la fructification grâce à des « caractères » observables. Il va donc s’agir d’exprimer la fertilité comme fonction statistique de ces caractères. Le terme « caractère » lui vient, en l’occurrence, de sa fréquentation de la modélisation théorique en génétique mendélienne et formelle. Comme ces caractères sont non continus, c’est-à-dire discrets (tels ceux que Mendel avaient en son temps mis en avant), puisqu’ils peuvent se réduire à des présences ou absences de certaines propriétés (d’où l’importance de s’en tenir à une approche globale et pragmatique afin de se placer à une échelle où l’on peut discrétiser sans dommage les caractères biologiques), il est possible de se proposer des lois probabilistes élémentaires, simples et a priori susceptibles de gouverner ces caractères et leurs combinaisons multiples. C’est donc bien là que l’approche de de Reffye est également modéliste et pas seulement statistique et analytique. Il s’agit de se proposer un scénario présidant à la constitution des observables dans la plante. Ce scénario doit permettre non pas d’expliquer les processus physiologiques de façon causale mais seulement d’insérer ces observables dans un récit statistique sous-jacent régi, pour sa part, et au contraire des processus physiologiques soupçonnés, par certaines lois probabilistes simples et dont on peut en conséquence anticiper le comportement probable de façon théorique. De plus, le scénario statistique ne correspond pas ici à un modèle assis sur des hypothèses linéaires, donc prêtant à une recherche d’optimum par une méthode de programmation linéaire, dans la mesure où les caractères morphologiques, à la différence de ceux du premier article de 1974, y sont de nature discrète et non continue.

Notes
1469.

Voir supra et [Giegerenzer, G. et al., 1989, 1997], pp. 110-113. De Reffye ne cite pas Fisher dans sa bibliographie mais il cite l’ouvrage français faisant référence dans les années 1970, le monumental (deux tomes d’environ 600 pages chacun) Analyse de données de J.-P. Benzécri, paru en 1973. Toutefois son approche n’est pas absolument biométrique encore moins « analytique » au sens de l’analyse de données de Benzécri puisque l’école qu’il connaît et qu’il suit le mieux est celle de la génétique formelle. Or, cette école a d’abord pu se présenter comme non modéliste, c’est-à-dire comme n’ayant pas eu à renoncer à la théorisation mathématique, mécanique et explicative des phénomènes biologiques, dans la mesure où son approche se concentrait sur le niveau individuel des gènes et sur les caractères observables de nature discrète. Voir [Giegerenzer, G. et al., 1989, 1997], p. 145. Elle ne s’est présentée comme « modéliste » qu’après sa conciliation avec la biométrie dans les travaux de Fisher, notamment. De son côté, l’école de Benzécri, très influente dans la France des années 1960-1970, a pu sembler un moment dissidente dans la réconciliation fishérienne des approches biométrique et mendélienne autour de la notion de modèle, en ce qu’elle a préféré « appréhender directement les faits dans leur complexité, sans l’interposition d’un modèle plus ou moins conventionnel », [Vessereau, A., 1947, 1992], p. 127. Cette école a davantage insisté sur le moment inductif du recours aux statistiques. Mais elle a négligé le moment déductif du recours aux lois de probabilité. En effet, le passage de l’un à l’autre se fait sans certitude rationnelle mais seulement conformément à une certitude pratique. Voir [Vessereau, A, 1947, 1960, 1988], pp. 27-28. Rompant avec les perspectives de la biométrie française, c’est avec cette seule certitude pratique que de Reffye décide de travailler et de poursuivre son enquête rationnelle dans le second travail de 1974. Donc, même s’il cite l’ouvrage de Benzécri (comme on cite un ouvrage incontournable dans une bibliographie), en réalité il n’en suit pas la philosophie ultra-empiriste. C’est en ce sens qu’il se juge davantage impressionné et influencé par ce qu’il appelle les « modèles » de la physique mathématique classique qu’on enseigne dans les classes préparatoires. Il est donc plus proche de Fisher que de Benzécri. Il va même au-delà parce qu’il connaît les modèles probabilistes de la recherche opérationnelle.

1470.

[Reffye (de), Ph., 1975], p. 1.