Transférer un peu d’économétrie dans la biométrie : le premier article de 1974

Cependant, de Reffye fait tout de suite le choix de traduire ce problème dans les termes d’une recherche d’un optimum sous contraintes. Les méthodes classiques de la biométrie, on le sait autour de lui, ne sont de toute façon pas très satisfaisantes sur le terrain ivoirien : elles échouent à expliquer certains résultats empiriques surprenants. Ainsi, pour un clone donné de caféier, l’ombrage peut donner des résultats contradictoires d’une année sur l’autre 1447 . Pour de Reffye, il faut d’abord se donner les moyens permettant de rechercher ce qu’il appelle l’« optimum en amélioration des plantes » 1448 . L’expression qu’il choisit est délibérément révélatrice de la première approche des questions de rendement qui a été la sienne. Dans son premier article de 1974, c’est en effet tout d’abord en référence à une méthode et à une terminologie empruntées explicitement à l’économétrie et non seulement à la biométrie qu’il propose de rechercher le meilleur phénotype pour le rendement en café.

Or, à quoi peut-on attribuer le choix de cette première perspective ? Certes avant tout au type de problème posé : on cherche à optimiser une caractéristique particulière du caféier, sa production en fruits, compte tenu de la variabilité morphologique limitée dont on dispose mais qu’il faut néanmoins considérer. Mais pourquoi ne pas recourir aux méthodes classiques de la biométrie ? C’est que les « modèles descriptifs », selon l’expression de de Reffye, semblent inadaptés si, comme c’est le cas ici, on ne cherche pas seulement à étudier la variabilité d’une population par analyse de données en composantes principales 1449 , mais à rechercher un optimum qui peut être encore non réalisé par les données. C’est que l’on veut un modèle qui permette de décider d’une orientation culturale optimale pour le rendement. Pour cette même raison, les modèles de régressions multiples, nommés « prévisionnels » 1450 par de Reffye, tout en autorisant certes des extrapolations à partir des données, ne permettent pas pour leur part de désigner clairement un optimum hypothétique. De Reffye se plonge alors dans des ouvrages d’économétrie puisque ce genre de problème semble bien plus souvent s’y poser et y être déjà résolus. C’est ainsi qu’il se familiarise avec les méthodes de programmation linéaire et dynamique 1451 utilisées en économie et déjà bien développées depuis la seconde guerre mondiale. Ces lectures diverses, à visée pragmatique, donc faites sans grands a priori théoriques ou disciplinaires au vu du faible encadrement académique dont il dispose en Afrique, leconduisent donc d’abord à traduire son problème agronomique en termes de programmation linéaire au sens de l’économétrie et de la recherche opérationnelle. Voici ce qu’il propose :

‘« En effet, lorsque dans une population, une liaison entre la variabilité phénotypique et un critère de sélection (comme le rendement) est constaté, il est intéressant de se demander quel est le phénotype optimum qui maximise ce critère, compte tenu de la variabilité limitée dont on dispose et des corrélations qui existent entre les caractères morphologiques. » 1452

La « variabilité limitée » et les « corrélations » qui existent entre les caractères morphologiques du caféier vont donc constituer les « contraintes » du programme linéaire de production du caféier, au sens de l’économètre. Tandis que le rendement exprimé par un « modèle linéaire » 1453 fonction des caractères va constituer le « critère » à maximiser. Or il nous faut remarquer que ce transfert de méthode de la recherche opérationnelle à l’agronomie est possible à de Reffye d’une part parce que tous les caractères morphologiques qu’il considère sont de nature numérique (il s’agit d’une analyse en composantes principales et non d’une analyse factorielle), d’autre part parce qu’il lui semble admissible de considérer que le rendement de la plante peut s’exprimer par une fonction linéaire de ses caractères. Ceux-là sont au nombre de cinq et sont répartis en deux groupes. Le premier groupe rassemble les caractères de la feuille du caféier : 1 - le profil de la feuille (longueur sur largeur) ; 2 – la dimension de la feuille (la racine carrée de sa longueur fois sa largeur) ; 3 – la densité foliaire (le poids sur la surface de la feuille). Le deuxième groupe rassemble deux caractères du rameau : 4 - l’épaisseur du rameau ; 5 – le nombre de nœuds portés par le rameau. La façon dont de Reffye considère le « rendement » et la productivité du caféier est donc identique à celle que les économistes adoptent lorsqu’ils sont face à des problèmes d’optimum de production des entreprises. Là aussi, il s’agit bien de chercher un optimum de production.

Dans ce premier modèle, la plante est donc considérée comme l’analogue d’une usine. Puisque, dans une perspective agronomique et, plus précisément, d’amélioration de la plante, il s’agit là aussi de décider d’une politique (de sélectionner une variété), le modèle d’analyse et de décision qui valait d’abord pour l’artefact (l’usine ou la production humaine) semble pouvoir être transféré à l’objet « naturel » 1454 qu’est la plante.

Notes
1447.

[Reffye (de), Ph. et al., 1996], p. 3.

1448.

[Reffye, (de), Ph., 1974a].

1449.

Il s’agit d’une analyse de données sur des variables numériques ou tout au moins scalées (c’est-à-dire ordonnées entre elles avec des distances relatives constantes). Comme l’analyse factorielle des correspondances qui, elle, se concentre sur des variables nominales ou qualitatives, l’analyse en composantes principales consiste à rechercher les axes d’inertie du nuage de points que forment les données et à les exprimer en fonction de ces nouveaux axes ou « composantes principales ». Voir [Lagarde (de), J., 1995], pp. 101-109.

1450.

Dans les ouvrages d’analyse de données, ils sont également appelés « modèles explicatifs » par contraste avec les modèles d’analyses en composantes principales souvent dits « descriptifs », dans la mesure où ils sont un cas particulier d’analyse en composantes principales. Il s’agit du cas où il n’y a qu’une seule variable à expliquer en fonction de toutes les autres. Il est intéressant de noter que le modèle est considéré comme explicatif ou tout au moins prévisionnel à partir du moment où, comme dans une équation mathématique explicite (y = f(x) ), une variable est manifestement privilégiée en étant exprimée comme combinaison linéaire de toutes les autres.

1451.

Dans la page 32 de son article « programmation mathématique » de l’Encyclopaedia Universalis, Tome 19, édition 1989, CD-ROM 1995, le mathématicien Ivar Ekeland écrit : « La programmation mathématique consiste à chercher, parmi tous les points x vérifiant certaines conditions du type gj (x) ≤ 0, 1 ≤ j ≤ J (contraintes) et hk (x) = 0, 1 ≤ k ≤K (liaisons) celui ou ceux qui rendent minimal (ou maximal, suivant le cas) un certain critère f (x) qui sera interprété comme un gain dans le premier cas (et comme un coût dans le second). Quand la variable x est de dimension finie, et que ses composantes (x1, …, xn) ne peuvent prendre que des valeurs entières, on parle de programmation en nombres entiers ; quand elle est continue, c’est-à-dire quand x décrit 3n ou un autre espace vectoriel, on parle de programmation linéaire [« les contraintes sont des fonctions linéaires des variables x» et le « critère est lui-même linéaire », précise-t-ilplus bas ], convexe ou non convexe suivant les propriétés de fonctions f, gj et hk. Enfin, la variable x peut avoir une structure, c’est-à-dire se présenter comme une fonction d’autres variables plus primitives, notamment le temps ; on emploie alors la programmation dynamique. »

1452.

[Reffye, (de), Ph., 1974a], p. 167.

1453.

[Reffye, (de), Ph., 1974a], p. 169.

1454.

Cette « naturalité » de la plante est justement contestable dès lors que, par la génétique, on « fait » des plantes nouvelles. Devenant par là manifestement et plus que jamais un artefact humain, et perçue comme telle, la plante peut se voir plus aisément transférer les méthodes d’ingénieur auparavant appliquées à la gestion des entreprises humaines.