La controverse avec Brian Carey Goodwin au sujet des formalismes « naturels »

Outre le fait que les propositions de Lindenmayer vont rencontrer très vite un grand succès, mais pas forcément d’ailleurs dans le milieu qu’il escomptait toucher au départ, un des épisodes les plus marquants et les plus significatifs qui aient succédé à ces publications de 1968 a sans doute été la controverse qui s’est ouverte sur le choix des formalismes, le mettant aux prises avec les tenants d’un certain versant théorique de l’embryologie chimique, notamment avec le biologiste théoricien Brian C. Goodwin. Présentons d’abord en quelques mots ce protagoniste.

Brian C. Goodwin est né en 1931 au Canada. Il étudia d’abord la biologie à l’Université McGill de Montréal puis les mathématiques à Oxford grâce à une bourse Rhodes. En 1961, il soutint son PhD en embryologie, à Edinburgh, sous la direction de Conrad Hal Waddington. Le titre de sa thèse était Studies in the general theory of development and evolution. En substance, il y conservait l’idée de son maître selon laquelle la morphogenèse ne peut entièrement s’expliquer par le réductionnisme génétique. Et il prônait, comme lui, le développement de modèles mathématiques susceptibles de montrer comment les formes vivantes sont contraintes bien davantage que le seul scénario historiciste et probabiliste des théoriciens de l’évolution ne permet de le penser. Comme Waddington, il tenait donc, non pas à réfuter, mais à amender le darwinisme par une perspective d’embryologie mathématique organiciste c’est-à-dire non réductionniste ni purement holistique.

Par la suite, après des vacations comme chercheur à McGill et au MIT 1274 , Goodwin devint assistant en biologie à l’Université du Sussex à partir de 1965 1275 . Entre-temps, en 1963, il publia un livre qui connaîtra un certain succès, Temporal organization in cells 1276 , dans lequel, en s’inspirant du modèle de régulation de Jacob et Monod datant de 1961, il proposait un modèle mathématique d’expression simultanée de plusieurs gènes situés en réseau. Ce modèle du « réseau de gènes » décrivait les variations simultanées en concentrations de plusieurs protéines induites par l’expression des gènes dans une cellule. Chaque protéine voyait intervenir dans l’expression de sa variation en concentration (une dérivée première par rapport au temps) des termes multiplicatifs faisant apparaître les concentrations d’autres protéines ; ce qui donnait donc la possibilité aux autres gènes de réguler cette vitesse. Goodwin aboutissait alors à un système d’équations différentielles qui se retrouvaient couplées entre elles et qui étaient assez difficiles à résoudre 1277 . Dès le début des années 1960, Goodwin était donc fasciné par les modèles de régulation et, pour lui, les ensembles autocatalytiques que l’on pouvait exprimer par des systèmes d’équations différentielles couplées devaient être considérés « comme des modèles naturels de l’intégration fonctionnelle » 1278 .

Or, de façon compréhensible, lorsqu’il lit les travaux de Lindenmayer publiés en 1968 dans le Journal of Theoretical Biology, il réagit assez négativement. En 1970, il publie un article sur la stabilité biologique dans lequel, visant implicitement Lindenmayer, il critique ouvertement le choix du formalisme des automates dans la biologie du développement 1279 . Son argument revient à voir, dans ce qui se présente comme une formalisation par automates, non pas une réelle formalisation, c’est-à-dire une représentation formelle effective (« naturelle » au sens qu’il donne à sa qualification des « modèles naturels » différentiels) ou même une traduction approchée, mais une simple analogie du gène avec l’ordinateur qui, dans certains cas critiques, échoue à prendre en considération certains phénomènes biologiques essentiels. Le formalisme n’en serait donc pas réellement un : il ne serait qu’une pure « analogie formelle ». Mais voici son propos exact :

‘« L’implication de l’analogie du computer est que la cellule calcule [computes] son propre état, examine le programme ADN pour y chercher de nouvelles instructions et ensuite modifie son état en conformité avec ces instructions. En réalité, ce n’est pas ce que fait une cellule, bien que l’analogie formelle puisse être faite entre le comportement biochimique d’une cellule et l’opération d’un automate qui suit un programme. Il peut sembler élémentaire d’insister sur le fait que, lorsque l’on discute d’un processus tel que l’épigenèse [incluant la morphogenèse et la différenciation selon le point de vue de Waddington (note de Lindenmayer)], toutes les opérations de l’automate doivent être, à un certain égard, interprétées en termes biochimiques et physiologiques ; mais j’ai été quelque peu consterné par la somme de confusions qui se sont produites à cause du fait que ceux qui utilisent l’analogie du computer échouent à illustrer l’opération des instructions algorithmiques au niveau biochimique. » 1280

Pour Goodwin donc, le recours au formalisme des automates relève d’une simple analogie formelle, c’est-à-dire de la prise en compte de similitudes simplement grossières et superficielles entre les rapports qu’entretiennent entre eux les automates et les rapports qui interviennent entre les substances biochimiques dans les processus d’épigenèse. « Formel » veut donc dire ici « superficiel », c’est-à-dire « de loin », ou encore à « échelle globale ». Or, selon Goodwin, la preuve qu’il n’y a là qu’analogie grossière peut être inférée de l’embarras dans lequel on voit les tenants de la modélisation par automates lorsqu’il s’agit pour eux d’« illustrer l’opération des instructions algorithmiques au niveau biochimique ». À son tour, cet embarras ne peut pas directement se lire, mais il se donne à voir à travers la confusion qui règne autour de cette illustration. Ce que Goodwin semble dire, c’est qu’il peut exister plusieurs illustrations biochimiques différentes pour un même ensemble de paramètres d’un modèle par automates. Autrement dit, pour lui, ce « formalisme » ne capture pas assez finement et de façon univoque les phénomènes biochimiques pour être réellement dépourvu d’ambiguïtés. D’où la confusion. Alors que pour Lindenmayer, comme on l’a vu, ce formalisme est presque trop fin pour être calibré de façon univoque par les données expérimentales disponibles, pour Goodwin, au contraire, il n’est pas assez fin pour recouvrir une signification biologique univoque. En ce sens, selon Goodwin, ce formalisme manifeste bien le défaut classique d’une analogie : celui de faire violence à la réalité sur les côtés non explicites (« neutres » selon l’expression de l’épistémologue américaine Mary Hesse 1281 ) du rapport d’analogie et de prêter à des décisions arbitraires, source de confusion, quant à ce que l’analogie représente de son corrélat réel dans ses côtés ininterprétables.

La réponse de Lindenmayer va consister à montrer qu’il ne tient en fait qu’à l’utilisateur de ce genre de modèles de lever l’ambiguïté qui pourrait se glisser dans l’interprétation puisque « le concept d’automate fini est suffisamment général pour donner l’interprétation désirée en termes de biochimie et de physiologie cellulaire » 1282 . Loin d’être un obstacle, ce serait donc au contraire la généralité du formalisme qui permettrait de lever l’ambiguïté interprétative selon Lindenmayer.

Mais Lindenmayer, afin de se faire entendre, entreprend d’abord de construire une interprétation systématique, en termes d’automates, des concepts waddingtoniens concernant les mécanismes du développement, dont l’induction et la différenciation cellulaire. Voici donc les points d’accord minimaux qu’il demande : tout gène est présent dans toute cellule de l’organisme. Ensuite, tout gène est présent dans chaque cellule soit sous une forme active soit sous une forme passive. Chaque cellule, à chaque instant contient donc une combinaison particulière de gènes actifs et de gènes inactifs. Les gènes actifs produisent des enzymes spécifiques qui sont capables, sous certaines conditions, de convertir divers métabolites en composants dont certains, en s’accumulant dans la cellule, causent la différenciation cellulaire. Le passage de l’état inactif à l’état passif (ou inversement) d’un gène est déterminé par le produit (ou inducteur) de quelque enzyme couplé avec une protéine répresseur. Si l’inducteur vient de la même cellule, on observe alors une induction de la synthèse d’une nouvelle enzyme qui a pour résultat une différenciation. S’il vient d’une autre cellule, on assiste à l’ébauche d’une nouvelle lignée cellulaire.

Après ce bref résumé 1283 à vocation consensuelle, Lindenmayer soutient ensuite, et là est sa réponse, que chacun de ces contrôles (ou régulations) « peut être exprimé soit par l’extinction ou l’allumage [sic] d’un gène soit par le fait qu’ils affectent les activités des enzymes et par-là l’apparition de leurs produits » 1284 . Il entreprend alors d’interpréter en termes d’automates ces points d’accord minimaux. En effet :

  1. appelons C l’ensemble rassemblant les métabolites et les composants d’une cellule, mis à part les protéines actives et les acides nucléiques (que Lindenmayer appelle les « macromolécules informationnelles »“informational macromolecules”, [Lindenmayer, A., 1973], p. 680.),
  2. à chaque instant, on peut en droit définir l’état d’une cellule par une combinaison particulière d’éléments de C,
  3. à chaque couple « gène-enzyme », on peut associer une « règle de transformation »“transformation rule”, [Lindenmayer, A., 1973], p. 680.. C’est sur ce point précis que Lindenmayer avoue sa dette à la modélisation algorithmique cellulaire introduite par Walter R. StahlVoir [Lindenmayer, A., 1973], p. 680, note 3.. Donc en un sens, la légitimité de la modélisation par automates dans la biologie du développement repose en partie sur celle, antérieure, de cette même modélisation en biologie moléculaire. Bref, à chaque cellule on pourra associer une combinaison de règles de transformations selon que les gènes correspondants seront actifs ou non à l’instant considéré.

Finalement, l’état interne total d’une cellule comportera à la fois la combinaison de ses composants et la combinaison de ses règles de transformation. L’entrée d’une cellule consistera en l’ensemble des composants, éléments de C, qui dans l’intervalle de temps (discrétisé) se seront nouvellement présentés et la sortie, à savoirl’ensemble de ceux qui se seront dissipés. On voit dès lors que, en conformité avec les concepts de la biologie du développement précédemment rappelés, l’état prochain ne pourra dépendre que de l’état présent, des entrées et des sorties. Ainsi, il sera en droit possible de construire des fonctions de transition qui détermineront la combinaison prochaine de composants dans chaque cellule comme la combinaison prochaine de règles de transformation. Et Lindenmayer conclut ce passage ainsi :

‘« On peut voir que les deux fonctions (état-prochain et sortie) peuvent en principe être construites pour une population donnée de cellules ; ainsi les cellules peuvent être représentées de façon valide par des automates finis. Je ne peux donc pas être d’accord avec les objections de Goodwin. Ce qu’il appelle le‘ programme ADN’ est l’ensemble des règles de production que nous avons introduites, et en accord avec notre courte discussion précédente, on peut dire d’une manière complètement naturelle que l’état prochain d’une cellule est calculé [computed] en utilisant ces règles de productions. » 1288

Nous ne savons pas si Lindenmayer connaît à cette époque l’argument de Goodwin sur la naturalité des modèles différentiels de régulation. Toujours est-il que nous sommes là face à une évidente et suggestive confrontation entre deux interprétations différentes de ce que devrait être un modèle mathématique naturel. Pour Goodwin, la naturalité est du côté des modèles différentiels parce que le corrélat réel du formalisme demeure ambigu ; pour Lindenmayer, elle est du côté des modèles à automates parce qu’ils ont la capacité de traduire très précisément et sans ambiguïté les concepts théoriques déjà élaborés : c’est pour lui la naturalité d’une compréhension, c’est la proximité d’un signe par rapport à son sens, alors que Goodwin cherche la naturalité d’une référence et valorise ainsi la proximité du signe formel et du référent réel. En un sens, nous pouvons dire que la naturalité du modèle chez Goodwin est ontologique, alors que chez Lindenmayer, en conformité avec son logicisme qui lui vient de Woodger, elle est gnoséologique et symbolique.

Par ailleurs, on peut déjà voir dans la critique de Goodwin un des foyers de résistance à la modélisation et à la simulation par automates dans la biologie du développement. De manière non surprenante, elle a sa source dans l’école waddingtonienne et organiciste. Après le modèle de Turing et avant même la reprise des postures de cette biologie théorique par René Thom, elle en est une première forme accomplie.

Parvenu à ce point de notre restitution du travail de Lindenmayer, de sa signification épistémologique et de sa réception, il nous est désormais nécessaire de dire quelques mots de la réception de ces travaux dans d’autres contextes. Comme on peut le comprendre avec la réaction de Goodwin, Lindenmayer ne pouvait pas espérer grand-chose du côté de la biologie théorique américaine. La carrière du biologiste modélisateur sera en fait transformée et accélérée à partir d’une convergence inattendue. C’est cette convergence qui va l’inciter à développer de manière toujours assez formelle son approche de la modélisation et de la simulation de la morphogenèse végétale par ordinateurs.

Notes
1274.

Probablement déjà au RLE (Research Laboratory in Electronics) où Stuart Kauffman le rencontrera dans le bureau de Warren McCulloch en 1967. Voir [Kauffamn, S., 1995], p. 273.

1275.

En 1983, il deviendra professeur de biologie à l’Université Ouverte (Open University) en Angleterre. Il la quittera en 1996 pour devenir membre du corps professoral du College Schumacher,centre d’étude en écologiethéorique conçu autour des idées de la deep ecology, de l’hypothèse Gaïa de James Lovelock et de perspectives essentiellement holistiques en écologie. Voir le site de présentation à l’adresse http://www.schumachercollege.org.uk/ . Pour les précisions biographiques concernant la formation et la carrière de B. C. Goodwin, nous nous sommes appuyé sur une page de ce site : http://www.schumachercollege.org.uk/Teachers/Faculty.html#BrianGoodwin.

1276.

Temporal organization in cells, Academic Press, London, 1963. La référence nous est précisée par [Kauffman, S., 1995], p. 273. Dans un passage autobiographique, le biologiste théoricien Stuart Kauffman nous parle de sa rencontre avec ce livre en décrivant l’amertume qui a été la sienne lorsqu’il s’est aperçu que ce qu’il projetait de faire avait déjà été traité en partie par Goodwin. Voir ibid., pp. 273-274. C’est dire la convergence de vues qui était la leur à l’époque. C’est montrer également combien les modèles différentiels de régulation pouvaient encore fortement inspirer les esprits.

1277.

Pour cette présentation simplifiée du modèle de Goodwin, nous nous sommes appuyé sur [Bignone, F. A., 1992].

1278.

Kauffman citant son ami Goodwin de mémoire : “those autocatalytic sets are absolutely natural models of functional integration”, [Kauffman, S., 1995], p. 274.

1279.

Pour ces indications, voir [Lindenmayer, A., 1973], p. 679.

1280.

“The implication of the computer analogy is that the cell computes its own state, looks at the DNA program for further instructions, and then changes state accordingly. This is not in fact what a cell does, although formal analogy can be made between the biochemical behavior of a cell and the operations of the automaton following a program. It may seem elementary to insist that all the operations of the automaton must at some point be interpreted in biochemical and physiological terms, when discussing such a process as epigenesis [Epigenesis is meant to include both morphogenesjs and differentiation, for further explanation, see, e. g., Waddington : Concepts and theories of growth, development, differentiation and morphogenesis, Towards a Theoretical Biology, vol. 3, Edinburgh University Press, pp. 177-197] but I have been somewhat dismayed at the amount of confusion that has arisen because of the failure of those using the computer analogy to illustrate the operation of algorithmic instructions at the biochemical level”, extrait de B. C. Goodwin “Biological Stability” in Towards a Theoretical Biology, vol. 3, Edinburgh University Press, pp. 1-17, cité par [Lindenmayer, A., 1973], p. 679.

1281.

Mary B. Hesse insistait sur le rôle heuristique des modèles mécaniques par cette voie-là. Voir [Hesse, M. B., 1966, 1970], p. 8 : “Let us call this third set of properties the neutral analogy. If gases are really like collections of billiard balls, except in regard to the known negative analogy, then from our knowledge of the mechanics of billiard balls we may be able to make new predictions about the expected behavior of gases. Of course, the predictions may be wrong, but then we shall be led to conclude that we have the wrong model”. En ce sens, Goodwin ne croit ici qu’à l’impact négatif de cette part non maîtrisée de l’analogie.

1282.

“In fact, the concept of finite automaton is general enough to give it the desired interpretation in biochemical and cell-physiological terms, one needs only to elaborate it somewhat”, [Lindenmayer, A., 1973], p. 679.

1283.

Dont nous avons proposé ici une traduction partielle et adaptée : voir [Lindenmayer, A., 1973], p. 679.

1284.

“… all of these controls can be expressed as either turning on and off the genes, or as affecting the activities of the enzymes and thus the appearance of their products”, [Lindenmayer, A., 1973], p. 680.

1288.

“It can be seen that both the next-state and the output functions can in principle be constructed for a given population of cells, thus the cells can be validly represented by finite automata. I cannot agree, therefore with Goodwin’s objections. What he calls the ‘DNA program’ is the set of production rules we introduced, and according to our short discussion above it can be said in a completely natural way that the next state of a cell is computed by using these production rules”, [Lindenmayer, A., 1973], p. 681.