Reconnaissance de formes d’arbres et écrans graphiques à l’Université de Kyoto

C’est un physicien de l’Université de Kyoto, du nom de Hisao Honda, qui, en 1970, se trouve reprendre explicitement la proposition de Cohen consistant à simuler graphiquement et par ordinateur la croissance pas à pas d’une forme arborescente. Auparavant, Honda avait souvent été impressionné par les grands arbres du parc de l’Université de Kyoto. Et, face à eux, il s’était demandé comment on pouvait reconnaître une espèce d’arbre au moyen d’une simple inspection visuelle du port de l’arbre. Or, du point de vue de sa problématique scientifique propre, la question biologique de la morphogenèse lui apparaît très vite comme parallèle à une question de reconnaissance de forme ; ce qui est sa spécialité première. C’est donc d’abord en tant que chercheur en reconnaissance de forme et dans le cadre d’un développement du matériel informatique particulièrement tourné vers les applications graphiques, qu’il se trouve intéressé par la problématique de la détermination, par les gènes, de la genèse des formes vivantes et, en particulier, des formes arborescentes. Sa propre question initiale est en effet précisément la suivante : « Comment se fait-il que l’on puisse deviner l’espèce d’un arbre à partir de sa forme qui est très variable et qui ne peut être saisie facilement en des termes scientifiques ? » ¹³⁴¹

Il se trouve que Honda peut techniquement aborder cette question en physicien à Kyoto car, depuis 1969, étant en poste au Centre de Traitement de Données de l’Université, il dispose pour sa part d’un matériel informatique particulièrement performant pour l’époque : le FACOM 270-30 de Fujitsu. Or, cet ordinateur est doté d’un écran graphique de très bonne qualité : le FACOM 6231C de Fujitsu. Ce qui lui permet de représenter finement les arborescences calculées ¹³⁴² . Honda est par ailleurs déjà sensibilisé à certaines problématiques biologiques car, après sa thèse de physique de 1965, il a suivi un cours doctoral de biologie moléculaire portant spécifiquement sur l’ARN de transfert et les enzymes associées ¹³⁴³ .

La problématique initiale de Honda en l’espèce est celle d’une reconnaissance infra-linguistique : certains caractères visibles nous sont reconnaissables et nous servent à reconnaître les arbres alors même que nous ne sommes pas des spécialistes de la botanique et que nous n’avons pas de mots pour les désigner. C’est un problème de reconnaissance humaine ordinaire. Puisque l’on n’a pas de mots pour désigner ces caractères, il est difficile de construire par la seule introspection et donc a priori le processus mental mis en œuvre dans ce genre de reconnaissance. Comme cela est alors classique pour la reconnaissance de formes automatisées, Honda préconise que l’on se propose des « modèles » ¹³⁴⁴ d’arbres, constructifs, pas à pas, à réitération et à paramètres variables. Ces modèles seront sélectionnés par un processus d’essais et erreurs. Le meilleur de ces modèles génératifs pourra être un modèle du processus implicite (non verbal et non verbalisable donc ne référant pas à des catégories linguistiques) de reconnaissance de l’arbre par un homme normalement cultivé. Or, ce problème de reconnaissance de forme que se propose de résoudre Honda dans son département de physique est, selon lui, tout à fait parallèle à cette question précise de morphogenèse biologique : « Quelle information sur la forme le gène contient-il et à travers quel processus son information est-elle représentée comme une forme ? » ¹³⁴⁵ C’est en lisant Cohen qu’il se convainc de l’existence d’un tel parallélisme.

Or, voici en quels termes il légitime la bi-disciplinarité de son étude sur ordinateur : selon Honda, ces deux questions peuvent être « sublimées » ¹³⁴⁶ en une seule, celle qui fait l’objet de l’article de 1971. Cette question précise est la suivante : « Comment décrire la forme économiquement ou comment extraire l’essence d’une information disparate au sujet de la forme ? » ¹³⁴⁷ Remarquons ici que Honda adopte une approche similaire à celle de Cohen car, des premiers travaux de simulation sur ordinateur de forme arborescente (dont ceux de Ulam ¹³⁴⁸ ), il retient finalement la même idée que lui : des règles de génération simples peuvent donner naissance à des formes globales compliquées et très variables en fonction des paramètres des règles. En 1967, Cohen en tirait un argument théorique sur la plausibilité d’une masse relativement faible d’information dans les gènes déterminant la forme. En 1971, Honda veut donc aussi montrer que l’on peut donner naissance, sur ordinateur, à l’image d’un « corps semblable à un arbre » (« tree-like body ») au moyen de l’interaction entre règles élémentaires simples : pour son modèle d’arborescence, il ne choisit pas un modèle très détaillé et complexe (sinon la praticabilité mentale d’un tel modèle pour la reconnaissance de forme serait douteuse comme la praticabilité biochimique le serait également pour le stockage informationnel dans le génotype). Au contraire, il choisit d’avoir seulement accès à l’angle de branchaison et au rapport de réduction de la longueur de chaque rameau après bifurcation. Mais, à la différence de Cohen, il représente des arbres en trois dimensions et non seulement des structures arborescentes plates. Simplement le programme informatique en FORTRAN (langage qu’il apprend pour l’occasion) travaillera à projeter chaque état de l’arbre sur l’écran selon des règles de projection simples. La simulation de Honda est donc clairement fondée sur une formalisation géométrique puisqu’elle est orientée vers la production d’une figure réaliste sur un écran graphique. De plus, pour la branchaison et la croissance du rameau, contrairement à Cohen, Honda néglige les influences du voisinage. Moyennant ces hypothèses volontairement grossières car rendant les règles élémentaires simples, l’ordinateur paraît le meilleur outil non seulement pour traiter ces calculs simples et réitérés, mais aussi et surtout pour en représenter visuellement le résultat. Ce faisant, Honda produit un travail nettement interdisciplinaire puisqu’il s’appuie sur une analogie entre le gène (avec sa propriété de minimalité informationnelle) et le modèle mental minimal de reconnaissance d’une forme arborescente ¹³⁴⁹ .

Notes

1341.

“How is it that one can guess the species of the tree from its multifarious form, which can not be grasped easily in scientific words ?”, [Honda, H., 1971], p. 331.

1342.

[Honda, H., 1971], p. 335. L’article de 1971 publie des photographies noir et blanc très nettes de cet écran graphique.

1343.

Communication personnelle de l’auteur dans un courrier électronique du 7 novembre 2003.

1344.

[Honda, H., 1971], p. 332.

1345.

“What information about the form does the gene store in it and through what process is its information represented as the form ?”, [Honda, H., 1971], pp. 331-332.

1346.

“The two interesting problems of the form, how to recognize and how to develop the form, might be sublimated to the more general problem, ‘description of the form’ …”, [Honda, H., 1971], p. 332.

1347.

“How to describe economically the form or how to pull out the essence from miscellaneous information about the form ?”, [Honda, H., 1971], p. 332.

1348.

Selon l’échange de courrier électronique que nous avons eu avec Hisao Honda le 7 novembre 2003, au moment où il soumet son article au Journal of Theoretical Biology, Honda n’a connaissance que du travail de Cohen paru dans Nature en 1967, mais il ne connaît pas directement ceux de Ulam ou Eden. Ce sont en fait les rapporteurs de son article qui lui signalent ces autres travaux de simulation de la forme.

1349.

“I would like to believe that the effort to seek simpler, more economical, and basic assumptions to describe the form of a tree would supply a clue to the truth of the nature of which we have hints in the field of pattern-recognition and morphogenesis”, [Honda, H., 1971], p. 337.