Un modèle discret des « traits de plume » pour la forme des lettres manuscrites

Morris Halle se penche en effet lui aussi sur l’analyse de l’écriture manuscrite. Mais, comme Eden avec ses modèles probabilistes, il se trouve d’accord pour concevoir cette tâche analytique, ou de reconnaissance de formes, avant tout comme un travail d’identification d’un modèle de construction d’écriture à base dichotomique. D’où le terme « caractérisation » qui paraît dans le titre de leur article commun. En cela, ils s’opposent vigoureusement au travail contemporain de deux autres chercheurs (J. P. Thüring et J. Denier van der Gon) qui, dans une approche béhavioriste inspirée par l’école de Bloomfield, « simulent » le geste humain de l’écriture par un appareil entièrement analogique « incarnant une simple description d’une théorie concernant les forces musculaires impliquées » 633 . À l’inverse, ils voudraient que leur propre modèle soit universel et fondé sur des éléments atomiques, discrets donc, et mutuellement combinables, cela dans l’esprit même du formalisme russe qu’Halle avait hérité des travaux de Troubetskoï et Jakobson. En effet, discrétiser et formaliser le geste humain de l’écriture, c’est, pour Halle et Eden, se donner les moyens de rendre compte de ce qui se passe réellement dans ce phénomène : il s’agit d’un comportement humain à part entière, où il y entre donc un feedback cognitif, c’est-à-dire un effet de contrôle en retour constant par le cerveau de ce qu’il commande. En dernière analyse, ce feedback porte sur le sens de ce qui est en train de s’écrire, atome par atome d’expression 634 . En décidant de discrétiser la représentation de l’écriture humaine, on la modélise donc aussi comme un phénomène psychologique, spécifiquement humain, car on ne se focalise pas seulement sur l’intensité physique du phénomène et ses variations continues et insignifiantes au niveau musculaire.

À la même époque, dans une même perspective psycholinguistique, Jakobson rappelle d’ailleurs avec force le caractère discret des éléments du langage humain écrit. Selon lui, ce caractère y est encore plus évident que pour le langage oral 635 . Il a, sur ce point, entièrement pris acte des suggestions de Wiener 636 et de Shannon eux-mêmes. Mais il considère de surcroît qu’avec lui et ses collègues, « l’analyse linguistique est arrivée à résoudre le discours oral en une série finie d’unités d’information élémentaires » 637 . Il ajoute : « Ces unités discrètes ultimes, dites traits distinctifs, sont groupées en ‘faisceaux’ simultanés, appelés phonèmes, qui à leur tour s’enchaînent pour former des séquences. » Et il conclut enfin : « Ainsi donc, la forme dans le langage, a une structure manifestement granulaire et est susceptible d’une description quantique. » 638 Comme on le voit, les termes qu’il emploie ici sont choisis à dessein, afin de rapporter la linguistique, et plus spécifiquement, la phonologie aux sciences de l’ingénieur mais aussi aux sciences de la nature qui lui sont contemporaines 639 .

Il est un fait que Halle et Eden suivent une perspective tout à fait analogue à celle que préconise Jakobson lorsqu’à ce moment-là, et dans la perspective plus concrète de concevoir une machine qui saurait déchiffrer les textes manuscrits, ils travaillent à découper la forme générale de chaque lettre manuscrite en une séquence linéaire de « traits de plume » [« strokes »]. Ces « traits de plume » élémentaires, comme les unités phonologiques de Jakobson se trouvent être en nombre fini : on en trouve 18 640 . Ils sont comme l’alphabet élémentaire de l’écriture de chaque lettre latine elle-même, de sa morphogenèse. Les lettres manuscrites ont donc leur alphabet granulaire. C’est bien là une façon de rapporter une forme humaine ou plutôt, une forme produite par un comportement humain, un geste qui est pour cela souvent considéré comme du qualitatif singulier, à de l’universel formel. Mais cet universel est parcellaire, granulaire. La lettre ‘a’ manuscrite par exemple est disséquée, atomisée en une séquence orientée de 5 des 18 « traits de plume » élémentaires, et cela quelle que soit la personne qui l’ait écrite. Ainsi en est-il de toutes les autres lettres.

Ensuite, puisqu’il s’agit à terme de reconnaître des mots, un mot manuscrit est considéré comme une séquence (de deuxième niveau donc) de ces séquences élémentaires de « traits de plume » que sont les lettres. Ils distinguent également des règles formelles contraignant la forme graphique totale des séquences possibles de ces lettres ou séquences élémentaires, dans la mesure où l’on considère qu’une écriture manuscrite est une écriture dans laquelle on ne lève pas le crayon pour passer à la lettre suivante. C’est-à-dire qu’un ‘i’ manuscrit écrit après un ‘a’ manuscrit ne se verra pas ajouter le même « trait de plume » de transition que le ‘i’ qui précède un ’m’ par exemple 641 . Enfin, et cela est révélateur d’une approche modélisatrice de type probabiliste et discrétisée, pour tester leur modèle Eden et Halle font dessiner par le calculateur sur une table traçante un mot manuscrit réaliste comme « knife » (couteau en anglais). Il connecte ainsi le modèle discret et formel à un « générateur de courbes physiques » 642 . Et ils font déterminer aléatoirement (en conformité avec une loi de probabilité à valeurs sur le plan d’écriture de la table traçante et incarnant la présence d’un gradient orientant globalement la direction préférentielle du mot et donc des lettres le composant) par le calculateur le point final de chaque « traits de plume » dans chacune des lettres du mot. Le but de cette insertion de l’aléa dans le discret est de faire en sorte qu’il y ait certaines dérives stochastiques dans l’enchaînement des lettres rendant compte du caractère non mécanique du geste humain modélisé.

Ainsi donc une forme produite par un geste humain, subissant de fortes variations supposées aléatoires, est modélisée sur l’instigation d’une théorie granulaire, mais non point axiomatique, de la phonologie structurale. Il s’agit bien en fin de compte d’un modèle de morphogenèse, puisqu’on y voit la genèse d’une forme 643 obéissant à des règles de branchement assorties d’une discrétisation préalable. Il n’en fallait pas plus, semble-t-il, pour donner à Eden l’idée de se pencher sur les formes biologiques avec des modèles tout à la fois discrets, stochastiques et assistés par un calculateur numérique.

Notes
633.

“We have recently been informed about the work of Van der Gon and Thüring […] in simulating handwritten words written at high speed by an analogue device which embodies a simple physical description of a theory concerning the muscular forces used in writing”, [Eden, M. et Halle, M., 1960], p. 293.

634.

[Eden, M. et Halle, M., 1960], p. 293.

635.

[Jakobson, R., 1963], p. 87.

636.

[Jakobson, R., 1963], p. 87 : « Pour Norbert Wiener, ‘il n’existe aucune opposition fondamentale entre les problèmes que rencontrent nos ingénieurs dans la mesure de la communication et les problèmes de nos philologues ‘ » [référence citée : Journal of the Acoustical Society of America (JASA), vol. 22 (1950), p. 697] ».

637.

[Jakobson, R., 1963], p. 87.

638.

[Jakobson, R., 1963], pp. 87-88.

639.

Pour confirmer la profonde et ancienne proximité des problématiques de la linguistique structurale et de l’analyse mathématique, il rappelle que le linguiste russe, B. Tomchevsky, avait, dès 1923, utilisé des chaînes de Markov pour l’analyse statistique des vers poétiques, [Jakobson, R., 1963], p. 99. Il interprète cela comme un premier rapprochement de la linguistique avec les formalismes des processus stochastiques, bien avant la suggestion de Wiener.

640.

[Eden, M. et Halle, M., 1960], p. 289.

641.

[Eden, M. et Halle, M., 1960], pp. 290-292.

642.

“generators of the physical curves“, [Eden, M. et Halle, M., 1960], p. 293.

643.

Dont le statut est hybride : naturel et culturel.