3.2 Les méthodes d’analyse morphologique

Dans cette section, nous nous intéressons aux techniques informatiques de reconnaissance des formes fléchies. On distingue les analyseurs procéduraux (où les connaissances sont données sous la forme de programmes) des analyseurs déclaratifs (où les connaissances sont données de façon indépendante de leur emploi).

3.2.1 Les analyseurs procéduraux

Un analyseur procédural s’appuie sur l’analyse de la séquence d’actions à effectuer pour conjuguer un verbe (synthèse) ou pour retrouver la forme canonique à partir d’une forme fléchie (analyse), afin de déduire les règles permettant de reproduire ces processus. On trouvera une description plus détaillée de ce type d’algorithme et de l’exemple que nous reprenons ci-dessous dans G. Sabah (1989, pp. 25-28).

Ce processus a été employé par WINOGRAD en 1972 pour fabriquer un programme de reconnaissance d’une partie des formes fléchies de l’anglais (SHRDLU). Ce programme procède par une série d’actions sur la forme fléchie afin de retrouver la forme canonique : des suppressions de fin de mots (comme n’t pour la négation, ing, ed ou en pour les verbes, est et er pour les superlatifs et les comparatifs, etc.) et des ajouts de certaines lettres à la fin du mot (comme ajouter an après avoir ôté en de men, pour analyser le pluriel).

L’algorithme d’analyse a été implémenté sous forme d’un automate d’états finis. Il utilise une fonction FIN qui teste si la fin du mot correspond à l’une des chaînes (n’t, ing, etc.), une fonction OTER qui précise ce qu’il faut supprimer à la fin du mot et une fonction AJOUTER qui permet de remplacer les lettres supprimées. Lorsque l’automate aboutit à l’état final, une recherche dans le dictionnaire est effectuée pour voir si la base (= ce qui reste de la chaîne) existe. Par exemple, la forme fléchie plied est analysée en ôtant le suffixe ed et en remplaçant la lettre i par la lettre y ce qui permet de retrouver sa forme canonique ply.

Un tel mécanisme est généralement insuffisant. Quand une base est trouvée dans le dictionnaire, il convient de vérifier qu’elle est en accord avec le suffixe que l’on a ôté. La liste des traits morpho-syntaxiques attachés à la base doivent par conséquent, permettre de vérifier la compatibilité entre la base et le suffixe.

Pour le traitement des exceptions (comme pour passer de sang à sing ou de won’t à will), l’ajout des règles ralentit la vitesse de reconnaissance. Les algorithmes dans ce cas, doivent inclure deux entrées indépendantes. De ce fait, ces programmes s’appliquent dans des domaines très restreints de la langue où la morphologie est très régulière.