Un analyseur déclaratif comme son nom l’indique reçoit de manière déclarative les données de la langue. Le programme est général et la mise à jour se fait plutôt au niveau des données. Un exemple d’analyseur déclaratif est celui de PITRAT dont on trouvera une description dans G. Sabah (1989, pp. 25-36) et qu’on détaillera dans cette section.
Constatant que la méthode de WINOGRAD, devient très complexe si on étend le domaine de la langue ou on passe à une autre langue, PITRAT a conçu un même analyseur général qui a été testé sur une dizaine de langues dont l’arabe.
Les données utilisées dans son programme sont constituées de trois types d’informations :
Le processus d’analyse procède par des découpages successifs du mot en deux suites de chaînes de caractères. On regarde alors si la suite correspondant à la fin du mot est présente dans les terminaisons. Si elle y est, on recense les couples (nom de terminaison, rang) qu’on note (T, r) qui sont associés à la suite trouvée. Par exemple, si on analyse tenez, l’analyseur détectera la terminaison ez et lui trouvera associé le seul couple (VIP, 5), indiquant que cette finale est la cinquième de conjugaison des verbes à l’indicatif présent. On vérifie alors si le début du mot (ten pour l’exemple) correspond à une racine connue. L’analyseur déterminera alors les couples (Mot, Base) notés (M, B) formés du nom du mot de la base et de son rang dans le fichier des mots. Dans cet exemple, à partir de ten on trouvera (Tenir, 2), indiquant que la forme canonique du mot peut être TENIR et que la base TEN est la troisième dans le fichier des mots.
Une analyse est retenue lorsque la conjugaison associée au mot M (TENIR) dans le fichier des mots contient un groupe qui est associé à la suite de terminaisons trouvée T (VIP). On vérifie alors que le numéro de base de rang r (5) est bien R (2) dans le fichier des conjugaisons, ce qui est le cas pour notre exemple (Venir, IP, VIP, 1, 1, 1, 2, 2 , 3 ;…).
En continuant systématiquement le processus même après avoir trouvé une analyse, on construit toutes les analyses possibles.
De façon symétrique, à partir d’un mot M, d’un groupe G et d’un numéro n dans ce groupe, les données permettent de construire la forme fléchie : à partir de (Tenir, VIP, 5), on doit obtenir la forme Tenez, deuxième personne du pluriel de l’indicatif présent du verbe tenir.