La modélisation de DIINAR.1, a permis d’organiser un maximum d’informations de natures diverses en différentes bases de données selon la nature de l'unité lexicale traitée (cf. Chapitre 2). Au bout de la chaîne d'analyse des mots graphiques (cf. § 3.3.7), l'analyseur a besoin d'accéder directement au lexique pour attester les solutions trouvées et de récupérer les diverses informations y relatives afin de les retourner en sortie d'analyse. Un lexique permettant de reconnaître rapidement toutes les formes fléchies et leurs différentes propriétés doit par conséquent être généré à partir de DIINAR.
Dans cette section, nous présenterons l'environnement qui permet de générer ce lexique. Cet environnement permet la régénération du même lexique pour tenir compte d'éventuelles modifications et de générer d'autres formes du lexique adaptées à d'autres analyseurs. En effet, aucun dictionnaire, qu’il soit électronique ou non, n’est bien entendu complet. La réalisation du dictionnaire DIINAR n’est pas terminée, et on peut se demander s’il est possible qu’elle le soit un jour. Cette base de données lexicale augmente sans cesse et est mise à jour régulièrement. Disposer d'un tel environnement permet d'inclure facilement les mises à jour et les informations ajoutées dans le lexique. D'autre part, d'autres analyseurs utilisent des lexiques générés à partir de DIINAR. Ces lexiques ont des contenus et des formes différentes du notre. L'environnement de génération permet de répondre à ces différents besoins sans toucher à la structure de la base de données lexicale.
L'environnement de génération du lexique permet aussi de mettre à jour la matrice de compatibilité Proclitiques - Enclitiques exploitée par l'analyseur (figure 3-3).
Dans cette section, nous allons d'abord définir les procédures et les règles morphologiques qui permettant l'obtention de formes acceptables par la langue arabe et ensuite présenter successivement les différents sous-lexique produits générés à partir de DIINAR.1.