3.3 Processus d'analyse

3.3.1 Introduction

Comme nous l’avons déjà signalé dans l’introduction de ce chapitre, l'analyse d'un texte sur le plan morphologique est l'opération qui consiste à vérifier l'appartenance à la langue de chacun de ses mots, à déterminer leurs constituants (morphèmes) et à donner pour chacun ses traits linguistiques hors contexte.

L’analyseur doit distinguer deux catégories de mots. Les premiers sont ceux qui sont directement accessibles dans le lexique et les seconds sont ceux qui sont obtenus par flexion et/ou par composition. Dans cette section, on présentera une méthode d’analyse commune permettant de reconnaître tous les mots graphiques arabes (non voyellés, partiellement voyellés ou complètement voyellés).

La méthode d’analyse proposée reprend grosso modo le même cheminement que celles qui ont permis, dans le cadre des travaux de notre équipe, la réalisation d’un correcteur orthographique de l’arabe (Gader 96) et d’un système de voyellation de textes arabes écrits (Ghenima 98). Le même processus d'analyse a été généralement utilisé par la majorité des analyseurs morphologiques de la langue arabe (Ben hamadou, 1991) avec parfois des techniques informatiques différentes comme par exemple l'utilisation d'un automate d'états finis (Beeslay, 1996). Nous avons toutefois apporté quelques modifications dont notamment celle d'utiliser le mot minimal au lieu du noyau comme entrée pour la consultation du lexique. Nous avons ainsi évité les problèmes de transformation morphologique lors de l'assemblage des constituants du mot minimal qui seront traités par le générateur du lexique.

Le processus d’analyse s’effectue en plusieurs étapes. Dans chaque étape, un mécanisme de filtrage permet d'éliminer, de l'ensemble des solutions candidates trouvées, celles qui sont non valides. La figure (3-1) illustre l’ordonnancement de ces étapes avec les ressources associées. Dans cette section, nous allons nous intéresser à une présentation de chaque étape et à la définition des algorithmes et structures de données permettant leur mise en œuvre.