2.2 Fondements théoriques

L'objectif des premiers travaux effectués par l’équipe SAMIA, était la définition d’un modèle linguistique pouvant être simulé sur ordinateur et utilisé dans le cadre d’un système d'enseignement assisté par ordinateur de la langue arabe (Dichy & Hassoun, 1989, pp 61). Sans traiter de façon exhaustive tous les phénomènes, la modélisation devrait permettre à un apprenant débutant d'étudier un maximum de régularités morphologiques afin qu’il puisse analyser et générer des mots correctement à partir de leurs traits linguistiques.

Le domaine qui a été pris en compte par l'équipe SAMIA était le mot graphique (mot séparé par deux blancs), et non pas la phrase ou le texte, bien qu'il soit généralement admis qu’une analyse au niveau de la phrase présente une démarche beaucoup plus puissante et moins génératrice d’ambiguïtés.

Ce choix s'explique par le fait que la structure particulière de cette unité en arabe rend nécessaire une étude approfondie des phénomènes qui se produisent à son niveau pour rendre possible l’analyse syntaxique (Jaccarini & Audebert, 1986). Le domaine du mot graphique arabe constitue en effet, un passage presque obligé de toutes les recherches dans le domaine du traitement automatique de l'arabe.

Dans cette section, nous détaillerons les fondements linguistiques des travaux SAMIA autour du mot graphique en arabe (Dichy, 1990) (Dichy & Hassoun, 1989), qui ont permis, par la suite, la conception d'un dictionnaire pour la synthèse et l’analyse automatique du mot graphique arabe (Hassoun, 1987) et la réalisation de la base de données lexicale DIINAR (Dichy, 1997) (Braham & Ghazeli, 1998) (Ghenima, 1998).

Nous présenterons d'abord le schéma de décomposition du mot graphique arabe tel qu'il a été défini dans le cadre des travaux de SAMIA. A partir de cette décomposition et des besoins des traitements de synthèse et d'analyse morphologique, nous recenserons les principales règles de gestion des formants du mot graphique, les relations entre les unités lexicales et le contenu du "spécificateur" qui doit être associé au mot graphique arabe.