2.2.2 Analyse des besoins d’un synthétiseur et d'un analyseur automatique des mots graphiques

Comme nous l'avons déjà annoncé dans l'introduction de ce chapitre, l'objectif initial de la modélisation linguistique de l'équipe SAMIA était la réalisation d'un synthétiseur et d'un analyseur du mot graphique arabe, qui devront être utilisés dans le cadre d'un EAO de l'arabe. Ces outils pourront être par la suite utilisés dans d’autres applications tels que la traduction automatique, la génération automatique de textes et la correction orthographique.

Afin d'aboutir au bon fonctionnement de ces outils, un recensement des différents éléments et règles linguistiques a été effectué à partir de la décomposition du mot graphique arabe ci-dessus. Ce travail a permis de dégager les besoins suivants du synthétiseur :

L'analyse morphologique doit de son côté, non seulement identifier les différents morphèmes du mot à analyser17 et les attester, mais doit aussi fournir un ensemble d’informations morphologiques et syntaxiques sur le mot à analyser. L’unité lexicale doit être définie (base, mot minimal ou mot maximal) ainsi que l'ensemble des informations linguistiques qui lui seront associées.

Notes
17.

Le mot pourra être non vocalisé, partiellement vocalisé ou complètement vocalisé.