2.3.2 Modélisation des verbes20

La partie verbale couvre environ 20.000 entrées. Une entrée verbale est définie par la donnée d’une racine et d’un schème verbal. Chaque entrée est représentée par sa forme conjuguée à l'accompli et à l'inaccompli à la 3ème personne du singulier masculin.

A chaque entrée verbale, est associé un spécificateur morpho-syntaxique incluant :

a) le numéro du modèle de conjugaison du verbe  21 : Un verbe conjugué en arabe se compose d'un préfixe, d’une base et d'un suffixe. Il varie en fonction du paradigme de conjugaison 22 et en fonction du pronom de conjugaison qui dépend de la personne (1ère personne (المتكلّم = celui qui parle), 2ème personne (المخاطب = celui à qui on s'adresse), 3ème personne (الغائب = l'absent)), du genre (masculin ou féminin) et du nombre (singulier, duel ou pluriel). Les paradigmes de conjugaison des verbes issus d’une racine anomale23 comportent plusieurs réalisations de la base verbale, chaque réalisation étant compatible avec un sous-ensemble déterminé de la liste des suffixes. Par exemple, les verbes ayant une racine redoublée comme (شَدَّ - يَشُدُّ : S aDDa-Ya S uDDu) = (« attacher ») admettent à l’achevé 2 bases (Figure 2-2) : Base1 = (شَدَد : S aDaD), utilisée par exemple dans les formes conjuguées (شَدَدْتُ : S aDaDTu) et (شَدَدْنَا : S aDaDNa) et Base2 = (شَدّ : S aDD), utilisée par exemple dans les formes conjuguées (شَدَّتْ : S aDDaT) et (شَدَّا : S aDDâ).

Chaque modèle de conjugaison admet un ensemble de schèmes de bases verbales24. Chaque schème d'une base est relié à une liste des préfixes (vecteur préfixes) et une liste de suffixes (vecteur préfixes) permettant d'obtenir les différentes formes conjuguées. La figure (2-3) ci-dessous, illustre les principales entités et relations de la base de données permettant la conjugaison des verbes.

b) la liste des dérivés nominaux immédiats : Un certain nombre de déverbaux très réguliers, dont l’inventaire est fini et systématiquement mentionnés dans les dictionnaires papiers ont été retenus (figure 2-4) :

Le sens du verbe est en relation avec un ensemble de déverbaux. Les déclinaisons de chaque déverbal sont obtenues par la donnée d'un numéro de modèle de déclinaison qui est associé dès le départ au schème du déverbal. Chaque déverbal peut être décliné suivant : le mode (indéterminé, déterminé par l'article, déterminé par annexion), le cas (nominatif, accusatif, génitif), le genre (masculin, féminin) et le nombre (singulier, duel, pluriel). 19 modèles de déclinaison de déverbaux sont employés. Chaque modèle permet de générer au plus 54 formes fléchies pour le même déverbal.

c) le spécificateur morpho-syntaxique : Ce spécificateur inclut des informations de nature morphologique et syntaxique (figure 2-4). Ces informations permettent :

  • de déterminer si le verbe peut être transitif aux humains et/ou aux non humains, avec ou sans mot outil (متعدّي إلى العقلاء / غير العقلاء، بأداة / من غير أداة),
  • si le verbe accepte la levée de la règle qui lui interdit un pronom enclitique de la première ou de la deuxième personne si son sujet est de la même personne (فعل من أفعال القلوب),
  • si le verbe admet un double complément d'objet, c'est à dire s'il accepte les doubles enclitiques (متعدّ إلي مفعولين).
Notes
20.

Ghenima (1998), (Brahem & Ghazeli, 1998) et (Dichy, Hassoun, Zaafrani, 2002 d).

21.

Ce travail reprend les modèles de conjugaison de l’arabe définis dans (Abu al-chay, 1988) et établis dans (Ammar & Dichy, 1999).

22.

Seulement 9 paradigmes restent aujourd’hui vivants : les 4 paradigmes de la voix active = (المعلوم) : l’accompli = (الماضي), l’inaccompli indicatif = (المضارع المرفوع), l’inaccompli apocopé = (المضارع المجزوم) et l’inaccompli subjonctif = (المضارع المنصوب) ; les 4 paradigmes correspondants à la voix passive = (المجهول) et l’impératif = (الأمر). Les verbes d’état durable n'admettant pas de voix "passive" en raison d'une impossibilité sémantique. D’autres paradigmes sont sortis de l’usage comme l’inaccompli énergique = (المؤكّد).

23.

On distingue grossièrement trois types de racines anomales : la racine redoublée = (المضاعف) dans laquelle la 2ème et la 3ème consonnes radicales sont identiques, la racine hamzée = (المهموز), dont l’une des consonnes radicales est une hamza (ء : ?) et la racine défectueuse = (المعتلّ) dont l’une des consonnes radicales est (و : w) et/ou (ي : y).

24.

Un paradigme de conjugaison donné peut avoir jusqu'à quatre bases de conjugaison différentes.