Annexe 2 : La base de donnée lexicale DIINAR.1
1) Les partenaires de cette réalisation, liés par une convention d'études et de recherche, sont :
- L’Ecole Nationale Supérieure des Sciences de l’Information et des Bibliothèques (ENSSIB), 17-21, boulevard du 11 nov. 1918, 69623 Villeurbanne Cedex, France
- L’Institution de Recherche en Sciences Informatiques et Télécommunications (IRSIT), Parc Technologique des Communications - Route de Raoued Km 3.5, 2083 Ariana, Tunisie
- L’Université Lumière-Lyon 2, 86, rue Pasteur, 69365 Lyon Cedex 07, France
2) Le produit réalisé :
Un produit de valorisation, intitulé DIINAR.1, a été conçu et développé en commun par le consortium ENSSIB / IRSIT / LYON 2.
Ce produit est constitué d’un lexique informatisé complet et voyellé de l’arabe. Il prend la forme d’une base de données comportant environ :
- 20000 entrées verbales,
- 70000 entrées déverbales,
- 29000 entrées nominales, auxquelles sont associés 10000 formes de pluriel interne
- 1000 noms propres
- 450 mots-outils et
- l’ensemble complet des enclitiques, proclitiques, préfixes et suffixes de cette langue.
Les différentes entrées sont renseignées, et précisent en particulier :
- la façon dont le mot se fléchit (conjugaison, flexion, déclinaison, …)
- les relations dérivationnelles (« fléchages » entre formes du singulier et pluriels internes, entre formes verbales et déverbales, …)
- la façon dont il se combine avec des enclitiques et les proclitiques
- la racine ou la pro-racine à laquelle l’entrée est rattachée.