6.5.1 L'accès lexical

Les possibilités de traitement automatique et de recherche d'un mot dans un index sont un des grands atouts des dictionnaires électroniques par rapport à leur équivalent papier. Ce procédé efficace permet d’accéder au mot très rapidement, ce qui s'avère très important dans un processus qui doit être le plus court possible.

En effet, passer de la forme fléchie dans le texte à la racine qui constitue l’entrée du dictionnaire papier, puis sélectionner la forme canonique appropriée n’est pas évident pour l'apprenant surtout lorsque des clitiques sont attachés au mot et lorsque le texte est non vocalisé.

Pur résoudre ce problème, les dictionnaires électroniques ont recours à deux solutions : une première, non envisageable pour la langue arabe qui consiste à lister l'ensemble des formes fléchies (cf. § 3.1) et une seconde qui fait fonctionner un analyseur morphologique.

Bien évidemment, l'accès au dictionnaire PROLEMAA pourrait être résolu par l'utilisation de l'analyseur morphologique (cf. chapitre 3). Cependant, le problème ne sera pas complètement résolu et deux problèmes au moins subsisteront :

  • Le problème de l’homonymie : que faire lorsque deux mots s’écrivent de la même manière ? Lorsque les deux mots n’ont pas la même catégorie grammaticale (KTB'verbe' : écrire et KTB'nom' : livres), le problème peut être résolu par l’ajout, de la catégorie grammaticale à côté du mot dans la liste des entrées. Par contre, si ce n’est pas le cas, aucun moyen n’est possible de les distinguer. Il faut donc lire la définition de chaque entrée pour rester ensuite sur celle qui nous intéresse, à moins que le texte ne soit étiqueté par des informations de niveau sémantique comme ceux que nous proposerons dans le cadre de l'environnement d'apprentissage « AL-Mu c aLLiM ».
  • Le problème des collocations et expressions semi-figées : Là, les solutions proposées sont très différentes. On peut proposer un index contenant principalement des expressions semi-figées mais qui sont listées telles quelles et même avec leur variation. Il faut taper exactement les premières lettres de l’expression pour avoir accès à sa traduction. Inutile de dire que cette fonctionnalité ne sera que de peu de secours pour celui qui précisément ne connaît pas l’expression ou qui ne la devine pas dans un texte. On peut aussi employer un moyen plus souple qui consiste à taper un mot ou une forme canonique de l'expression et obtenir les différentes expressions associées. C'est cette solution qui sera retenue, vu le nombre important de variations de chaque expression en arabe.

La figure (6-17) ci-dessous résume les différentes étapes permettant le passage d'un mot graphique arabe à sa signification dans le dictionnaire PROLEMAA. Le schéma est divisé en deux colonnes : la colonne de gauche correspond à un accès classique alors que celle de la colonne de droite correspond à une méthode d'accès optimisée que nous emploierons dans le cadre de l'environnement « AL-Mu c aLLiM ».

L'utilisation du dictionnaire PROLEMAA peut être donc envisagée de trois manières différentes :

  • L'apprenant cherche la signification d'un mot dont il ignore la forme canonique (i.e. l'entrée du dictionnaire). Dans ce cas, il pourrait avoir recours à l'analyseur morphologique qui lui propose un ensemble de solutions possibles parmi lesquelles figure la bonne forme canonique du mot.
  • L'apprenant cherche la signification d'un mot dont il connaît la forme canonique. Dans ce cas, il entre directement l'entrée du dictionnaire et le système lui propose les différentes significations de cette forme parmi lesquelles figure la bonne signification du mot recherché.
  • L'apprenant cherche la signification d'un mot à partir d'un texte électronique étiqueté. L'apprenant sélectionne le mot en question et le système le fait directement passer à la signification du mot choisi.

C'est ce dernier mode d'accès qui sera le plus utilisé dans l'environnement d'apprentissage, puisqu’on n’utilisera que des textes complètement étiquetés. Ce mode d’accès répond en effet aux besoins des apprenants débutants, qui n'ont pas assez de connaissances pour arriver à passer de la forme fléchie à la forme canonique. Les apprenants d’un niveau intermédiaire ne perdront non plus le fil de lecture du texte, puisqu’ils ils passeront peu de temps lors de la consultation du dictionnaire.