4.2.4 Lemmatisation des unités segmentées

Le processus de lemmatisation consiste à regrouper toutes les unités segmentées sous une forme unique : le lemme. Lorsque l’analyseur propose plusieurs solutions pour la même unité segmentée, l’expert doit trancher pour l’une des solutions proposées. Par exemple, l’analyseur propose pour l’unité « قال » trois solutions différentes :

L’expert, en se référant au contexte de la phrase « قال لي ليلة أخرى » = (« Dans une autre nuit, il m’a dit ») doit évidemment choisir la dernière solution (figure 4-3).

Ainsi, chaque unité segmentée est remplacée par son lemme :

La figure (4-4) ci-dessous montre le même texte (figure 4-1) après le processus de lemmatisation.