Étant donné l'importante fréquence des mots outils dans les textes arabes, le lexique regroupant toutes leurs formes fléchies des mots outils (Voir ci-dessous son processus de génération § 3.4) est consulté au début du processus d’analyse. Chaque entrée de ce lexique est formée par la forme non vocalisée du mot outil accompagnée de son schéma vocalique.
La recherche dans le lexique se faisant avec la forme non voyellée, en cas de succès, les schémas vocaliques des deux mots sont comparés. L'algorithme d'appartenance du schéma vocalique à celui accompagnant l'entrée du lexique est alors le suivant :
Arguments :
Fonction Appartient (Ch1, Ch2, ChNV)
Début
Appartient Vrai Par défaut, la schéma vocalique du mot appartient à celui du lexique
i 1, j 1 initialisation des compteurs permettant de parcourir les 2 schémas vocaliques
CptCons 0 initialisation du compteur permettant de parcourir le mot non vocalisé
ChaîneDesVoyelles " َ ً ُ ٌ ْ ِ ٍ "
Tant-que i <= longueur(Ch1) And j <= longueur (Ch2)
Parcourir les deux chaînes jusqu'au bout
c1 Sous-chaîne (Ch1, i, 1) Sélection du caractère de la position i de la chaîne Ch1
c2 Sous-chaîne (Ch2, j, 1) Sélection du caractère de la position j de la chaîne Ch2
Si c1 = c2 alors Si les deux caractères courants sont égaux
Si c1 = "?" alors CptCons = CptCons + 1 FinSi il s'agit de deux consonnes
i i + 1, j j + 1 Passer aux deux caractères suivants dans les deux chaînes
Sinon (c1 ≠ c2)
Si c1 = "?" And Appartient(c2, ChaîneDesVoyelles) <> 0 alors
Le caractère courant de la 1 ère chaîne est une consonne et celui de la seconde est une voyelle
j j + 1 Avancer au caractère suivant de la seconde chaîne
Sinon (c1 ≠ c2)
Si c2 = "?" And Appartient(c1, ChaîneDesVoyelles) <> 0 alors
Le caractère courant de la 2 ème chaîne est une consonne et celui de la 1 ère est une voyelle
i i + 1 Avancer au caractère suivant de la première chaîne
Sinon (c1 ≠ c2) Il s'agit de deux voyelles différentes
Appartient Faux, Quitter la fonction
FinSi
Fin Fonction
Cet algorithme permet donc d'analyser les mots non vocalisés, partiellement vocalisés ou complètement vocalisés. Si le processus réussit, le résultat de cette opération est retenu pour figurer directement en sortie de l'analyseur.
Par exemple, supposons que le mot à analyser est (ولَكَأَنّكَ : WaLaKa?aNNaKa) dont le schéma vocalique est (َ????َ?َ?? : ?a???a??a?) et la forme non vocalisée est (ولكأَنّك : WLK?NNK). L’interrogation du lexique des mots outils avec la forme non vocalisée fournit deux entrées comme possibles solutions dont les schémas vocaliques sont (ِ?َ??َ?َ?َ?َ? : ?a?a?a?a??a?i) et (َ?َ??َ?َ?َ?َ? : ?a?a?a?a??a?a). C'est uniquement cette dernière entrée qui sera retenue comme solution possible par l'algorithme Appartenir puisque la dernière voyelle de la première solution ne coïncide pas avec celle du mot à analyser.