Pour la première étape de la construction et de la mise en service de la maquette du système de recherche d’information, nous n’avons chargé que 5 articles dans la base de données.
La procédure de chargement des cinq premiers articles dans la base de données a été exécutée comme suit :
Le travail pour inclure les cinq premiers articles dans la base de données et de construire l’arborescence des syntagmes nominaux a été très lourd, étant donné que toute la procédure était manuelle et que la construction de chaque niveau d’arborescence prenait en compte un seul syntagme à la fois et ceci à chaque niveau.
A partir de cette expérience, pour le chargement définitif du corpus dans la base de données, on a adopté les procédures suivantes :
L’expérimentation de la maquette avec les cinq premiers articles a permis de se rendre compte des limites suivantes au sujet du logiciel : a) la taille maximale d’un champ type texte est de 256 caractères ; b) le logiciel n’arrive pas à travailler correctement avec une requête d’ajout dont la somme des tailles des champs soit est supérieur à 256 caractères ; c) la recherche d’un champ type texte est plus lente que n’importe quel autre type de champ. Parmi ces limitations, la plus importante est celle du nombre de caractères (256). Ceci empêche la liaison de deux champs ou plus, alors que ce type d’opération est très commun dans une procédure de recherche d’information. Pour éviter ces problèmes, dans la maquette finale, nous avons créé un code unique pour chaque syntagme nominal. Ainsi toutes les opérations de comparaison et d’ajout sont effectuées sur le code et non pas sur le texte du syntagme nominal. Ainsi pour restreindre la longueur d’un champ nous avons décidé de limiter sa taille à 150 caractères.
Cette limitation n’a offert que deux solutions pour stocker les textes des articles. Une solution étant de les considérer comme un objet importé, une autre de les mettre dans un champ type mémo. Aucune de ces deux solutions n’était la bonne, car elles ne permettaient pas de traiter les textes. Pour la maquette il fallait avoir des possibilités de distinction des syntagmes nominaux dans les textes lorsqu’on demande de voir le contenu d’un article. Ainsi, parmi les deux solutions la seconde étant la moins contraignante, on a gardé donc les textes des articles dans les champs type mémo. Cela a permis de présenter l’article en entier, ce qui avait été impossible autrement.
Les problèmes relatifs au comportement des syntagmes nominaux dans leur organisation en arbre et aux centres des syntagmes seront discutés dans la section suivante.