4 Structure de la base de données LEXIQUE

La base LEXIQUE sera structurée selon le modèle relationnel. L’entité majeure dans cette base est l’unité lexicale (mot, mot composé, ponctuation). Cette structure, dont on a beaucoup discuté précédemment, dépend des faits qui caractérisent cette entité et qui sont :

  1. Chaque unité lexicale a une catégorie, représentée par un caractère ;
  2. Chaque unité lexicale a un ensemble de caractéristiques appelées variables de sous-catégorisation, soit d’ordre lexical, flexionnelle ou syntaxique ;
  3. Chaque unité lexicale peut appartenir à plus d’une catégorie ;
  4. Chaque unité lexicale peut avoir une règle de contrainte appelée RG ;
  5. Chaque unité lexicale peut exiger un ou plusieurs compléments. Ces compléments peuvent être régis ou non (cas d’objet direct) par une préposition. Dans ce cas, il faut indiquer les prépositions susceptibles d’apparaître pour chaque complément ;
  6. Certaines unités lexicales sont le résultat d’une contraction de deux autres unités lexicales qui appartiennent à des catégories déjà existantes. En ce cas, il faut réaliser un pré-traitement pour restituer leurs unités originelles envisageant leur traitement individuel par l’analyseur. Ce pré-traitement devra être indiqué dans l’enregistrement de l’unité lexicale contractée, à travers l’indication de la valeur PRE dans la variable RG ;

Après ces faits explicités plus haut, on voit que les quatre tables suivantes sont nécessaires :

  1. ULEX (code, unité_lexicale) où : code  : := code numérique qui identifie chaque unité lexicale. Cet attribut est la clé primaire de cette relation ; unité_lexicale  : := mot, mot composé ou ponctuation. Cet attribut doit être indexé.
  2. CARACTERISTIQUES(code, catégorie, var, valeur) où : code : := contient le code d’identification de l’unité lexicale. Cet attribut et l’attribut catégorie forment la clé primaire ; catégorie : := cet attribut contient la catégorie de l’unité lexicale ; var : := représente chaque variable qui peut contenir des valeurs qui caractérisent une unité lexicale. Si une unité a plusieurs caractéristiques, c’est-à-dire plusieurs sous-catégories, il y aura autant de tuplesRappelons que tuple est un ensemble d’attributs d’une table, en ce cas formé par <code, catégorie, var, valeur> Exemple : <1,F, GR, FEM> , <1, F, NB, SIN>, <1, F, NC, 2>. que le nombre de sous-catégories. Exemple de var ou variable : GR = genre, NB = nombre, AN = animation, NC = nombre de compléments ; valeur : := la valeur correspondante à la variable explicitée dans une tuple.
  3. PREP (code, coderc, prp1, prp2, prp3, prp4) où : code : := contient le code d’identification de l’unité lexicale ; coderc : := cet attribut contient un code numérique séquentiel. Cet attribut avec l’attribut code forment la clé primaire de cette relation. Cet attribut doit exister car on peut avoir plus d’une combinaison de prépositions par chaque unité lexicale ; prp1 : := contient la préposition qui doit précéder le premier complément de l’unité lexicale représenté par le code. Si le complément est un objet direct, cet attribut doit avoir la valeur blanche ; prp2 : := contient la préposition qui doit précéder le deuxième complément de l’unité lexicale représenté par le code. Cet attribut ne doit être rempli que lorsque la valeur de la variable NC dans la relation CARACTERISTIQUE est 2CO ; prp3 : := contient la préposition qui doit précéder le troisième complément de l’unité lexicale représenté par le code. Cet attribut ne doit être rempli que lorsque la valeur de la variable NC dans la relation CARACTERISTIQUE est 3CO ; prp4 : := contient la préposition qui doit précéder le troisième complément de l’unité lexicale représenté par le code. Cet attribut ne doit être rempli que lorsque la valeur de la variable NC dans la relation CARACTERISTIQUE est 4CO.
  4. ECHANGE(code, code1, code2) où code : := contient le code de l’unité lexicale contractée. C’est aussi la clé primaire de cette relation ; code1 : := contient le code de la première unité lexicale participante de l’unité lexicale contractée, suivie de sa catégorie pour qu’on puisse retrouver ses caractéristiques dans la relation CARACTERISTIQUES ; code2 : := contient le code de la deuxième unité lexicale participante de l’unité lexicale contractée, suivie de sa catégorie pour qu’on puisse retrouver ses caractéristiques dans la relation CARACTERISTIQUES.