3 Modèle de données relationnel
Le logiciel Access utilise l’approche des structures de données de type relationnel pour gérer les bases de données. Cette approche regroupe un ensemble de concepts tous déjà bien connus, mais qui méritent d’être présentés une fois de plus. Les définitions ont été empruntées à l’ouvrage de Max VETTER, Modélisation des données : approches globales et orientée objets
70
.
- Tuple Une tuple est une liste de valeurs; une même valeur peut apparaître plusieurs fois. Exemple : <5, a informação, 7, 8> L’exemple ci-dessus signifie que : le syntagme nominal a informação, dont le code est 5, a été extrait de l’article 7, paragraphe 8.
- Relation Une relation est un ensemble de tuples. Une relation est normalement représentée par une table où les colonnes désignent les attributs - chaque colonne contient les valeurs d’un unique et seul domaine - et les lignes forment les tuples. Une certaine tuple ne peut apparaître qu’une seule fois dans la relation. Exemple :
- Les caractéristiques d’une relation :
- elle a un nom ;
- elle contient de 0 à « n » tuples (lignes) ;
- elle contient de 1 (une) à « m » colonnes aussi appelées attributs ;
- à l’intérieur d’une relation tous les attributs ont un nom unique ;
- les valeurs d’un attribut sont issues du même domaine, c’est-à-dire les valeurs d’un attribut ont les mêmes caractéristiques (numérique, alphabétique ou alphanumérique) ;
- une relation a au moins une clé ; la clé est un attribut ou un ensemble minimal d’attributs capables d’identifier de façon univoque les tuples de la relation ;
- chaque relation possède une clé primaire ;
- parfois des situations se présentent où il est nécessaire d’utiliser des clés composées de plus d’un attribut ; c’est le cas, par exemple, des syntagmes nominaux avec double rection, où un même syntagme nominal est lié avec deux syntagmes de niveau 1 distincts. Ainsi, la clé doit être formée par le syntagme de niveau 2 et celui de niveau 1, ce qui permet d’accéder au syntagme de deuxième niveau avec double rection, soit par un syntagme de niveau 1, soit par l’autre ;
Dans la relation de la figure 4.3, on voit le besoin de créer une clé composée par deux attributs puisqu’un même syntagme de niveau 2 peut être lié à plusieurs syntagmes de niveau 1. - une relation peut être représentée de la manière suivante :
R(code#, syntagme, article, paragraphe)
- Normalisation des relations Les relations non-normalisées présentent en général des données redondantes. Cette redondance provoque sur le système une plus grande occupation de la mémoire, en plus du risque d’anomalies de mémorisation. Ces anomalies sont des difficultés liées aux opérations d’insertion, de modification et de suppression, qui peuvent amener les relations vers un état ne correspondant pas à une description de la réalité. Pour corriger ces problèmes, E.F. CODDCODD, E. F. « A relational model for large shared data banks ». CACM. 1970, vol. 13, nº 6.,CODD, E. F. « Further normalization of the relational model ». Data Base Systems, Courant computer science symposium 6, 1971. Rustin R. Editeur, Englewood Cliffs, New Jersey 1972. a été le premier à appliquer les règles de normalisation, au nombre de cinq aujourd’hui. Lorsqu’une relation respecte toutes ces cinq règles, on l’appelle une relation entièrement normalisée. Cependant, dans la pratique, on se contente des relations qui respectent les trois premières règles, celles qu’on appelle les relations en troisième forme normale (ces règles sont connues aussi comme 1FN - Première Forme Normale, 2FN - Deuxième Forme Normale, 3FN - Troisième Forme Normale, 4FN - Quatrième Forme Normale, 5FN - Cinquième Forme Normale).
-
- Première Forme Normale Dans une relation en première forme normale, les attributs ne peuvent prendre que des valeurs simples. Ainsi, à l’intersection d’une colonne (attribut) et d’une ligne (tuple) il ne peut y avoir qu’une valeur. Autre forme de définition de cette règle : une relation est en première forme normale si tous les attributs non-clés sont dépendants fonctionnels de la clé. Un attribut est dit dépendant fonctionnel d’une clé si à chaque valeur d’une clé ne correspond qu’une seule valeur de l’attribut.
- Deuxième Forme Normale Une relation en deuxième forme normale est caractérisée par le fait que tous ses attributs non-clés dépendent fonctionnellement de toute la clé (critère de 1FN) et non seulement d’une partie de la clé. C’est-à-dire qu’une relation est en 2FN si elle respecte la 1FN et que chaque attribut non-clé est entièrement dépendant fonctionnel de la clé. Cette deuxième forme normale est due au fait qu’une clé peut être formée par plus d’un attribut. Ce critère s’applique aux relations dont la clé est composée d’un minimum de deux attributs ayant au moins un attribut non-clé.
- Troisième Forme Normale Une relation est en troisième forme normale si elle respecte la 2FN et qu’elle ne porte aucune dépendance transitive (c’est-à-dire, il ne doit pas y avoir de dépendance fonctionnelle entre des attributs qui ne sont pas des clés candidates). Une relation peut avoir d’autres clés en plus de la clé primaire, celles-ci étant des clés candidates, lesquelles à leur tour sont en liaison simple les unes avec les autres.
Voici les principaux concepts pour la modélisation relationnelle de données. Il ne semble pas nécessaire de discuter plus en détail le modèle relationnel dans ce travail, car ce qui compte c’est la bonne utilisation de ce modèle. On présentera ainsi, par la suite, le modèle de données des syntagmes nominaux pour la construction de la maquette.
Notes
70.
Max VETTER. Modélisation des données : Approches globale et orientée objets. Paris : Dunod Informatique, 1992