Les problèmes théoriques

Ils concernent la notion de données et sa ou ses définitions pour son intégration dans la banque de données. Quelle donnée choisir, comment la décrire et quel langage utiliser pour cela ? J.-C. Gardin met en avant deux types de données : les données naturelles, “c’est-à-dire immédiates, indépendantes de toute interprétation” et les données savantes, “déterminées par des options raisonnées sur la signification relative des observations”. Tout en développant les arguments des partisans de la seule intégration des données naturelles, J.-C. Gardin met en avant un système de mouvement de va et vient entre ces deux types de données, leur effet complémentaire, pour en conclure que tous les types de données ont leur place en une banque de données et doivent donc être intégrés.

Une fois que les données sont sélectionnées, il faut les décrire. Se pose ici le problème de la manière de les décrire. Les données ne doivent pas être décrites de manière trop succincte pour qu’elles puissent être exploitées dans la banque de données, mais pas non plus d’une manière trop détaillée et trop complexe pour éviter les lourdeurs de saisie. Cette description lève le problème du choix du langage de description. J.-C. Gardin expose alors les avantages et inconvénients des langages naturels et documentaires pour l’enregistrement et la manipulation des données en mémoire. L’enregistrement sous langage naturel, c’est-à-dire celui qui est utilisé dans la littérature archéologique, est techniquement possible mais il pose “[…] les problèmes linguistiques liés aux incertitudes des relations entre “signifiants” et “signifiés” […]”, c’est-à-dire de l’appellation de la donnée : une donnée de même type pourra être nommée de manière différente. Le langage documentaire résout cette difficulté puisqu’à chaque donnée correspond un mot spécifique, connu et reconnu par tous. Ce langage facilite “[…] la recherche rétrospective des informations […] par ses […] qualités de précision et d’univocité […]”. J.-C. Gardin conclut sur la nécessité de l’usage conjoint des deux langages dans une banque de données : “[…] les deux types de systèmes de signes — langage naturel et langage documentaire — répondent à des objectifs différents, et il est tout à fait absurde de redouter — et plus encore de préconiser — l’élimination du premier par le second”.

Le point suivant des problèmes théoriques porte sur le découpage et le regroupement des données par type. J.-C. Gardin fait apparaître la notion de banque de données unique qui en fait gérerait un même type de données : une banque de données pour les objets, une banque de données pour les monuments, une banque de données pour les textes, … Ce découpage semble être le plus simple, le plus évident mais J.-C. Gardin l’élimine aussitôt qu’il en a émis l’idée. “Le projet d’un découpage à la fois univoque et universellement tenu pour le plus fécond est une utopie. Une constatation simple suffit à le montrer : le même objet pourra être enregistré tout d’abord dans une banque de données dont le champ est la fouille elle-même, avec ses dizaines ou centaines de milliers de “données” […], puis dans une autre regroupant l’ensemble des documents du même genre, dans certaines limites géographiques et chronologiques […], puis dans une troisième, correspondant à un inventaire régional […], etc.”.