4.5. État des lieux sur l’homogénéité entre bases de données.

L’unité documentaire en archéologie, l’unité stratigraphique, est connue, reconnue et s’impose à tous. Son homogénéité au sein des bases de données ne fait donc aucun doute. Néanmoins des distorsions peuvent subsister, le cas échéant, dans la “mise en machine”.

Concernant la description des données de fouille, on peut dire que l’homogénéité est pratiquement automatique puisqu’il n’y a pas dix manières de décrire une unité de fouille ou un objet céramique. L’homogénéisation de la description des données entre différentes bases de données ne pose pas beaucoup de problèmes (voir dans ce chapitre, la sous-section 4.6.3 - Compatibilité entre les champs de saisie, p. 49). Ensuite tout est question de finesse de la description. En effet la description des entités archéologiques d’une base portant uniquement sur la période protohistorique sera plus détaillée que celle d’une base d’un SRA par exemple qui doit prendre en compte toutes les périodes susceptibles d’être rencontrées lors d’une fouille. Dans ce cas (SRA) on voit se multiplier des champs de saisie généraux qui permettent de gérer la description mais celle-ci étant en langage naturel, ces champs sont d’une portée limitée pour aider à une recherche et à une association de données ultérieures.

Par contre l’absence de normes pour les codes d’inventaires des données de fouille entraîne une hétérogénéité dans leur traitement. Or chaque base possède son propre système, sa propre logique qui n’a souvent rien à voir avec celle d’une autre base. Aucun dialogue n’est alors possible entre elles. Un chercheur devant travailler sur plusieurs bases en même temps va être confronté à une quantité de codes qui n’auront rien à voir entre eux et devra donc trouver un autre identifiant présent dans la description pour identifier les données autres que le code d'inventaires : catégorie, type, lieu de découverte, … Mais le risque le plus grand lié à cette hétérogénéité concerne la pérennité des bases. En effet, une base est créée pour une action précise, une étude, la fouille d’un site particulier, une thèse. Lorsque cette étude, cette fouille ou cette thèse sont allées à leur terme, l’usage de la base est de plus en plus réduit au fur et à mesure que le temps passe, son évolution informatique (passage d’une version de logiciel à un autre, …) n’est plus suivie. De plus, le logiciel sur lequel elle a été créée et le support magnétique ou numérique sur lequel elle se trouve, vont petit à petit ne plus être lisibles sur les nouveaux matériels informatiques. Si on ne peut plus lire la base, les données seront perdues. Le plus simple pour sauvegarder ces données serait de les transférer dans une base de données qui est encore exploitée. Mais si les codes d’inventaires ne sont pas homogènes, ce transfert demandera l’établissement de tables de conversion, presque aussi dangereuses que la disparition d’une base (voir sous-section 4.6 - Exemple : étude de compatibilité des codes d'inventaires et des champs de saisie entre bdB et ArchéoDATA en vue d’une mise en commun des données, p. 42 et sous-section 4.6.4 – Synthèse, p. 51). Ces codes d'inventaires et leur homogénéité sont donc capitaux dans la pérennité des données.

En ce qui concerne les listes de termes de vocabulaires, le bilan n’est pas meilleur. Autant la création d’une liste peut être envisagée assez simplement pour une base de données isolée, autant cela pose de gros problèmes de conception lorsque l’on songe à une exploitation à une plus grande échelle, dans toutes les bases de données. En effet il faudrait prendre en compte toutes les périodes, tous les lieux géographiques et surtout il faudrait que les spécialistes se mettre d’accord sur des terminologies communes, ce qui est loin d’être le cas. De plus il faut envisager que les définitions de ces terminologies puissent changer ou tout du moins évoluer avec le temps, voire même disparaître (par exemple une catégorie mobilier qui après de nouvelles découvertes se voit scindée en deux nouvelles catégories, …).

Chaque nouvelle base créée devrait donc prendre en considération cette nécessité d’homogénéité des codes d’inventaires, des descriptions et des vocabulaires en son sein mais aussi avec d’autres bases de données dans un souci d’échange et de partage de l’information archéologique ainsi que pour répondre à la nécessité de pérenniser celle-ci.