2. Banques de données, bases de données et systèmes d’information archéologique : définitions

Les archéologues font une distinction entre les termes bases de données et banques de données. Ce dernier terme fut le premier à être utilisé en archéologie. Il rassemblait au départ toutes les applications informatiques gérant des données aussi bien des tableurs que des traitements de texte. Cette distinction semble toujours d’actualité, puisqu’elle se trouve encore reprise dans les derniers ouvrages de méthode en archéologie comme dans le Guide des méthodes de l’archéologie (Demoule et alii, 2002, p. 136-137).

François Giligny définit une base de données comme “un ensemble des informations, fichiers, ou sous-fichiers générés par un corpus, un site ou un projet archéologique […]” et une banque de données comme “une base de données gérée par un système documentaire constitué d’un ordinateur (ou serveur) et d’un logiciel, permettant une interrogation à distance par le biais d’un réseau de communication depuis un poste informatique”.

En fait aujourd’hui, lorsque l’on se penche sur les définitions de ces deux termes on se rend compte qu'elles se recouvrent. En effet les bases de données rassemblent de plus en plus de données et des types de données de plus en plus diverses, puisque les données bibliographiques, graphiques, photographiques et autres éléments multimédia y sont associés. Leur définition s’oriente donc vers celle que l’on peut donner des banques de données. Il ne manque plus que l’étape de l’interrogation à distance mais pour certaines, comme ArchéoDATA, cela est possible même si ce n’est pas exploité. D’ailleurs dans quelques années toutes les bases de données importantes devraient être accessibles par internet. La distinction banque/base de données porte en réalité seulement sur le point de l’utilisation. J’organise mes données, je fais une base de données. Je fournis mes données à un système collectif et je retire de ce système des données pour mon propre usage, je contribue à ou j’exploite une banque de données.

Depuis quelques années, le terme de système d’information archéologique (SIA) a fait son apparition. Un SIA serait l’association d’un outil d’analyse à une base de données. Néanmoins la plupart des bases de données d’aujourd’hui intègrent déjà ce genre d’outils aussi bien par l’intermédiaire de l’aide à l’interprétation, l’aide à la rédaction des rapports, l’aide à la constitution de graphiques, tableaux, courbes, … Cela fait partie de l’évolution logique de l’usage de l’outil informatique par l’archéologue grâce surtout à l’évolution des logiciels.

Je resterai fidèle dans mon développement au terme de base de données, puisque je considère qu’il définit parfaitement les éléments dont je vais parler (cependant, dans les études de bases de données spécifiques je reprends le vocabulaire utilisé par les concepteurs et utilisateurs). En effet, cette distinction, même si elle se maintient, n’a pas d’incidence sur l’analyse que je tente de faire. Cette analyse porte sur les structures, l’homogénéité et les traitements des données que ce soient celles d’un individu, d’une équipe ou d’une institution nationale. Je développerai dans la conclusion ce qui doit être associé pour moi à une base de données pour qu’elle puisse prétendre au terme de système d’information archéologique.

Une base de données se définit tout simplement comme un ensemble d’informations hétérogènes, organisées et évolutives susceptibles de répondre rapidement et sélectivement à une demande spécifique. “L’idée fondamentale d’une base de données est de définir, décrire et gérer les données indépendamment des programmes particuliers à chaque traitement” (Rouet, 1991, p. 155). On pourrait ajouter à cette définition de Rouet le terme d’associer les données. Les types de bases de données sont innombrables, mais il s’agit quel que soit ce type de classer des informations selon une structure définie. La structure la plus courante est celle qui distingue attribut et valeur ou autrement dit un nom de champs [terme fixe] (le nom de la rubrique) et une valeur de champ [terme variable] (la description de la donnée à saisir dans la rubrique).