3.4. L’archivage physique des données et la pérennité des données numériques

De même qu’il est essentiel d’inventorier et de décrire les données, il faut aussi pouvoir retrouver physiquement certaines d’entre elles. Ces données sont le mobilier, les objets, les photographies, la documentation graphique, des rapports, des livres, … Leurs lieux de stockage peuvent être les dépôts de mobilier, des meubles dans les bureaux du centre de recherches pour les plans et les photos, une bibliothèque pour les rapports et les livres, … Avec l’arrivée des images numériques et de la documentation graphique informatisée, il faut aussi songer à archiver les sauvegardes informatiques (CD Roms, disques durs internes ou externes, …) de ces données et en assurer la pérennité.

Une fois que cet archivage physique est mis au point, on peut le compléter par une gestion des mouvements de ces données : quand l’objet ou la photographie est-il/elle demandé, pour en faire quoi, et quand doit-il/elle réintégrer le dépôt ou le meuble ?

La question de l’archivage physique des données amène à se poser la question de leur sauvegarde. Ces données numériques dépendent des systèmes d’exploitation ou des logiciels qui ont permis de les créer et de les traiter. Pour assurer leur pérennité, il faut exporter ces données sur des supports de stockage et s’assurer de la durée de vie de ces derniers. Aujourd’hui les disquettes 5"1/4 et pour la plupart les Syquest ne sont plus lisibles. Si les données qui étaient sauvegardées dessus n’ont pas été enregistrées sur un autre support, celles-ci sont perdues. De même nous ne connaissons pas encore réellement le vieillissement des CD Rom et nous pouvons uniquement faire des estimations sur leurs durées de vie. Il faut donc impérativement prévoir des stratégies de recopies liées à des contrôles de qualité des informations recopiées. De plus les systèmes d’exploitation et les logiciels évoluent et des données traitées par une version d’un logiciel en 2002 ne seront peut-être plus lisibles dans 10 ou 20 ans. Il faut là aussi penser à sauvegarder ces données sous des formats permettant une lecture “universelle”, comme les formats de type ASCII 81 ou XML 82 .

Cette sauvegarde sous langage “universel” des données numériques, et l’existence du tronc commun des bases de données, permettant à tout moment de transférer les données d’une base qui n’est plus exploitée vers une base qui est encore en activité, assureront une parfaite pérennité des données.

Notes
81.

Le langage ASCII (American Standard Code for Information Interchange) est un équivalent en code numérique à chaque caractère d'une langue (lettres majuscules et minuscules, chiffres, marques de ponctuation, autres symboles, …).

82.

Le langage XML (eXtensible Markup Language) est un langage permettant de mettre en forme des documents grâce à des balises. Il se base sur le principe du langage HTML complété par la possibilité de créer ses propres balises — le HTML n’est pas un langage de programmation, c’est un simple fichier texte contenant des balises permettant de mettre en forme le texte, les images … Une balise est une commande qui précède et suit un contenu comme un texte. Par exemple < soussection2 > 3.5 L’archivage physique des données et la pérennité des données numériques </soussection2 >. À ces balises seront ensuite appliquées des feuilles de style, appartenant à la DTD (Définition de Types de Documents) associée au document XML, qui permettront d’avoir une mise en page spécifique quelle que soit l’application sur laquelle on ouvre le document XML.

Le but de XML est donc de faciliter le traitement automatisé de documents et de données. L’idée est de pouvoir structurer les informations de telle manière qu’elles puissent être lisibles par le plus grand nombre, indépendamment de la configuration informatique de production et de celle de consultation. La communauté scientifique doit maintenant travailler à la formalisation des DTD. Cette formalisation permettrait de définir le champ disciplinaire et de pouvoir traiter chaque type de document de la même manière.

Cette conversion en langage XML a été appliquée à ma thèse qui rentre dans le cadre de la diffusion électronique des thèses de l’Université Lumière de Lyon II.