1.3.2- Les outils décentralisés de création des métadonnées.

Les nouveaux produits présentant un risque de substitution des BBD bibliographiques, sont encore, dans leur phase de lancement. Ils concernent les outils décentralisés de création des métadonnées.

En effet, les métadonnées ne sont pas seulement une information secondaire qui est une information simple lisible par les machines (Machine Readable Information), mais une information que les machines peuvent « comprendre » (machine understandable information). 267 L’objectif de la création des métadonnées est de faciliter le traitement des flux des données sur la toile, non seulement en fonction de leur structure, de leur codage ou de leur formatage, mais aussi en fonction de leur contenu.

Les métadonnées prennent toute leur importance du fait qu’elles ont pour fonction de répondre à des besoins qui précèdent l’identification des ressources électroniques. Elles doivent permettre, à titre d’exemple, l’identification du texte par signature (Dsig), la gestion des droits d’auteur, d’éditeur ou de copyright et la possibilité de trier les résultats de la recherche en fonction du contenu et du public visé. 268

Le développement du Web Sémantique dépend en premier lieu du développement des schémas standards des métadonnées. Berners-Lee, l’inventeur de World Wide Web et l’un des principaux concepteurs du Web Sémantique représente l’architecture de ce dernier comme étant l’interposition des technologies et des standards (URI, XML, RDF, OWL, etc) qui repose essentiellement sur les métadonnées. 269

L’idée est, donc, de créer des métadonnées structurées qui seront incluses dans les balises méta des pages Web HTML ou XML. Les moteurs de recherche effectueront ensuite la recherche sur l’ensemble des éléments des métadonnées (par exemple : HotMeta , développé par The Distributed System Technology).

Mais, qui se charge de la création des métadonnées ? Les professionnels du catalogage et d’indexation sont les meilleurs candidats. Mais ce genre d’expertise humaine coûte cher, ce qui impose l’élaboration de solutions dont le développement des outils décentralisés de génération des métadonnées. En effet, les professionnels ne seront plus les seuls à se charger de la tâche. Les auteurs seront responsables de la création des métadonnées pour leurs propres ressources car ils sont les mieux placés pour décrire leur contenu.

Un certain nombre de projets de bibliothèques numériques soutient cette méthode. C’est le cas du projet de Library of Theses and dissertations (NDLTD : http://www.ndltd.org ). Ce genre de pratique incite de plus en plus d’attention, surtout avec l’accroissement du nombre de ressources disponibles sur Internet et par conséquent avec l’augmentation des coûts des professionnels chargés de la création des métadonnées.

Autre exemple, le projet Metadata Generation Research, mené par l’école des sciences de l’information de l’université de North Carolina, avec la collaboration de l’institut national des sciences de l’environnement (NIEHS), l’institut national de la santé (NIH), OCLC et Microsoft. L’objectif est de développer une interface aidant les auteurs à créer les métadonnées de leurs propres ressources Web. Cependant, l’examen de la qualité des métadonnées générées montre que les auteurs laissent incomplètes ou interprètent mal des éléments de description liés surtout à des champs de description sémantique ou syntaxique. (Par exemple: pour le champ source, l’auteur met « Microsoft », alors qu’il faut identifier la source initiale comme l’URL ou le ISBN). 270

Une récente étude, publiée par The Academic ADL-CO-Lab, montre que le manque de professionnalisme dans la création des métadonnées, pose un défi majeur pour le développement des activités d’enseignement à distance et recommande la réalisation de la tâche par les professionnels de la documentation :

“Book catatologers do not discuss whether the library record of a given book should be created by the book’s authors or by those who donate the book to the library. The extents to witch learning repositories currently depend on non–perofessional for the creating of their metadadat is unprecedented.  » 271

La production de l’information bibliographique (métadonnées) relève des compétences documentaires professionnelles. Elle constitue une activité qui se situe, largement encore, en aval de la chaîne de production de document numérique.

La demande de création des métadonnées pour les différentes ressources numériques constitue un marché à fort potentiel. Cependant, la création en amont des métadonnées, substituera à court terme, la production en aval de l’information bibliographique telle quelle est actuellement produite et commercialisée par les acteurs traditionnels.

Aussi, les thésaurus produits par certains producteurs servant à faciliter les tâches d’indexation et de recherche d’information, sont en train d’évoluer vers des ontologies. Le développement de ces dernières, utiles pour nombreuses applications Web, permettrait aux producteurs de se positionner sur un nouveau créneau du marché (ex : NLM avec l’évolution de thesaurus Mesh vers un réseaux dans le domaine de médicine). Cependant, ils vont devoir développer des compétences en ingénierie des connaissances.

Notes
267.

Provansal, Antoine. « Métadonnées et normalisation documentaire: l’enjeux pour l’Afnor», Séminaire du groupe de recherche CERSIDOC, enssib, 25 mai 1998. http://www.enssib.fr/bibliothèque/document/travaux/metadata/bnf.html

268.

Idem., 1998

269.

Jan Greenberg; Sturat Sutton,. “Metadata : A fundemntal compenent of the sementique web”. Bulletin of the American Society for information Science and Technology. Avril/ May, 003. PP16-18.

270.

Crystal, Abe . Interface design for metadata creation. Conférence de CHI Lauderdal, Florida, 5-10 avril 2003.

271.

Colin Holedn,“Froum local challenges to global community : learning repositories and global learning repositories summit”, Rapport de recherché de l’Acadmic ADL Co-Lab. Novmber 2003. Traduction «  Pour le catalogage d’un livre, le bibliothécaire ne pose pas la question de savoir si la notice bibliographique doit être fournie par l’auteur ou du donateur du livre. Le degré de dépendance des actuels entrepôts d’enseignement à distance sur les non- professionnels pour la création des métadonnées est sans précédent ».