3.1- Amélioration des méthodes de traitement de l’information 

Les base de données bibliographiques produites d’une façon traditionnelle sont connues pour la qualité de l’indexation appliquée sur les documents primaires. Celle-ci est souvent manuelle. Cependant, pour réduire les coûts élevés de cette indexation manuelle, les producteurs ont de plus en plus recours à des systèmes d’indexation automatique.

‘«Nous avons un système semi-automatique, et nous développons un outil pour une indexation automatique dans le sens normal du terme. Economiquement, c’est la seule façon de conserver des bases de données bibliographiques à terme. L’indexation automatique est une tendance forte » 147 .’

Mais, les systèmes d’indexation automatique n’ont pas encore montré une réelle performance ce qui contraint les producteurs à continuer à utiliser l’indexation manuelle. Celle-ci garantit la qualité de leur base et préserve, par conséquent, l’avantage compétitif des producteurs de bases de données bibliographiques qui réside dans cette même qualité :

‘“We use automatic indexing to reduce the cost but there is the quality issues, there is a line you can’t cross, for us quality indexing is important, we have cited references, we have people keen to do cited references and I don’t think that we will give that up” 148 . ’

Cependant, les producteurs de bases de données bibliographiques sont de plus en plus conscients de l’importance d’élargir leurs index à de nouvelles sources d’informations telles que les journaux électroniques (INSPEC) et d’indexer les citations, (ISI, INIST), des données factuelles, des objets astronomiques (INSPEC), des substances organiques (NLM) et des noms d’organismes (CAS).

Le traitement de ces différents types de données amène à plus de pertinence dans la recherche d’information, une qualité que les producteurs aimeraient préserver. D’autre part, il permet à ceux-ci de proposer des produits dérivés tels que la base Journal citation Reports dérivée de Citation index d’ISI et les produits de veille stratégique proposés par l’INIST en se basant sur PASCAL.

Par ailleurs, le traitement varié des données a pour objectif d’effectuer des études métriques des sciences (MEDLINE de la NLM). Une fonctionnalité des bases de données bibliographiques qui s’est enrichie avec les hyper liens qu’a permis le Web. C’est l’exemple de CAS Science Spotlight, un service de Chemical Abstracts Services.

Notes
147.

Entretien effectué avec IMG, le 29 Janvier 2001.

148.

Entretien effectué avec MRI, le 23 Mai 2001. Traduction : «  Nous utilisons l’indexation automatique pour réduire les coûts, mais il reste la question de la qualité. Il existe une ligne que nous ne pouvons pas franchir. Pour nous, la qualité d’indexation est importante. Nous indexons les citations. Nous avons des gens qui sont attentifs à l’indexation des citations et je pense que nous n’allons pas abandonner cette qualité. »