Deuxième axe (horizontal): Méthodes de recherche automatisée d’information

Dans le domaine des sciences de l’information, il existe une distinction entre deux méthodes de recherche d’information : la recherche documentaire et la recherche contextuelle. 283 La première vise à retrouver des documents par leur référence. C’est, donc, une recherche d’informations secondaires qui aboutit en une deuxième étape aux informations primaires. La deuxième est la recherche contextuelle qui part d’un mot ou d’un groupe de mots pour aboutir à un texte, c’est à dire à une information primaire qui contient les mots en question ou correspond au concept qu’ils représentent. La méthode de recherche d’information contextuelle suppose que les systèmes informatisés de recherche d’information soient capables de localiser de façon pertinente les informations demandées dans le texte intégral du document, c’est à dire capables de retrouver l’information sans nécessité d’une structuration particulière préalable du texte sous forme de mots clés et du résumé. Mais les limites technologiques durant les décennies 60, 70, 80 ont entravé le développement de cette même méthode. Ceci a permis l’épanouissement de la recherche documentaire qui se base sur des systèmes de recherche automatisée opérant sur des fichiers d’information structurée stockés dans une base de données. 284

Mais, le développement des outils de recherche d’information contextuelle, à la fin des années 90, a remis en cause les méthodes traditionnelles de recherche documentaire via la base de données bibliographiques.

En effet, l’entrée des sociétés annuaires et moteurs de recherche sur le Web influence la façon dont les utilisateurs recherchent l’information. Ces derniers, étaient habitués à interroger des bases de données bibliographiques afin de localiser les sources d’information primaire. Mais, des moteurs de recherche sur Internet tels que eXcite, Lycos, Voila, etc., offrent une recherche d’information directement appliquée sur le texte intégral des sources primaires 285 .

Cependant, malgré le développement des systèmes de recherche sur le texte intégral les premières pratiques de recherche d’informations sur le Internet montraient du bruit, des redondances et surtout peu de pertinence. Néanmoins, des services de recherche d’informations proposés se sont développés ces dernières années. Seulement, les améliorations réalisées sont dues au retour de moyens traditionnels d’indexation des ressources d’informations, c’est à dire une structuration préalable de l’information en utilisant un meta-langage pour la représentation des documents. Pour l’indexation de pages Web, les producteurs des moteurs de recherche sur Internet tel que Altavista, HotBot, Infoseek, prennent en compte, lors de l’indexation, la balise de description Meta inclue dans la page HTML. 286

Ceci a été confirmé par l’ancien directeur exécutif de la National Fedration of Abstracting & Information Services (NFAIS)

‘“Though vast improvemenst in Internet search engine performance have been occurred in the last several years, this has been due to the fact that traditional means of organising and evaluating information resources (including human intervention to classify Web sites into subject categories along with the addition of metadata to Web objects, i.e., indexing) are required in order for these engines to perform in an acceptable way” 287 “’

Ainsi, l’axe tendanciel horizontal portant sur les méthodes de recherche d’information se divise en deux pointes. La première désigne la méthode de Recherche sur le Texte Intégral (RTI). La deuxième représente la méthode de recherche d’Information à partir des informations bibliographiques structurées ou ce qu’on appelle actuellement les métadonnées (Recherche sur les Métadonnées : RMD).

Figure (7) : Axe tendanciel horizontal : méthodes de recherche automatisée d’information
Figure (7) : Axe tendanciel horizontal : méthodes de recherche automatisée d’information

En nous basant sur les deux axes : offre en ligne de sources d’information (axe vertical) et méthodes de recherche automatisée d’information (axe horizontal), nous proposons quatre scénarios d’évolution du marché des bases de données bibliographiques.

Figure (8) Les deux axes tendanciels des scénarios d’évolution du marché des BDDs Bibliographiques
Figure (8) Les deux axes tendanciels des scénarios d’évolution du marché des BDDs Bibliographiques
Notes
283.

Philippe Lefèvre, La recherche d’informations du texte au thésaurus. Paris : HERMES Science Europe, 2000. 253P

284.

Idem., 2000.

285.

Nicolas Bayon,. «  stratégies de collecte et d’indexation des pages Web par les moteurs de recherche : conséquences sur le comportement des utilisateurs », rapport de recherche, DESS Ingénierie Documentaire, enssib, 2000.

286.

Idem., 2000

287.

Entretien effectué avec NDK le 15 mars 2001. Traduction. «Les performances accomplies ces dernières années sur les moteurs de recherche sur Internet sont dues au fait que les moyens traditionnels d’organisation et d’évaluation des sources d’information (parmi lesquels l’intervention humaine pour la classification des sites Web selon des catégories thématiques ainsi que l’ajout des métadonnées pour l’indexation des ressources web), sont nécessaires pour que ces moteurs fonctionnent d’une manière satisfaisante » .