3.3.3 Interfaces guidées par navigation

Ces interfaces comprennent les systèmes hypertextes et hypermédias. Le mot hypertexte a été créé par Theodore H. Nelson pour désigner des écrits non-linéaires. En fait une interface hypertexte permet aux usagers de lire un texte de façon non séquentielle. Ainsi un système hypertexte, à l’origine, était plutôt un système d’organisation et de structuration de texte, permettant une lecture non séquentielle du texte. La façon de stocker et de trouver l’information, dans ces systèmes, ressemble à celle utilisée couramment par l’homme, par association d’idées.

Dans un premier temps, il était très facile de trouver l’information, mais dans un petit ensemble de textes. Or, pour des grandes bases de données, ce genre de systèmes ne fonctionnait pas bien car ce n’était pas un système de recherche d’information, dans le sens pur du terme, mais plutôt un système de lecture non séquentiel. On a donc ajouté à ces systèmes une fonction de recherche d’information basée sur l’approche traditionnelle, par utilisation de mots clés composés avec des opérateurs booléens. Ainsi, le démarrage d’une recherche d’information, dans un système hypertexte, commence d’abord, soit par la formulation d’une requête de recherche d’information traditionnelle, soit à partir d’un document donné, puis on navigue dans les textes des documents. Ces nouveaux systèmes ont provoqué l’apparition des « Hypertexts Information Retrieval ». Ce qui a apporté quelques changements dans le champ de la recherche d’information. Deux aspects importants sont apparus avec les hypertextes : 1) une augmentation de l’interactivité entre les usagers et le système de recherche d’information ; 2) une visualisation plus riche des résultats d’une recherche. Les points remarquables de ce changement sont : 1) l’utilisateur peut avoir la possibilité de mieux connaître le contenu de la base de données ; 2) la procédure de construction d’une requête de recherche d’information sera plus dynamique à cause de l’interactivité, ce qui permet un « feedback » plus rapide et ainsi la réformulation de la requête.

En réalité, les systèmes hypertextes ont acquis leur faisabilité grâce à des facilités graphiques, des écrans colorés et à l’insertion de la souris comme périphérique d’un ordinateur. Une autre facilité importante, souvent utilisée par ces systèmes est la meilleure utilisation de l’écran, les systèmes opérationnels offrent la possibilité de pouvoir partager plusieurs fenêtres dans un même espace de l’écran.

Ainsi, les principales caractéristiques d’une interface de navigation hypertextuelle sont :

la multiplicité des parcours de lecture des informations ;
l’utilisation de multiples fenêtres : on peut visualiser plusieurs documents sur un même espace de l’écran. C’est à dire, on peut visualiser plusieurs documents simultanément sur un même écran ;
l’interactivité : les interfaces hypertextuelles offrent à l’usager plusieurs choix de parcours. Les SRI classiques, lors de la procédure de présentation des documents trouvés en réponse à une requête, n’offrent qu’un parcours séquentiel. Tandis que les interfaces de navigation hypertextuelles permettent à l’usager voir les documents dans un ordre quelconque en suivant les liens existants dans les documents trouvés, par l’ordinateur, en réponse à une requête. En effet, ces liens peuvent amener l’usager à d’autres documents hors l’ensemble de ceux qui constituent la réponse à sa requête. Cette souplesse lui permet de reformuler la requête originelle ou même de sélectionner les documents parcourus qui lui satisfont son besoin d’information.

Il existe aujourd’hui un autre type de système nommé « systèmes hypermédias ». Selon Jean-Pierre Balpe, ils sont ‘ « … en effet, un ensemble d’informations appartenant à plusieurs types de médias (textes, son, image, logiciels) pouvant être lus, écoutés ou vus suivant les multiples parcours de lectures, en utilisant également la possibilité de multifenêtrage. Ce qui différencie essentiellement l’hypermédia de l’hypertexte, n’est ainsi que la nature symbolique des codages d’information utilisées. Un hypermédia n’est rien d’autre qu’un hypertexte gérant des textes supportés par des médias divers » ’ ³⁶ . C’est à dire, les systèmes hypertextes sont en fait une sorte de systèmes hypermédias, étant donné que ces derniers comprennent des informations sous forme de textes, d’images, de son. L’organisation, la structure et l’interface sont pareilles dans les deux systèmes, ce qui change c’est la nature des informations stockées et véhiculées. Exemples des systèmes hypertexte / hypermédia : GUIDE, HyperCard, Hypergate, SuperCard, SmartBook, Storyspace etc. Ce sont des systèmes dans lesquels on peut créer une application hypertexte ou hypermédia.

Parmi les exemples d’application Hypermédia, on trouve le WWW ³⁷ qui permet la navigation dans l'Internet pour accéder aux millions d'informations existantes dans ce réseau, soit à travers la saisie d'un adresse spécifique, soit à travers l'utilisation d'un des plusieurs moteurs de recherche (« search engines ») existants aujourd'hui, parmi lesquels on distingue Alta Vista, Excite, Infoseek, Lycos, HotBot, etc...

Jean-Pierre LARDY définit un moteur de recherche comme étant ‘ « des bases de données constituées automatiquement grâce aux logiciels robots qui scrutent à intervalles réguliers les serveurs (WEB, GOPHER, FTP ou autres selon le produit) déclarés sur l'Internet. Ils indexent mot à mot les documents localisés permettant ainsi des interrogations par sujet. Selon le moteur de recherche utilisé, les recherches porteront sur : le titre ou l'entête des documents ; ou les documents complets » ’ ³⁸ . On voit là que les procédures d'indexation ressemblent à celles utilisés par les traditionnels SRI, c’est-à-dire mot à mot. Il y a, donc, les mêmes problèmes en ce qui concerne la précision des résultats de la recherche que ceux qu'on trouve dans les traditionnels SRI.

Jean-Pierre LARDY continue son explication sur les moteurs de recherche en disant que : ‘ « l'utilisation de ces index se veut simple et rapide : pas question d'apprendre un langage de commande pour les interroger comme pour les bases de données bibliographiques des années 80. En général la question se pose en une fois et il est impossible d'affiner petit à petit une recherche. Le volume d'information disponible fait qu'il y a presque toujours des réponses, mais au prix d'un bruit important. Pour être efficace il est utile de connaître la manière dont la question est traitée. Malheureusement chaque moteur a son propre mode d'analyse. En général une question sera constituée d'un terme simple ou composé sans opérateurs booléens et sans caractère de troncature. L'opérateur implicite par défaut est le 'ou' (il y aura ainsi rarement des réponses nulles) et les termes sont tronqués selon des règles fonctionnant sur l'anglais. Des règles d'écriture particulière permettent d'utiliser des opérateurs d'adjacence. Les termes les plus fréquents de l'anglais sont filtrés grâce à un dictionnaire de mots vides » ’ ³⁹ .

Ainsi, on peut voir que ces moteurs ont apporté une certaine amélioration par rapport aux SRI traditionnels, étant donné qu'ils n'ont pas des langages de commande ou une syntaxe rigide à apprendre au préalable avant d'une consultation sur l'Internet. Cependant, cela a apporté quelques contraintes initiales parce qu'on ne pouvait pas, avec la majeure partie de ces moteurs, affiner une recherche. Toutefois, petit à petit les moteurs commencent à offrir quelques possibilités de raffinement.

Le moteur EXCITE a mis en place la possibilité de faire la recherche, en utilisant une méthode de recherche appelée Query-By-Example (QBE). Cette méthode consiste en faire une recherche à partir d’un document type indiqué par l’usager. Le SRI fait une recherche en utilisant les caractéristiques du document indiqué par l’usager. C’est une sorte de reformulation de requête, étant donné que l’usager fait l’indication d’un document parmi ceux trouvés par une recherche déjà faite. Dans le cas du moteur Excite, le document est une page WEB, choisi parmi les pages trouvées par une recherche faite au préalable.

Jean-Pierre LARDY complète les informations sur les moteurs de recherche : ‘ « La réponse à une question est une liste des adresses (URL) de sites ou de documents html en bouton hypertexte. Cette liste est en général classé par ordre de pertinence reposant sur une pondération des documents calculée à partir des critères de recherche. C'est l'application des travaux de Salton » ’ ⁴⁰ .

Il faut remarquer qu’aujourd’hui les choses changent très vite et les moteurs de recherche sont en pleine évolution, chaque jour apparaissent des nouveautés. De la même façon que les premiers moteurs n’avaient pas des possibilités de raffinement comme l’affirme LARDY, certains moteurs donnaient des réponses curieuses. On peut citer au moins un exemple : on a demandé, au début de l’année 1995, une recherche sur l’événement SBIA. SBIA est le sigle du Séminaire Brésilien d’Intelligence Artificielle et c’est un terme plus connu que son nom complet. La réponse à la requête a été de 180 références. C’était toutes les pages composées par des associations lesbiennes. Le moteur avait donc pris SBIA non comme un mot, mais plutôt comme une chaîne de caractères. L’explication de cette réponse, c’est que certainement, à cette époque là, il n’avait trouvé aucune page WEB sur cet événement (SBIA), et le logiciel a essayé de faire la recherche par SBI. SBI c’est une sous-chaîne de lesbienne. Quelques mois après, on a changé le moteur et ce genre de réponse n’apparaissait plus. Ainsi, il faut dire que les remarques présentées dans cette partie de la thèse — sur les moteurs de recherches — n’est valable qu’au moment de sa rédaction.

Un autre exemple intéressant d’amélioration concerne les recherches par phrases (une séquence de mots entourés par guillemets), ce qui diminue le bruit et rend les réponses plus précises. En fait, il semble que l’indexation demeure basée sur les mots, car au moment de la demande de recherche les moteurs composent la requête par l’intersection des mots de la phrase. Pour donner la réponse finale, ils font une simulation des opérateurs de voisinage ou de proximité pour ne sélectionner que les références avec les mots de la phrase fournie, dans l’ordre de cette phrase, les uns à côté des autres.

D’ici quelques mois, le panorama sera peut-être complètement différent, car les améliorations sont réalisées de manière rapide. Cette vitesse s’explique par l’agressivité du marché dans l’Internet. Il faut, donc, parler de ces outils avec précaution. Des recherches envisageant l’amélioration de ces outils sont en plein développement, notamment ceux qui sont basés sur le traitement automatique de la langue naturelle.

Notes

36.

Jean-Pierre BALPE. Hyperdocuments, Hypertextes, Hyermedipa. Paris : Eyrolles, 1990, p. 18.

37.

WWW est la sigle de World Wide Web.

38.

Jean-Pierre LARDY. Recherche d’Information dans Internet : outis et méthodes.Paris : ADBS Editions. 3ème édition de mise à jour – Mai 1997, p. 60.

39.

Jean-Pierre LARDY. Recherche d’Information dans Internet : outis et méthodes.Paris : ADBS Editions.

3ème édition mise à jour - Mai 1997, p. 60.

40.

Ibidem p. 61.