a) Intégration d’outils existants

Lorsque nous parlons d’intégration d’outils existants, il ne s’agit pas de ceux qu’ont installé pour leur propre compte certains veilleurs, ou des logiciels de type métamoteurs, agents intelligents de collecte ou de traitement d’information, pour plusieurs raisons : d’une part ils doivent être installés sur le poste de travail de chaque personne (souvent en local, peu existent en version serveur), ils demandent une prise en main plus ou moins longue, et d’autre part ils évoluent vite et de nouveaux plus performants font régulièrement leur apparition. L’intégration de ces logiciels n’est donc pas envisageable sur une plate-forme dont l’accès se fait par l’intranet.

Par contre nous avons pu intégrer des outils développés auparavant pour l’activité d’intelligence technique et stratégique, donc déjà disponibles sur le serveur, ainsi que d’autres spécifiques que nous avons achetés ou qui étaient disponibles en interne.

Il s’agit en particulier :

  • d’un outil de surveillance de pages web,

  • d’un outil de partage et de recommandations de pages web,

  • d’un outil de création de parcours de pages, destiné en particulier à la formation.

  • D’un outil de recherche.

Surveillance de pages web

A l’origine de cet outil, il y a une volonté de faciliter la collecte d’information sur des sources externes identifiées, en automatisant la surveillance de pages web. Le principe est simple : alerter par mail des utilisateurs abonnés lorsqu’une page est modifiée. Le développement de cet outil correspond à la nécessité d’organiser une diffusion sélective de l’information, notamment auprès des veilleurs.

Le schéma ci-après décrit le processus conduisant des besoins (manque de vision globale de la part des chercheurs, volonté d’optimiser le temps de recherche d’information, nécessité de trier les sources d’informations externes, et intérêt pour la diffusion par push) à la solution proposée.

message URL SCHEM15.gif
Analyse des besoins conduisant à la réalisation d’un processus de diffusion sélective de l’information D’après [CARE99], p. 8. .

La technique de diffusion utilisée est particulièrement adaptée aux besoins des utilisateurs qui ont peu de temps à passer à la recherche d’information sur le web mais désirent néanmoins surveiller certaines pages. Bien sûr il existe des outils sur étagères, souvent gratuits d’ailleurs, voire même en ligne, pour effectuer ce type de tache. Cependant leur paramétrage est souvent limité, et leur utilisation nécessite un enregistrement et une connexion régulière des utilisateurs. Le fait de développer un produit adapté aux besoins précis du contexte permet également de s’affranchir des éventuelles modifications voire disparitions de ces outils, et de l’intégrer parfaitement à ce qui existe déjà pour proposer des fonctionnalités homogènes. C’est plus un service à valeur ajoutée qu’un outil, puisqu’il ne se présente pas sous la forme d’un logiciel à installer mais bien d’une fonctionnalité proposée sur le site du service d’intelligence technique.

L’utilisateur reçoit chaque jour, s’il y a des modifications, un message les lui signalant et lui donnant les liens directs vers ces pages63.

Une première étape a consisté en l’identification des pages de sites que l’on voulait surveiller. Nous avons choisi plusieurs thématiques dans lesquelles nous avons inséré des sites qui nous paraissaient pertinents pour le domaine de veille qui nous concerne (voir ’Identification et choix des sources’). Certains thèmes nécessitaient une couverture quasi exhaustive, alors que d’autres demandaient plutôt un choix de sites représentatifs du domaine. En général, c’est la page de communiqués (’news’) qui est la plus intéressante pour surveiller les nouveautés sur un site. Il suffisait donc d’enregistrer l’URL pour que l’outil la prenne en compte. Il faut cependant éviter de surcharger le nombre de sources proposées à l’utilisateur, et préférer une sélection fine en amont, car l’exhaustivité n’est pas forcément garante de la qualité de l’information

Une fois les sources choisies, une ’mécanique’ de surveillance automatique à fréquence choisie, basée sur un module PERL spécifique64 exécute des requêtes sur le web en contactant un serveur et en renvoyant le résultat de la demande. Les pages correspondantes aux URL ciblées sont rapatriées chaque jour et comparées à celles mémorisées (la dernière version, qui sert de référence). Deux critères permettent de décider s’il y a lieu d’avertir l’utilisateur ou pas : la taille du fichier et le nombre de lignes. En effet ne sont pertinentes que les modifications significatives du contenu, et pas seulement un changement de slogan publicitaire par exemple. Le challenge est d’arriver à doser ces critères le plus finement possible, et seule une phase de test a permis de les ajuster.

L’outil propose une interface pour l’inscription et le choix des pages que l’utilisateur veut surveiller pour chaque thème proposé. Cette interface permet également à l’utilisateur de gérer par la suite ses abonnements. Pour cela, la technique des cookies a été utilisée : l’outil reconnaît l’utilisateur chaque fois qu’il se connecte sur cette page, et affiche instantanément son adresse et ses choix précédents.

Une interface d’administration permet d’ajouter ou de supprimer un thème et une url. En effet l’outil est fait pour vivre et s’adapter aux demandes des utilisateurs. De plus, il est régulièrement nécessaire de mettre à jour les adresses des sources ciblées.

Il est prévu de faire évoluer l’outil en offrant la possibilité de modifier un abonnement sans avoir à le détruire et le recréer, et également de surveiller d’autres formats moins standards que le HTML.

Parmi les autres perspectives envisagées, il y a l’offre à l’utilisateur de rentrer lui-même des URL qu’il veut surveiller, et donc de se créer sa liste personnelle.

message URL SCHEM16.gif
Schéma de l’interface d’accueil Pour des problèmes de confidentialité, certaines interfaces n’ont pu apparaître dans ce document. Nous en proposons donc une version schématisée.

Si l’on clique sur un thème, on arrive à l’écran suivant :

message URL SCHEM17.gif

A gauche sont listées les sources appartenant à ce thème. L’utilisateur peut gérer son abonnement (création, modification) en sélectionnant celles qu’il désire surveiller. A noter : un système de cookie permet de détecter l’identité de l’utilisateur s’il est déjà abonné.

Dès qu’une modification est détectée sur une ou plusieurs sources, le programme envoie à l’utilisateur un message :

message URL SCHEM18.gif

Quant à l’interface d’administration, elle permet la consultation, la création, la suppression ou la modification de thèmes, l’ajout de nouvelles sources, et la consultation de la base d’abonnés.

L’intérêt d’un tel outil est entre autre d’accéder à des informations mises à jour, en s’affranchissant des délais très longs d’indexation des pages par les moteurs de recherche (souvent plusieurs semaines). L’utilisateur n’a pas besoin de prendre du temps régulièrement pour se connecter à ces sites et chercher si oui ou non ils ont été mis à jour.

Système de recommandations de pages web

Nous avons choisi un outil, Pharos66, qui s’adresse tout particulièrement à des communautés d’intérêts qui souhaitent avoir un support de partage de ressources et de recommandations concernant leurs sujets communs. Petit à petit se constitue un catalogue de ces ressources (des pages web le plus souvent), une base de connaissances qui permet de capitaliser l’information en la partageant. L’outil est également doté d’un moteur thématique qui retourne les résultats classés, commentés et évalués par des utilisateurs. La partie serveur est assez simple à installer, et l’administrateur peut facilement créer des canaux thématiques auxquels il rattachera des mots clés. Même l’interface (les textes, le graphisme) est paramétrable.

message URL SCHEM19.gif
Interface d’accueil du canal

Concrètement, lorsqu’un membre d’une communauté d’intérêt trouve une page web intéressante, il clique sur un bouton préalablement installé dans la barre de son navigateur. Un formulaire s’ouvre alors, qui contient automatiquement l’URL et le titre de la page en question. L’utilisateur n’a plus qu’à donner son commentaire et éventuellement rattacher la page à des attributs (mots clés). En validant ce formulaire, il enrichit le catalogue commun d’adresses que tous les autres membres pourront consulter et commenter eux-aussi.

message URL SCHEM20.gif
Formulaire. Les champs url et titre sont automatiquement renseignés.

Dans le cadre de la plate-forme, nous avons eu l’idée de créer une chaîne thématique pour les veilleurs, dans le but de s’échanger les bonnes adresses pour faire la veille : outils, sources d’informations, ou tout autre page apportant un intérêt méthodologique. Cette chaîne, qui porte le même nom que la plate-forme, est matérialisée par un lien sur le portail.

Chaque personne qui veut participer en ajoutant des URL ou des commentaires doit au préalable s’inscrire en ligne. Un administrateur gère les attributs auxquels peuvent être rattachées les URL.

Avec cet outil, les veilleurs sont au centre du processus de classification des sites et des pages web [HERV00]. Grâce au système d’annotations et d’attributs, chaque utilisateur peut rapidement visualiser la liste des sites recommandés par d’autres veilleurs qui ont les mêmes intérêts que lui.

Parcours didactique

Les besoins en formation sur le processus de veille nous ont conduits à intégrer dans la plate-forme un logiciel de création de parcours cartographiques de ressources internes et / ou externes : eSavoir67. Il permet de guider l’utilisateur dans un objectif précis, par exemple celui de la formation.

L’outil est composé d’un module ’auteur’68 et d’un autre ’lecteur’, et les cartes sont visualisées dans le navigateur de l’utilisateur. Il aura dans la zone gauche de l’écran la carte des sources, et dans la zone droite la source elle-même, c’est-à-dire la visualisation de l’étape sur laquelle il se positionne.

Cette ergonomie est très utile pour parcourir avec un maximum de visibilité des pages définies dans un ordre précis. Il est à noter que les cartes peuvent s’échanger et s’envoyer simplement comme fichier attaché dans un message.

Cet outil est donc très utile pour publier des parcours pédagogiques, mais aussi pour organiser des documents de façon à gérer des bibliothèques communes, de s’intégrer dans un processus de gestion des connaissances d’un groupe d’utilisateur.

Dans le cadre de la plate-forme, e-Savoir est utilisé pour proposer une initiation à la veille, ainsi que le partage de ressources spécifiques pour l’activité. Nous avons défini un certain nombre d’étapes didactiques, pour comprendre ce qu’est le processus de veille, et donner les méthodes et outils nécessaires à sa réalisation. Nous avons créé des pages HTML correspondant à :

  • mode d’emploi pour la veille stratégique : définitions, étapes

  • identification des acteurs de la veille

  • les outils disponibles

  • les processus internes

message URL SCHEM21.gif

L’accès au parcours réalisé avec eSavoir se fait par un lien dans la ’Boîte à outils’ (voir plus loin).

Moteur de recherche

Un des éléments essentiels de la convergence entre sources internes et externes, entre gestion des connaissances et veille, est la mise en place, sur le système d’information de l’entreprise, d’un moteur permettant l’indexation et la recherche sur l’ensemble des documents disponibles (serveurs documentaires, bases de données, serveurs de fichiers, et web externe). Le moteur choisi, askOnce69, est un fédérateur offrant une interface unique de recherche et d’accès à ces sources, quelque soit leur format. Les différentes sources ont fait l’objet d’un travail d’analyse pour développer des « wrappers », couches intermédiaires permettant d’interroger chacune dans son langage propre. Les résultats sont donnés par sources, mais des tris sont possibles.

askOnce est accessible via un navigateur. Tant l’interface simplifiée que celle avancée permettent de choisir finement les sources que l’on veut interroger.

message URL SCHEM22.gif
Interface de recherche simplifiée (voir note n° 65)

L’interface avancée est une fenêtre Java qui propose de nombreuses options et paramétrage. Cependant son usage, bien qu’il soit ouvert à tous, est plus complexe. Nous avons noté que peu de personnes l’utilisaient.

message URL SCHEM23.gif
Formulaire avancé de recherche (Applet Java) avec askOnce

Le portail offre une recherche directe sur les sources intranet internes, et un lien vers un formulaire avancé pour le choix de sources internes et ou externes.

Notes
62.

D’après [CARE99], p. 8.

63.

L’outil compare le fichier d’abonnés (qui contient l’adresse et les choix d’abonnement de chaque utilisateur) au fichier d’état des modifications par thème, puis construit un document HTML pour chaque abonné, le code (uuencode) et l’envoi par messagerie.

64.

LWP : :User Agent

65.

Pour des problèmes de confidentialité, certaines interfaces n’ont pu apparaître dans ce document. Nous en proposons donc une version schématisée.

66.

Outil développé en partenariat par Dyade (http://www.dyade.fr), GIE constitué par l’INRIA et Bull.

67.

eSavoir est un logiciel développé par Synergie 3R (http://www.synergie3R.com).

68.

Le module auteur permet de créer des cartes à partir de ressources existantes, mais comprend aussi une interface de création de ressources HTML directement dans l’outil.

69.

askOnce est développé par Xerox (http://www.xerox.com).