L’idée de départ, notre fil conducteur, est qu’il vaut mieux identifier des sources pertinentes et les surveiller régulièrement que de chercher tous azimuts sur Internet au risque de se perdre et de perdre son temps.
En effet, une source d’information régulière dont on a démontré la fiabilité est certainement plus utile qu’une requête qui nous renvoie sur des sites dont il faut en permanence mesurer la validité. Certes, cette seconde manière de rechercher l’information peut s’avérer utile pour s’assurer que l’on ne passe pas à côté d’un élément nouveau, un signal faible, mais le rapport entre le temps passé et le résultat n’est pas assez important. Il nous a donc semblé important de valider un système de surveillance régulière de sources identifiées, que l’on pourra ensuite compléter par d’autres informations.
Lorsque l’on doit choisir des sources pour surveiller l’évolution d’un environnement technologique de R&D, se pose rapidement le dilemme suivant : entre sources scientifiques ’pures’ et sources journalistiques de vulgarisation ou généralistes, entre sources formelles et informelles, que faut-il préférer ? En fait un équilibre est nécessaire, qui permettra de couvrir tous les aspects. Le fait d’avoir une collecte d’informations sur des sources hétérogènes permet de recueillir à la fois de l’information primaire et secondaire, mais aussi la validation, le recoupement, la complémentarité pour couvrir largement un domaine.
Bien sûr la surveillance des brevets est essentielle, mais elle nécessite l’intervention de spécialistes. Quant à la littérature spécialisée (éditions scientifiques), notre expérience nous a montré que ce type d’informations était assez souvent déjà en possession des chercheurs et ingénieurs, comme nous l’avons dit précédemment. Cependant il faut faire attention à deux biais : l’information trop d’actualité (événementielle) ne permet pas d’anticiper, et l’information trop spécialisée empêche d’avoir une vue globale sur un sujet. En fait chaque type d’information peut avoir son utilité quand elle est mise en contexte et en perspective avec une autre ou avec la connaissance que l’on a du domaine auquel elle se rapporte. Il ne faut donc pas se restreindre à l’information scientifique et technique pure, car on passerait à côté d’éléments contextuels et économiques importants.
Que dire de l’information proposée par un certain nombre d’éditeurs sur le web ? Par rapport aux supports ’classiques’ (les revues spécialisées par exemple), Internet permet d’accéder à autre chose, à une information plus vivante, plus dynamique ; il nous semble donc opportun de profiter de la rapidité que la technique nous offre. Les services de diffusion d’information thématique, qui sont certes d’origine journalistique, ont malgré tout le mérite d’être très rapides dans la diffusion de l’actualité, et couvrent relativement bien la plupart des domaines. Grâce à Internet l’information circule vite. Le seul piège à éviter est son éventuelle déformation ou mauvaise interprétation lorsqu’elle est reprise. Il est donc important d’identifier les sources les plus amonts et les plus fiables, tout en gardant un oeil critique. D’où l’importance d’une ’lecture’ et sélection préalable par l’expert, dans une phase de test.
Si nous essayons de créer une typologie des informations disponibles sur Internet, nous pouvons découper les sources, sans prétention d’exhaustivité, de la façon suivante [CARE99] :
les sites de news thématiques ou généralistes, qui proposent de l’information de type communiqués de presse souvent, ou d’articles journalistiques plus ou moins spécialisés.
les sites des entreprises, plus ou moins complets et à jour. Leur vocation est essentiellement commerciale et institutionnelle.
les sites de produits, qui correspondent à une marque, et entrent dans le cadre du e-business.
les sites officiels des organismes publics, où l’on trouve l’information sur la normalisation, les rapports de groupes de travail, les lois, etc.
les sites des associations et organisations qui apportent des compléments sur des projets, des techniques, etc. mais aussi des forums (ex. le Wapforum) ou des listes de liens utiles (ex Telecom Information Resources on the Internet).
les sites personnels où des individus mettent en ligne le fruit de leur travail (par exemple les publications des chercheurs) et leurs bibliographies. Cette information est plus informelle.
d’autres sites qui proposent des ressources et des outils de recherche et de traitement : ce sont les moteurs, les annuaires, les traducteurs automatiques, etc.
les sites où l’on trouve les listes de diffusion des éditeurs.
Dans chacun de ces types de sources, les sites peuvent être ou pas pertinents, seule l’expérience peut en valider le contenu, ainsi que des opération de recoupage avec d’autres sources, externes mais aussi internes.
On prendra donc avec une relative précaution les informations provenant de tel ou tel type de site, notamment commerciaux ou dont l’origine est plus ou moins certaine. Même les pages de news (communiqués de presse) des sites institutionnels proposent des informations plus ou moins ’embellies’ et subjectives qu’il faut savoir recouper avec d’autres sources plus critiques.
Pour le cadre concret dans lequel s’inscrit la réalisation de notre plate-forme, c’est-à-dire un centre de recherche et développement, notre démarche d’identification et de choix des sources a été la suivante :
d’abord une recherche tous azimuts par des interrogations ’classiques’ sur le web, ce qui nous a permis de voir émerger des sources plus importantes que d’autres, dans le sens où elles étaient toujours en tête de listes des résultats des moteurs, et qu’elles étaient elles-mêmes citées par d’autres sites.
d’autre part les sites des sources déjà connues et utilisées en interne sous d’autres formats (revues papier par exemple) ont été légitimement sélectionnés.
ensuite une étude auprès de chercheurs, notamment les correspondants du réseau d’intelligence technique et stratégique, nous a permis de récupérer des listes de sources appréciées et validées, et de comprendre quels types d’accès il préféraient, notamment par abonnement.
puis nous avons procédé pendant plusieurs mois à une phase de test en nous abonnant personnellement et en rediffusant régulièrement des brèves aux experts59. Ceci nous a permis de sélectionner les sources les plus fiables, dans le sens où les experts avaient souvent retenu les informations qui en provenaient.
Suite à cette phase de test, nous avons retenu des sources déjà utilisées par les experts ainsi que d’autres sources identifiées et testées afin d’y abonner la plate-forme (pour la partie ’Actualité’).
D’autre part, des sites de référence sur un domaine (c’est-à-dire pointés par de nombreux autres sites et proposant eux-même un bookmark complet ou des informations couvrant bien le sujet) ont été repérés60, après nous être assurés de leur pertinence auprès d’experts du domaine. Il s’agit essentiellement de sites institutionnels d’organismes tels que des équipementiers, des opérateurs ou d’autres acteurs du domaine. Parmi les critères de choix à retenir, il y a celui très important de la mise à jour (fraîcheur des informations) et de la pérennité des sites, mais aussi la pertinence et la compétence des auteurs61.
Il est important de repérer les sources fédératrices d’informations, pour ne pas perdre du temps avec une multitude de sites qui se recoupent sur un même thème.
Nous avons cité ici les choix d’intégration de sources externes pour la plate-forme. Il va de soi que nous avons laissé une place aux informations tacites et informelles. Comment ? En proposant aux utilisateurs d’intégrer ces dernières par le biais d’un formulaire spécifique, afin qu’elles soient listées avec les autres et simplement identifiées par une icône spécifique.
Nous avons expliqué dans le second chapitre le fonctionnement du réseau de correspondant : des messages s’échangent en permanence via une liste de discussion. C’est par ce biais que nous avons ’injecté’ régulièrement les informations en provenance des sources sélectionnées. Nous avons pu ensuite observer la façon dont les membres de la liste s’appropriaient ces brèves et y donnaient suite.
Pour l’outil de surveillance automatique décrit plus loin.
Pour plus de détails sur le choix des sources, voir le rapport de Cédric Caret ’Identification de sources dans le cadre d’une diffusion sélective de l’information’[CARE99], notamment la grille d’évaluation p. 18.