I. Précisions méthodologiques

Pour procéder à l’établissement de notre « état des lieux » préalable à la recherche, nous nous sommes mis en quête d’une source la plus complète possible d’adresses de journaux d’information sur le Web. Début 1998, période à laquelle nous avons engagé cette phase de notre travail, plusieurs sites proposaient des sortes d’annuaires des médias sur l’Internet. Mais ce type d’information semblait annexe par rapport à d’autres rubriques, plus riches en actualité comme les revues de presse ou les annonces de manifestations professionnelles par exemple (salons, conférences, remises de récompenses, etc.). Par ailleurs, la plupart des sites ne permettaient pas de connaître les URL314 des journaux, conséquence d’un usage stratégique des frames ou cadres : dans ce cas, on vous offre de consulter les sites répertoriés mais ceux-ci ne sont visibles qu’au travers de la fenêtre ouverte par le site de départ. Le fait de tenir ainsi l’internaute captif se retrouve de façon concrète dans les statistiques de connexions : l’augmentation du temps moyen de consultation trouve son parallèle en matière de coût d’insertion publicitaire. Autre problème fréquent, ce type d’annuaire tente généralement de proposer un descriptif des URL référencées, ce qui a pour conséquence d’alourdir le site315, de créer des pages supplémentaires ce qui ralentit la consultation et pose le problème des inégalités de traitement entre les informations provenant d’un petit nombre de pays occidentaux et le reste du monde, moins nanti. Après maintes recherches exploratoires, nous avons enfin découvert un site actualisé quasiment quotidiennement, présenté de façon sobre et claire, sans commentaire ni publicité316. Ce site nous a semblé constituer un bon point de départ pour notre travail d’investigation même si nous devons émettre une réserve majeure. Nous regrettons en effet, n’être jamais parvenue à entrer en contact avec le gestionnaire du site, celui-ci n’ayant jamais répondu à nos courriers électroniques (seul moyen proposé pour le contacter). Par conséquent, nous n’avons jamais pu obtenir de précisions concernant la mission assignée à ce site, à ces modalités de fonctionnement (obtention et traitement des informations, sélection éventuelle, mises à jour, etc.).

Dans un second temps, nous avons cherché une solution technique pour enregistrer les longues listes de sites référencés de façon à pouvoir engager une procédure de connexion et de sauvegarde automatiques de l’ensemble des pages d’accueil référencées. Après quelques manipulations techniques auxquelles nous nous sommes initiée (récupération des codes sources, configuration de nouvelles pages HTML ad hoc puis téléchargement des listes sur le Web) et avec l’aide d’un logiciel « aspirateur » de sites compatible avec notre équipement informatique317 nous avons tenté d’enregistrer, entre les mois de mars et de mai 1998, 3506 pages correspondant à la totalité des adresses référencées en janvier de cette même année, adresses réparties dans 161 pays ou territoires318.

Devant la quantité impressionnante de sites à enregistrer, nous avons fait le choix de ne considérer que la page d’accueil de ces journaux. Celle-ci, tout comme la Une d’un journal imprimé se trouve être particulièrement riche en informations. Vitrine du journal, elle doit être attractive et claire. Elle nous renseigne sur le contenu proposé, et c’est souvent la page la plus soignée en matière de mise en forme.

A partir de ces 3506 pages nous avons effectué un important travail de sélection 319. Nous n’avons jamais eu l’intention de prétendre à une quelconque exhaustivité, illusoire au demeurant. Nous souhaitions simplement, de façon empirique, nous « faire une idée », établir par nous-mêmes une connaissance minimum de notre objet d’étude, à partir de laquelle nous pourrions progresser.

  • Nous avons écarté tous les journaux dont l’enregistrement s’est avéré insatisfaisant c’est-à-dire souvent partiel, essentiellement du fait de la lenteur des connexions, elle-même liée à de multiple facteurs dont le principal demeure la faiblesse des équipements : infrastructures de télécommunication obsolètes, débit sur la bande passante trop faible, pages trop lourdes en images, etc.... C’est la première cause de rejet : en effet plus des deux tiers des sites enregistrés ne l’ont pas été de façon satisfaisante et ce, malgré de multiples tentatives. Cela représente 2073 sites précisément, soit 69 pour cent du nombre total de sites éliminés.

  • Sur les sites restants, le premier critère de sélection a été la pertinence pour notre étude : nous avons conservé les sites qui, dès le niveau de la page d’accueil proposent de l’information d’actualité générale renouvelée au moins quotidiennement. 777 sites ont encore été éliminés parce que ne proposant pas d’actualité quotidienne, soit près de 26% des sites éliminés. Sur les sites qui ont réchappé à l’hécatombe, 76 proposant une information spécialisée ont été écartés.

  • Enfin, certains journaux nous sont demeurés inaccessibles, du fait des compétences linguistiques qu’ils requièrent et que nous ne possédons pas. Fort peu de journaux correctement enregistrés ont été écartés pour cette raison. Nous avons pu étudier les journaux en langue anglaise, germanique et latine. Le repérage de la date et d’autres indicateurs de temporalité ont pu se faire dans toutes les langues à condition que l’alphabet ait été téléchargé convenablement.

Compte tenu du volume de documents à consulter nous avons écarté les journaux dès qu’un des critères de sélection pouvait s’appliquer. Dans ce travail d’élimination méthodique, nous avons confronté nos enregistrements aux critères précédemment énoncés, dans l’ordre de présentation qui en a été fait : qualité de l’enregistrement en premier lieu, actualisation quotidienne des informations en second lieu, puis information générale, puis compétences linguistiques. Par conséquent, nous avons conscience du fait qu’il nous est impossible de tirer certaines conclusions. En effet, nous ne pouvons donner un pourcentage précis de journaux pour lesquels le renouvellement de l’information ne se fait pas selon une périodicité quotidienne car nombre d’entre eux ont été éliminés du fait de la mauvaise qualité de l’enregistrement.

Nous avons ainsi constitué un corpus de 485 journaux (ce qui représente 13,8% du volume de documents initial) répartis pour près de la moitié en Amérique du Nord (42%), pour un petit tiers en Europe (33%) et le reste soit un quart environ dans le reste du monde (25).

Notes
314.

URL : Uniform Ressource Locator ; correspond aux adresses des documents sur le World Wide Web, soit toutes les adresses du type http://www...

315.

On qualifie de “lourds” des fichiers informatiques dont le nombre de kilo-octets est tellement important qu’il finit par poser des problèmes techniques (comme une extrême lenteur à l’affichage) problèmes liés à des questions d’insuffisance de mémoire vive de l’ordinateur ou de lenteur des taux de transfert dans le cas de connexion en réseau.

316.

http://www.esperanto.se/kiosk/engindex.html

317.

WebWhacker 2.0, logiciel qui permet d’enregistrer des sites complets mais dont le fonctionnement à la fois complexe et instable a généré d’importants contretemps. Nous ne disposions pas d’autre outil ; son usage nous a d’ailleurs conforté dans l’idée que la technique de l’informatique en réseau n’est pas fiable...

318.

Certains découpages ne correspondent pas à des nations mais à des zones géographiques rattachées à des pays comme par exemple le Sahara Occidental qui propose un site : L’écho du Polisario ! La liste complète des journaux du corpus par pays et par continent, un tableau récapitulatif et un graphique sur la répartition des journaux dans les différents continents se trouvent en annexe 4.

319.

Les tableaux, grilles d’observations et comptes précis sont en annexe 5.