Sans reprendre les justifications des décisions prises à la suite de la première phase de travail et exprimées à la fin de la première partie, il nous faut entrer dans le détail de la constitution et de l’évolution de notre nouveau corpus au fil de la recherche.
Revenant à des considérations plus raisonnables compte tenu des moyens techniques et humains à notre disposition, nous avons fait le choix de sélectionner un nombre de sites de presse d’actualité générale moins important que précédemment. Nous avons aussi décidé d’opérer notre sélection à partir des pages « Kiosque en ligne » du site Web de l’hebdomadaire Courrier International 457 . Ces pages référencent des sites de presse du monde entier, donnant des informations à leur sujet : date de création, tendance politique des éditeurs, spécificités, importance de l’édition imprimée à l’origine du site, etc...
Ne souhaitant pas renoncer à la richesse d’un regard sur la production internationale de la presse en ligne, nous nous sommes laissée guider par les commentaires de Courrier International. Le nombre de sites présents sur leur liste étant considérable, nous avons fait appel à nos propres connaissances et sélectionnés un peu moins d’une soixantaine de sites au total après avoir procédé aux vérifications de rigueur concernant la validité des adresses notamment. Il s’entend bien sûr, que tous les sites sélectionnés devaient satisfaire aux exigences initiales de la recherche : être lié à un quotidien imprimé d’actualité générale et présenter de l’information renouvelée au moins quotidiennement458.
Tous les continents, à l’exception de l’Océanie sont représentés (le nombre de sites repérés par Courrier International était faible et aucun site n’a réellement retenu notre attention). L’Europe et tout particulièrement la France sont sur-représentées. Ceci est dû au grand nombre de pays de ce continent et à la quantité de sites référencés par notre « liste-source »... La sur-représentation proportionnelle de la France est voulue car, malgré notre curiosité qui nous pousse à regarder ce qui se fait dans le monde, il demeure que la production française, mieux connue, plus accessible, a tout naturellement été privilégiée.
Ci-après la liste des journaux retenus au mois d’avril 2000.
| Canada | 1 | The Globe and Mail | Suède | 31 | Dagens Nyheter | |
| 2 | Le Soleil | Suisse | 32 | Tages Anzeiger | ||
| États-Unis | 3 | The Boston Globe | 33 | Le Temps | ||
| 4 | Chicago Tribune | 34 | La Tribune de Genève | |||
| 5 | The Miami Herald | 35 | Neue Zürcher Zeitung | |||
| 6 | Newsday | Chine | 36 | China daily | ||
| 7 | The New York Daily News | 37 | South China Morning Post | |||
| 8 | The New York Times | Inde | 38 | The Indian Express | ||
| 9 | San Francisco Chronicle | Chili | 39 | La Tercera | ||
| 10 | San Jose Mercury News | Liban | 40 | The Daily Star | ||
| 11 | USA Today | Afrique du Sud | 41 | Die Burger | ||
| 12 | The Washington Post | Israël | 42 | The Jerusalem Post | ||
| Allemagne | 13 | Süddeutsche Zeitung | Autorité Palestinienne | 43 | Al Qods | |
| 14 | Die Welt | Algérie | 44 | El Khabar | ||
| Belgique | 15 | Le Soir | 45 | Liberté | ||
| 16 | De Standaard | France | 46 | Libération | ||
| Danemark | 17 | Berlingske Tidende | 47 | Le Monde | ||
| Espagne | 18 | ABC | 48 | Le Progrès | ||
| 19 | El Mundo | 49 | Ouest-France | |||
| 20 | El Paí s | 50 | La Dépêche du Midi | |||
| Irlande | 21 | Irish Independent | 51 | La Provence | ||
| 22 | The Irish Times | 52 | La Voix du Nord | |||
| Italie | 23 | Corriere della Sera | 53 | Le Parisien | ||
| 24 | Il Messaggero | 54 | Le Républicain Lorrain | |||
| 25 | La Stampa | 55 | L’Humanité | |||
| Norvège | 26 | Aftenposten | Argentine | 56 | Clarí n | |
| Pays-Bas | 27 | NRC Handelsblad | Côte d’Ivoire | 57 | Fraternité Matin | |
| Royaume-Uni | 28 | The Daily Telegraph | Kenya | 58 | Daily Nation | |
| 29 | The Guardian | Tunisie | 59 | La Presse de Tunisie | ||
| 30 | The Times |
La numérotation qui précède chaque titre correspond à l’ordre d’enregistrement de ces sites. (Le relatif désordre en fin de liste est lié aux difficultés de connexion sur certains sites). Renonçant à automatiser l’enregistrement du corpus, nous avons choisi d’exploiter les progrès réalisés par les logiciels de navigation en la matière, et de procéder manuellement, de façon systématique à l’enregistrement des pages nécessaires pour notre étude.
Compte tenu du nombre de liens et donc de fichiers attachés aux pages d’accueil, nous avons rapidement écarté l’idée d’un enregistrement intégral des sites du corpus. Nous avons sollicité certains éditeurs espérant qu’ils auraient, sur CD-Rom, une copie de leur site. Ma demande auprès du service du Progrès de Lyon a été entendue mais il ne m’a été fourni qu’une copie de tous les fichiers présents sur le site à une certaine date sans que ceux-ci ne soient mis en page. D’autres chercheurs qui travaillent sur ce sujet m’ont confirmé l’absence d’archives exploitables... Nous avons donc fait le choix de n’enregistrer que les pages dont l’étude doit permettre de répondre à nos hypothèses de départ.
En premier lieu, ont été enregistrées toutes les pages d’accueil des sites du corpus. Pour permettre notamment l’étude du renouvellement de l’information sur ces pages, elles ont toutes été enregistrées le même jour, soit précisément le 10 avril 2000, et la même opération fut réalisée le lendemain, soit le 11 avril 2000. Sur quelques titres, il a été procédé à l’enregistrement systématique des pages annoncées par des liens hypertextes sur la page d’accueil, permettant ainsi de disposer des niveaux un et deux de l’arborescence. Toujours pour étudier le renouvellement de l’information, certaines des pages du niveau deux ont été enregistrées à nouveau le lendemain.
Concernant des points d’analyse plus spécifiques, comme l’accès aux archives ou les différents moyens proposés à l’internaute pour se repérer dans le site, d’autres enregistrements ont été réalisés à divers moments, de façon non systématique, pour leur capacité à illustrer le travail d’analyse.
Malgré tous nos efforts, l’enregistrement de certaines pages d’accueil ne nous a pas donné entière satisfaction, fait que nous n’avons découvert qu’au moment de travailler sur ces documents. Nous n’avons pas voulu procéder alors, à de nouveaux enregistrements pour ne pas introduire de différences de traitement entre les sites du corpus. En effet, les changements sont fréquents dans la presse en ligne et le travail de recherche exige que l’on fixe, même artificiellement, ce qui ne cesse de bouger. En mai 2000 par exemple, peu après la constitution de notre corpus (avril 2000), nous avons noté les changements de nom et de maquette du site du Monde. À l’heure où nous écrivons ces lignes, ces paramètres ont, à nouveau, été radicalement modifiés. Pour que notre analyse ait une valeur scientifique, même si nous savons que nos résultats sont à inscrire dans un moment de la courte histoire de la presse en ligne, il fallait comparer nos documents sur la base d’un minimum de règles stables (mode et date d’enregistrement et nature des documents devaient être communs à tous). C’est pourquoi nous avons préféré ne pas répéter la fastidieuse opération de constitution de notre corpus au risque d’être confrontée, à nouveau, à des problèmes sur lesquels nous n’avons aucun moyen d’action. Pour toutes ces raisons, certains sites, au nombre de huit au total, ont été rapidement écartés sauf pour l’observation des noms et de leur traitement graphique (les en-têtes des documents s’affichent parfois alors que l’enregistrement de la page est incomplet et nous disposons d’impressions à partir desquelles il est possible de travailler). En voici rapidement la liste accompagnée des explications qui justifient leur mise à l’écart.
Le Soir (Belgique, PQN) : La page d’accueil se présente de façon très originale avec des informations tournantes du type diaporama. Malgré l’enregistrement de la page d’accueil, le travail sur archives est impossible car la connexion se fait automatiquement sur le réseau appelant ainsi la page actualisée et non la page enregistrée.
Berlingske Tidende (Danemark, PQN) : L’enregistrement réalisé s’avère incomplet : la page d’accueil présente des informations tournantes, le travail sur archives est donc rendu impossible.
Corriere della Sera (Italie, PQN) : Le site est construit sur une partition de la page, invisible à l’écran, appelée « frames ». Mais, au niveau de nos fichiers,seul un de ces cadres a été enregistré par le logiciel.
The Times (Grande-Bretagne, PQN) : Même problème que précédemment :le site est construit sur une partition d’écran. Seul un des cadres a été enregistré par le logiciel.
La Dépêche du Midi (France, PQR) : La consultation de l’enregistrement du site s’est révélée impossible : le fichier refuse de s’ouvrir et introduit une erreur systématique dans le logiciel qui oblige même à redémarrer l’ordinateur... Le fait s’est produit sur les deux enregistrements (J et J+1).
L’Humanité (France, PQN) : La page d’accueil ne propose aucune actualité ; elle est donc, complètement figée. Le niveau suivant se présente de la même façon. Puis au niveau trois, on découvre enfin le journal du jour, construit sur la base de ces fameux « frames » ce qui ne permet pas d’obtenir un enregistrement satisfaisant de la page.
Le Républicain Lorrain (France, PQR) : La page d’accueil du site ne présente aucune information d’actualité. Construite sous la forme d’une mosaïque, elle ne peut être observée avec les critères que nous avons choisi pour l’étude de la mise en page des autres pages d’accueil du corpus... Ce site sera donc mentionné du fait de sa singularité mais ne peut être intégré à notre étude concernant la construction générale de la page, répartition des liens etc. Quand on accède au niveau suivant de l’arborescence pour découvrir l’offre du journal, une fois encore, la page construite sur des partitions d’écrans interdit tout enregistrement sur lequel nous pourrions travailler par la suite.
La Presse (Tunisie, PQN) : Ce site présente tout d’abord une page d’accueil sans actualité, complètement figée. Puis l’accès au journal ne se fait qu’au format PDF. Il s’agit uniquement des pages du quotidien imprimé, reproduites à l’identique, véritable photographie grandeur nature de la Une, proposée en lecture sur écran, sans aucune interactivité, sans aucun effort particulier de mise en forme. Aucune différence donc entre la version papier et ce que l’on découvre sur écran sauf que l’écran apparaît particulièrement inadapté à la consultation d’un document au format tabloïd...
D’autres enregistrements ne répondront pas à nos attentes, sur certaines questions précises. Nous les écarterons de façon ponctuelle et justifierons alors notre décision. De la même façon, nous expliciterons nos choix de méthodes avant de procéder à l’analyse de chacun des thèmes de cette troisième partie.
L’adresse du site de Courrier International est la suivante :
http://www.courrierinternational.com/actual/accueil.asp , celle des pages “Kiosque en ligne” :
http://www.courrierinternational.com/kiosk/kiosq.htm . Dernière consultation le 15 août 2001.
La liste des journaux du corpus et les commentaires de Courrier International à leur sujet, à l’époque de la sélection, sont présentés en annexe 10.