b) Traiter l’information

La notion de traitement de l’information est très vaste. Lorsqu’on lit et qu’on classe un courrier, il y a déjà une opération de traitement qui s’effectue. Quand il s’agit de traiter un corpus assez dense d’informations collectées en amont, il s’agira de mettre en oeuvre des méthodes et des logiciels sophistiqués permettant d’obtenir plus d’information sur son contenu, de le trier intelligemment, le classer, l’analyser sous tel ou tel angle, le cartographier, etc. Nous avons évoqué plus haut quelques-uns de ces systèmes informatiques destinés notamment au traitement de corpus structurés (bibliométrie par exemple). L’évolution du web a nécessité une adaptation de ces fonctionnalités pour s’intéresser aux formats textuels qui s’y trouvent, notamment par des méthodes d’analyse syntaxique, ainsi qu’au traitement multilingue.

Les outils qui interviennent dans les phases de traitement sont en fait liés à la taille du corpus. Dans le cadre d’une veille organisée et récurrente sur des thématiques bien définies, et faisant appel à des collectes d’informations régulières, le corpus sera rapidement important et son traitement indispensable. Par contre un autre type de traitement sera appliqué à un flux continu d’informations qui ne sont pas forcément stockées en corpus, mais qui ont besoin d’être analysées à leur arrivée pour être envoyées par push à des utilisateurs par exemple.

L’objectif de l’étape de traitement est de faire émerger les connaissances principales contenues dans le corpus, qu’il soit structuré (les champs d’une base de données par exemple) ou non structuré (plein texte). Deux grandes techniques coexistent et se complémentent :

message URL SCHEM06.gif
Etapes du traitement bibliométrique avec Dataview(CRRM, université Marseille III)
message URL SCHEM07.gif
Exemple de carte produite avec Umap.Les ’îlots’ sont constitués des concepts clés des documents

Nous pourrions également inclure dans cette fonction de traitement de l’information la notion d’analyse. Certes, il s’agit d’une étape stratégique des plus importantes, où l’intervention humaine est absolument nécessaire. Cependant quelques outils peuvent servir de support à ce travail. Il s’agira surtout de mettre en forme les informations pour aider à la détection de signaux faibles, et matérialiser les liens qui les font correspondre. C’est le cas des outils proposés comme support à la création de puzzles.

message URL SCHEM08.gif
Exemple de puzzle produit automatiquement par vStrat (Digimind).Les liens reliant les informations ont une valeur soit de causalité, soit de contradiction, soit de confirmation.