4.2.3. La visualisation de données séquentielles

Pour illustrer une activité temporelle, la projection dynamique d’une séquence filmée et commentée, est souvent la méthode la plus efficace. Ces projections offrent des possibilités de compréhension globale de l'activité souvent déterminantes. Cependant, elles n'offrent pas de moyen d'appréhender simultanément différents aspects de l'activité, ni le détail de son évolution chronologique. De plus, elles ne permettent pas de construire une argumentation logique de l'analyse. Pour ces raisons, les représentations statiques sont encore indispensables.

Les descriptions statiques de la chronologie de l'activité se répartissent en deux types : (a) les graphes d’activité qui sont des représentations graphiques du déroulement temporel des variables observées ; (b) les descriptions narratives qui décrivent les actions dans le langage courant . Cependant, presque toujours, les descriptions empruntent plus ou moins à ces deux extrêmes : un graphe d’activité gagne à être accompagné de commentaires replaçant les comportements élémentaires dans un contexte plus significatif, tout comme une description plus narrative doit s’assurer de quelques repères systématiques de lieu et de temps.

Chaque outil d'analyse de l'activité a développé son propre mode de visualisation. Hilbert & Redmiles en donnent une revue assez complète. Le mode de visualisation le plus classique est donné par les diagrammes de type "Gantt" (du nom de l'ingénieur qui l'imagina en 1917). Il consiste à représenter des intervalles temporels par des bandes horizontales réparties sur des lignes dont chacune correspond à un poste, une tâche, une ressource, etc. Ce type de représentation est montré Figure 40 telles qu'elle est réalisée par le logiciel Kronos .

Figure 40 : Visualisation d’activité sous Kronos
Figure 40 : Visualisation d’activité sous Kronos

D'autres modes de visualisation ont été développés pour permettre la reconnaissance par l'analyste de motifs construits par des méthodes statistiques. Magnusson en propose un exemple représentatif que nous présentons à la Figure 41.

Figure 41 : T-pattern, (Rasmussen 2000)

Son système effectue un regroupement d'événements, en fonction de leur probabilité de co-occurrence, et selon des critères paramétrables par l'utilisateur. Par regroupements successifs, des motifs complexes sont identifiés, en autorisant une certaine variabilité également paramétrable par l'utilisateur. Finalement, les motifs obtenus sont visualisés afin que l'utilisateur puisse découvrir les patterns intéressants parmi tous ceux qui ont été détectés par les algorithmes statistiques.

Enfin signalons le projet Simile-Timeline 1 . C'est un projet de développement d'un outil informatique libre de visualisation de données temporelles qui est annoncé par ses concepteurs comme l'équivalent de ce qu'est GoogleMaps pour la visualisation des données géographiques. Sa fluidité d'utilisation et sa simplicité d'interfaçage par fichier XML en fait un outil remarquable dans le domaine.

Figure 42 : Simile TimeLine
Figure 42 : Simile TimeLine

Au Liris, propose une étude pour la visualisation graphique des traces. En terme de recommandation générale, il cite la théorie de la graphique qui identifie 8 variables de l’image visuelle pour transcrire le sens que contient des données : les positions en abscisses et en ordonnées, la taille, la valeur, la couleur, le grain, l’orientation et la forme. Il note que ces variables n'ont pas toutes la même capacité à représenter certains aspects des données, par exemple, la position selon un axe retranscrit bien l’ordre des données, ce qui n’est pas le cas de la couleur ; la taille retranscrit bien la quantité, mais pas la forme, etc. Les travaux de Lohse, Biolsi, Walkers & Rueter dénombrent les différents types de présentations visuelles possibles : les graphes, les tables et tables graphiques, les graphiques temporels, les réseaux, les diagrammes de structure, les diagrammes de processus, les cartes, les cartogrammes, les icônes et les images. Il note que les représentations adaptées à la mise en évidence de relations entre symboles sont les représentations en réseau, mais qu'elles sont globalement jugées difficiles à comprendre. Novick & Hurley ont effectué des travaux de comparaison de trois structures graphiques différentes : les matrices, les graphes hiérarchiques et les réseaux (graphes non structurés). Selon eux, une relation de type matrice est à privilégier pour offrir à l’utilisateur une perception facile de la présence ou de l’absence d’une relation entre deux variables. Les graphes hiérarchiques mettent en évidence la structure globale des données alors que les réseaux sont performants pour présenter des structures de données faiblement contraintes.

Nous aurons recours à ces différents modes de visualisation. Ces travaux nous montrent que les graphes hiérarchiques sont appropriés à la visualisation des ontologies, et que les réseaux sont appropriés à la visualisation de nos traces, en raison de leur nature relativement faiblement contraintes. Toutefois, ces travaux attirent notre attention sur le fait que les représentations en réseau sont délicates à lire et appellent donc la mise en œuvre d’outils appropriés pour faciliter cette lecture.

Notes
1.

Simile-Timeline : Semantic Interoperability of Metadata and Information in unLike Environments http://simile.mit.edu/timeline/