1.1.1 Objectifs, types et propriétés de représentations graphiques

Bertin et Tufte sont les pionniers des méthodes de visualisation de données et d’informations [Bertin, 1967], [Bertin, 1977], [Tufte, 1993] et [Tufte, 1990]. Dans leurs travaux ils prônent l’utilisation de règles générales de disposition de données. Plus précisément, [Bertin, 1977] présente une classification des propriétés susceptibles d’être perçues dans une représentation graphique de données :

  • l’association qui est représentée par la taille, la brillance, la texture, la couleur, l’orientation, la forme,
  • la sélection, représentée par la taille, la brillance, la texture, la couleur et l’orientation,
  • le classement, représenté par la taille, la brillance et la texture,
  • la mesure quantitative représentée par la taille.

Selon l’auteur, la couleur dans un objet graphique est utilisée pour le codage de diverses catégories et pour la segmentation. Il recommande à cet effet l’utilisation de couleurs précises : le vert, l’orange, le bleu clair, le cyan, le magenta et un maximum de 10 à 15 couleurs par graphique.

Selon [Keim, 1996], les méthodes de visualisation de données peuvent être classées en 3 catégories selon leurs buts : l’exploration des données, la confirmation des hypothèses et la présentation des données/résultats.

Pour l’exploration des données : on suppose que l’utilisateur n’a pas de connaissance à priori sur les données. De manière interactive, il aboutit à des hypothèses sur les données comme résultat de l’exploration. Durant cette étape d’exploration des données, la mémoire de l’utilisateur est stimulée, il progresse dans sa compréhension des données (relations entre données, outliers, proximité, etc…). A cet effet, les relations entre les données doivent être compréhensibles et une information contextuelle doit être fournie à l’utilisateur.

En ce qui concerne la confirmation d’hypothèses sur les données, au début des traitements, l’utilisateur a une hypothèse sur les données. La représentation graphique de ces données lui permet de confirmer ou d’infirmer cette hypothèse.

Pour la présentation des données/résultats, il s’agit de pouvoir communiquer des données ou des résultats de traitements de manière claire et succincte aux utilisateurs. Comme souligné précédemment, la visualisation de données permet de présenter une grande quantité d’information aux utilisateurs, elle permet aussi de communiquer des modèles mentaux présentant des idées abstraites [Oudshoorn et al., 1996].

La visualisation d’informations peut être métaphorique ou idiomatique. Dans une représentation métaphorique, les données sont présentées par l’intermédiaire d’objets du monde réel. En ce qui concerne la représentation idiomatique, les objets proposés par ce type de représentation graphique ne sont pas forcément issus du monde réel.

Il existe des méthodes de visualisation génériques, qui peuvent servir à la représentation de tout type de données après une phase initiale de prétraitement. Dans cette catégorie de méthodes, nous pouvons citer les matrices 2D et 3D [Chambers et al, 1983], les coordonnées parallèles [Inselberg, 1985] et [Inselberg, 1998], les bar-charts [Keim, 1999] et les survey plot [Rao et Card, 1994], [Lohninger, 1994].

En effet, les données représentées graphiquement peuvent être de natures différentes : numériques, symboliques, discrètes, continues, relations entre données, variations des données.

Après avoir représenté graphiquement les données ou les informations, il est possible de procéder à divers traitements sur ces données à travers des interactions homme machine. La section suivante fera le point sur les différentes tâches de la visualisation d’informations.