4.3.3. Modélisation des traces sous forme de graphes conformes à une ontologie

D'une manière très générale, un graphe se définit comme un ensemble d'éléments, appelés nœuds, dont certains couples sont reliés par des relations, appelées arcs. Le choix de modéliser la trace sous forme d'un graphe plutôt que sous forme d'un simple ensemble d'événements revient donc à décider si l'on choisit d'introduire cette notion de relation au niveau de la structure même des données telles qu'elles sont manipulées par le système informatique. Nous avons vu au paragraphe 4.2.2 qu'à notre connaissance, aucun outil d'analyse de trace d'activité n'avait fait ce choix. Dans ces outils, la structure informatique de la trace est toujours un tableau, contenant un événement par ligne et les propriétés des événements en colonnes.

En revanche, l'approche de modélisation de la trace issue de l'ingénierie des connaissances utilise naturellement cette forme. Cette représentation offre l'avantage que les relations entre concepts sont explicitement représentées dans les données par les arcs du graphe, et permettent de définir, dans le système, des traitements liés à ces relations. De plus, elle offre l'avantage que les données sont isomorphes à une représentation sous forme de nœuds et d'arcs "à l'écran", dans laquelle les relations sont rendues visibles pour l'utilisateur. Enfin, cette représentation est compatible avec les outils informatiques de manipulation des ontologies. Or nous avons vu que la prise en charge d'une ontologie était une attente importante pour faciliter la production de connaissances.

Par ailleurs, nous avons vu au paragraphe 3.4.2 que la possibilité de rendre explicite des relations entre événements était une des fonctionnalités attendues des systèmes d’ESDA. La possibilité de rattacher entre eux des niveaux d'abstraction différents est également une attente forte. Enfin, les outils de manipulation de graphe actuellement disponibles, permettent d'implémenter les différentes fonctions de transformation de Sanderson & Fisher que nous avons présentée.

Pour ces raisons nous avons fait le choix de modéliser nos traces d'activité sous forme d'un graphe explicable par une ontologie. Nous entendons par graphe explicable par une ontologie un graphe dont chaque nœud, ou chaque arc, peut être rattachés, ou non, à des concepts définis dans une ontologie. Ce rattachement, qui n'est pas obligatoire, offre la possibilité de profiter de la puissance inférentielle de l'ontologie. Cette modélisation est représentée à la Figure 46.

Figure 46 : Modélisation de la trace sous forme de graphe expliqué par une ontologie

Dans cette modélisation, la trace est un graphe qui se découpe en deux parties : une partie qui est la séquence d’observés et une partie qui est l’ontologie. Le terme "observé" désigne un événement élémentaire qui est enregistré dans la trace avec un time code. Les cercles représentent les observés qui sont produits par l'observation instrumentée de l'activité. En général cette instrumentation ne produit pas d'autres relations entre les observés collectés, que la relation de séquentialité : "suivi de" (au sens large, car des événements peuvent être synchrones). Mais d'autres relations peuvent être ajoutées pendant le processus d'analyse : les "relations d'analyse". Des "observés d'analyse" peuvent également être ajoutés dans la trace. Chaque observé a un type qui est défini dans l'ontologie. Le sommet de l'ontologie est constitué des types "objets de collecte" et de plusieurs types "objets d'analyse n". Ces derniers regroupent tous les types d’observés d'analyse créés pour une analyse donnée.

Cette racine de l'ontologie est plus générale que la racine de l'ontologie Musette. Elle n'interdit pas, pour une analyse donnée, de structurer les objets d'intérêt en une succession d'états et de transitions.