Les structures de connaissances : des objets structurés (graphes, schémas et scripts)

La différence la plus marquante entre les réseaux de connaissances tels qu’ils ont été décrits par Kintsch (1988, 1998) et les autres formes de représentation de connaissances que nous allons décrire maintenant (graphes conceptuels, schémas et scripts) est que ces dernières proposent une organisation en mémoire plus ordonnée, plus logique. Lorsque les psychologues et chercheurs de l’Intelligence Artificielle (IA) ont utilisé les schémas et les scripts comme unités de connaissance, ils les ont considérés comme des structures préexistantes en mémoire permanente, qui pouvaient être récupérées sur demande et être appliquées à une large variété de situations. Toutefois, sur le plan computationnel, les schémas et les scripts ont montré qu’ils étaient trop inflexibles pour servir les objectifs pour lesquels ils ont été initialement créés.

Les graphes conceptuels (Sowa, 1984) ont été développés afin de résoudre le problème qu’avaient les réseaux sémantiques (Collins & Quillian, 1969) à représenter les hiérarchies multiples, c’est-à-dire l’appartenance d’un même concept à deux classes différentes (appartenance multiple). Un graphe conceptuel est un graphe fini, connecté et bipartite. Les deux sortes de noeuds dans un graphe bipartite sont les concepts et les relations conceptuelles. Chaque relation conceptuelle possède un arc ou plus (une relation à n arcs est dite n-adique), chacun d’entre eux devant être nécessairement relié à un concept. L’avantage des graphes conceptuels est qu’ils permettent de formaliser la différence entre les concepts individuels (instances), les concepts génériques, et les classes (types). Les individus particuliers sont représentés par des marqueurs individuels (un nombre, un numéro ou un nom particulier). Si, en lieu et place du nombre ou du texte se trouve le marqueur ’*’, le concept est alors un concept générique. Le type est toujours indiqué en majuscule, associé soit à un marqueur individuel, soit à un marqueur générique. Les boîtes qui représentent une entité conceptuelle, sont divisées en deux champs, séparées par deux points. Dans le premier champ, se trouve le type, et dans le second, le marqueur :

  • Par exemple, la phrase “ Les persans sont des chats ” est représentée par : [PERSAN : {*}] (EST-UN) [CHAT], tout comme la phrase ’Choco, qui est un persan, est un chat’ est représentée par : [CHOCO : PERSAN] (EST-UN) [CHAT : {*}].

Ainsi, les graphes conceptuels sont censés générer des caractéristiques de représentation de connaissances telles que par exemple, l’abstraction, la généralisation, la construction de définitions, l’agrégation d’individus à un référent et de référents à un type.

Graesser et Clark (1985) ont utilisé la représentation en graphes conceptuels dans le but de modéliser le contenu et l’organisation de 51 structures de connaissances génériques. Le graphe conceptuel tel qu’il a été défini par ces auteurs consistait en une série de noeuds qui étaient répartis en 5 catégories - le but, l’issue, l’événement, l’état et le style - chacune de ces catégories pouvant référer à des informations physiques, sociales, internes ou cognitives. Chaque noeud était par ailleurs, évalué sur 5 dimensions : sa typicalité, sa nécessité, son importance et sa nature distinctive. Les noeuds étaient reliés par 8 catégories d’arcs - la raison, l’issue, le début, la manière, la conséquence, l’implication, la propriété et l’appartenance à une classe d’objets. Chaque noeud était affecté d’un score de centralité structurale qui déterminait le nombre d’arcs partant directement de ce dernier (soit en avant, soit en arrière). Un noeud avec beaucoup d’arcs était supposé avoir un statut différent de celui d’un noeud situé sur les bras morts du graphe et donc connecté à un seul autre noeud (Cf. Trabasso, Secco, & van den Broek, 1983 pour l’impact de la centralité structurale sur la mémorisation d’un texte). Le graphe conceptuel considéré dans sa globalité était donc caractérisé par : [1] sa cohésion centrale obtenue en faisant la moyenne des scores de centralité structurale de tous les noeuds du graphe, et [2] la proportion de noeuds et d’arcs dans les différentes catégories de noeuds et d’arcs considérées. Les auteurs ont ainsi postulé qu’un graphe en activité devrait contenir des proportions de noeuds-but et de noeuds-raison comparativement élevées. Enfin, Graesser et Clark (1985) ont catégorisé les graphes conceptuels en 5 grandes familles : [1] les structures d’animés qui incluent les individus et les animaux, [2] les structures concrètes qui sont constituées par les objets, les procédés mécaniques et les régions spatiales, [3] les structures abstraites qui incluent les états abstraits et les concepts, [4] les structures d’événements qui sont relatives aux mécanismes orientés causalement qui existent dans le monde physique ou dans l’esprit d’un être animé, et [5] les structures d’activités qui sont des systèmes orientés par les buts et qui sont exécutés de façon intentionnelle par des agents animés.

Les schémas (Bartlett, 1932) et les scripts (Schank & Abelson, 1977) sont des structures de connaissances prototypiques. Le schéma a pour rôle de représenter une situation particulière, c’est-à-dire un agencement particulier d’objets, alors que le script permet de décrire une séquence particulière d’événements, c’est-à-dire de changements de situation. Les schémas et les scripts sont des blocs de connaissances qui sont d’une part, insécables et récupérables en mémoire comme tels, et d’autre part, indépendants des autres connaissances. Ils peuvent ainsi s’appliquer à un certain nombre de situations concrètes différentes dans lesquelles se rencontrent les objets et les événements, et qui forment des contextes suffisamment fréquents pour être stabilisés en mémoire (Richard, 1990). Dans la compréhension d’un texte, les schémas et les scripts peuvent avoir trois fonctions : [1] affecter les éléments du texte à une place dans la structure, [2] inférer des informations manquantes, et [3] intégrer un certain nombre d’éléments d’information en une signification plus générale qui les résume. En effet, les schémas et les scripts ont un certain nombre de places vides ou variables qui sont destinées à être remplies par des informations spécifiques issues du texte (opération de particularisation). Par exemple, durant la lecture d’un texte technique sur la construction d’une maison, un schéma est activé qui propose une liste d’attributs structuraux et fonctionnels de l’objet ’maison’, tandis qu’un script est activé qui définit la séquence temporelle et causale standard des événements sous-tendant l’élaboration de l’objet. La compréhension de ce texte consiste alors en l’affectation de valeurs aux différents composants proposés. Une fois identifiés, les schémas et les scripts permettent également d’inférer des informations manquantes, car ils ont la capacité d’attribuer des valeurs aux propriétés qui n’ont pas été instanciées par le texte. Enfin, à partir des éléments ainsi spécifiés des schémas et des scripts, il est possible d’identifier une structure globale qui représente les relations entre ces éléments dans le texte (opération d’abstraction). Par exemple, les actions dans les scripts peuvent être remplacées par le but dont elles sont la réalisation en les interprétant comme des sous-buts. Les inférences qui peuvent être faites à partir des schémas et des scripts ont fait l’objet de nombreuses études expérimentales. Par exemple, Bower, Black et Turner (1979) ont montré, à l’aide d’une tâche de reconnaissance d’énoncés, que les sujets qui avaient lu un récit reconnaissaient à tort des événements typiques du script ne figurant pas dans le récit, et se déclaraient relativement sûrs de les avoir lus.

Outre le fait que ces objets structurés n’ont pas la flexibilité qui était prévue lors de leur conception par les chercheurs de l’IA, plusieurs autres remarques peuvent être faites à leur sujet. D’une part, leur application pose des problèmes empiriques, puisque le temps mis pour récupérer un événement particulier dans un script à partir d’un autre événement utilisé comme indice ne varie pas de façon proportionnelle à la distance sémantique entre ces deux événements. Par ailleurs, ils ne permettent que la description de la représentation occurrente (sémantique) du texte ; nous pouvons donc penser qu’ils sont moins adaptés pour rendre compte du modèle de situation. Enfin, ils ne sont utilisés généralement que pour représenter des structures génériques de connaissances.