L’algorithme Pathfinder (Schvaneveldt, Durso, & Dearholt, 1985)

L’algorithme Pathfinder permet de conceptualiser les données de proximité en un réseau complet de noeuds et de liens directs ou indirects entre ces noeuds - le réseau Datanet. Dans ce réseau, le poids de chaque lien est égal à la distance sémantique entre les entités ainsi reliées. Du fait de la densité des liens dans le réseau Datanet, celui-ci s’avère ne pas être très informatif. Aussi, il est transformé en un réseau Pathfinder selon la règle suivante : un lien dans le réseau Datanet est un lien dans le réseau Pathfinder, si et seulement si ce lien correspond au chemin le plus court entre deux concepts (Cf. figure 4). Un chemin consiste en une séquence de noeuds et de liens connecteurs.

message URL FIG04.gif
FIGURE 4. Une série de données de proximité hypothétiques et son réseau Pathfinder non-hiérarchique résultant. (Notez que les liens directs qui figurent dans le réseau sont ceux qui relient les éléments les plus étroitement associés.)

La longueur d’un chemin est fonction du poids affecté à chaque lien dans le chemin. Elle est calculée à partir du paramètre r (ou r-métric de Minkowski), dont l’application se base sur l’hypothèse selon laquelle les liens dans un chemin contribuent de façon indépendante au poids total du chemin. Les valeurs du paramètre r sont comprises entre 1 et ∞. Lorsque r = 1, tous les composants (les liens) dans un chemin contribuent de façon équivalente à la détermination du poids du chemin. En revanche, lorsque la valeur de r augmente, seuls les composants qui possèdent les poids les plus importants dans un chemin déterminent le poids total du chemin. Ainsi, lorsque r = ∞, la distance totale d’un chemin est équivalente à la distance maximale entre deux des noeuds du chemin (Schvaneveldt, Durso, & Dearholt, 1989). Par exemple, si la distance entre les noeuds A et B est égale à 3, et la distance entre les noeuds B et C est égale à 2, alors la longueur du chemin allant de A vers C en passant par B est égale à 3, car 3 est la distance maximale entre deux des noeuds du chemin. Schvaneveldt et ses collaborateurs (1989) conseillent ainsi d’affecter la valeur ∞ au paramètre r, afin d’obtenir une transformation du réseau Datanet qui préserve l’ordre des relations dans les chemins.

Le réseau Pathfinder est également déterminé par les valeurs du paramètre q. Le paramètre q impose une limite supérieure quant au nombre de liens dans un chemin. Deux raisons ont été évoquées pour justifier l’utilisation du paramètre q. D’une part, sur le plan psychologique, il est postulé que le nombre de liens connectant de façon significative des noeuds dans un domaine particulier serait limité en mémoire. D’autre part, dans le but d’améliorer l’aspect de la représentation en réseau, le paramètre q permet de contrôler de façon systématique la densité des liens. Les valeurs du paramètre q sont comprises entre 1 et n-1. Le réseau minimum (celui qui possède le plus petit nombre de liens) est dérivé à partir des valeurs ∞ pour r et n-1 pour q. Les liens dans ce réseau correspondent, pour la plupart, aux paires de concepts qui ont été évalués par les sujets comme étant étroitement associés.

Enfin, l’algorithme Pathfinder permet d’effectuer une mesure C (Goldsmith & Davenport, 1991), qui quantifie la similarité configurale entre deux réseaux Pathfinder ayant en commun une série de noeuds. Cette mesure étudie le degré avec lequel le même noeud dans les deux réseaux est entouré par un voisinage similaire de noeuds. Ainsi, la comparaison du voisinage est réalisée pour chaque noeud dans les deux réseaux, la moyenne de ces résultats étant utilisée pour calculer un indice total de similarité. Les valeurs de cet indice varient entre 0 (dans le cas de deux réseaux complémentaires) et 1 (dans le cas de deux réseaux identiques).