Technique d’Ahumada

La technique de classification d’image a été d’abord utilisée dans le domaine de l’audition . Elle a été appliquée récemment à la vision (Ahumada, 1996; Thomas & Knoblauch, 1998). Le principe de cette technique est le suivant. Au cours d’une expérience, on présente aléatoirement à l’observateur soit un bruit seul, soit un signal de faible intensité additionné au bruit. A noter que dans le domaine de la vision, le bruit est une variation aléatoire des caractéristiques du signal. La tâche de l’observateur est de détecter le signal (présent/absent) ou de discriminer entre plusieurs signaux. Quatre types de réponses sont possibles : une détection correcte (DC), une fausse alarme (FA), une omission (O) ou un rejet correct (RC) (cf. chapitre 1 de la partie III).

Le stimulus étant hautement bruité, il est supposé que la probabilité de répondre ‘présent’ est plus importante lorsque les indices visuels présents dans le bruit correspondent à ceux utilisés par l’observateur afin de traiter le signal. Pour analyser ces indices, il est nécessaire de trier les différents bruits aléatoires utilisés dans les différents essais selon la réponse de l’observateur.

En se basant sur la technique de la moyenne du signal, Ahumada a développé une méthode pour étudier le prototype utilisé par l’observateur dans la prise de ses décisions à propos de la présence ou de l’absence du signal. Les moyennes des bruits présentés aux essais ayant engendré les deux réponses ‘présent’ (i.e., DC et FA), contiennent les indices visuels du bruit qui sont corrélés avec la stratégie de classification d’image utilisée par l’observateur. Les moyennes des bruits qui ont entraîné la réponse ‘absent’ (i.e., CR et O) constitueront la partie anti-corrélée. En soustrayant la partie anti-corrélée à la partie corrélée, on obtient l’image utilisée par l’observateur pour décider de la présence de l’image. C’est l’image de classification perceptive, révélatrice de la façon dont l’observateur a pondéré ou classifié les informations du stimulus pour prendre sa décision. En effet, il s’agit d’une estimation du prototype en mémoire auquel l’observateur apparie le stimulus pour prendre sa décision.

Figure 25. Schématisation de l’émergence d’une gaussienne présentée dans un bruit. Le premier panneau est le résultat d’un seul essai, le deuxième résulte de 10 essais. Le pas du nombre d’essais d’un panneau à l’autre change par un facteur de 10. Le dernier panneau est le résultat de 100.000 essais. Les échelles des axes des ordonnées changent d’un panneau à l’autre.

La logique utilisée par Ahumamda est la suivante. Lorsqu’un signal fixe, même s’il est très léger, est dissimulé dans un bruit aléatoire, après plusieurs essais, la moyenne du bruit va tendre vers zéro et permettra au signal d’émerger.

Cette logique est expliquée dans la figure 25 où une gaussienne de faible amplitude (10 %) est additionnée à un bruit uniforme qui varie entre –1 et +1. La formule qui a engendré la gaussienne est la suivante :

f(x)= 0.1 * exp(-0.5 * x²) ; (7)

f(x) est la courbe gaussienne, x est une valeur allant de –5 à +5. Cette courbe a été calculée de la manière suivante. Du premier au dernier panneau, les courbes sont les moyennes de 1, 10, 100, 1000, 10.000 et 100.0000 essais (cf. Figure 25). L’augmentation du nombre de répétitions provoque une baisse systématique du bruit et laisse apparaître une gaussienne.

Cette logique est issue de la théorie du traitement du signal qui suppose que lors des enregistrements physiologiques, le signal est dissimulé dans un bruit. Si l’enregistrement est répété un grand nombre de fois, alors le bruit va tendre vers zéro et le signal physiologique émergera systématiquement.

De la même manière, l’observateur, qui connaît la forme du signal, classe l’image en la comparant à un prototype qu’il a en mémoire. Ahumada suppose que les indices utilisés par l’observateur pour juger le signal comme présent (FA et DC) ont quelque chose de systématique qui ressortira après un grand nombre d’essais. Tout comme la gaussienne qui se dessine de mieux en mieux en fonction du nombre d’essais exécutés (cf. figure 25).

Afin de décider si le signal est présent ou absent, l’observateur se fie à la ressemblance entre le stimulus et son propre prototype (ou le schéma de la forme du stimulus). Ceci peut être modélisé par une corrélation. Si P est le prototype stocké dans la mémoire de l’observateur et S est le stimulus, alors lorsque le produit scalaire 11 P * S est supérieur à un niveau critère, l’observateur répond que le signal est présent. Si ce produit scalaire est inférieur au critère, alors l’observateur répond que le signal est absent.

Notes
11.

Le produit scalaire est la somme des produits point par point. Considérons deux vecteurs: A et B. A=[a1 a2 a3] le vecteur B = [b1 b2 b3]. Le produit scalaire = (a1*b1) + (a2*b2)+(a3*b3).