Le modèle sériel

Levelt et Roelofs (Levelt & al, 1991, 1999 ; Roelofs, 1997) ont proposé un modèle couvrant les différentes étapes allant de la sélection lexicale à l'accès aux syllabes appelé WEAVER++ pour Word-form Encoding by Activation and VERification. La partie se rapportant plus spécifiquement à l'encodage de la forme du mot est quant à elle nommée WEAVER (illustré en figure 2). Ce réseau cognitif distingue trois niveaux de représentations : la préparation conceptuelle, l'extraction du lemme et l'encodage de la forme du mot (ou lexème), qui lui-même est subdivisé en traitement morphologique, phonologique et phonétique.

Prenons un exemple afin d’illustrer notre propos : soit une tâche de dénomination lors de laquelle les locuteurs doivent donner la représentation lexicale liée au dessin d’un objet présenté sur un écran. L’image d’un cheval, va au cours du premier stade de traitement, activer un ensemble de concepts liés à l’item cible et représentant sa signification, tel que ‘équidé’, ‘cheval’ ou ‘animal’. Chaque concept est connecté à un unique lemme mis en mémoire dans le lexique mental. Les différents concepts activés vont donc eux-mêmes activer les représentations lexicales correspondantes lors de la deuxième étape du traitement. La présence d'un ensemble de lemmes possibles va avoir pour conséquence la mise en place d'un mécanisme permettant de sélectionner l'item cible parmi le choix des représentations lexicales proposées. Pour cette raison, un processus de compétition va prendre place, la sélection d’un unique lemme parmi la cohorte des items lexicaux se basant sur le degré d'activation de chacun d'entre eux. Une fois sélectionné, ses propriétés syntaxiques vont être disponibles, et il va servir d’entrée au mécanisme d’encodage phonologique où la forme appropriée du mot va être activée. L'activation des propriétés phonologiques va se retrouver restreinte à celle de la représentation précédemment sélectionnée. De plus, ce processus d'encodage de la forme du mot ne va débuter qu'une fois la sélection lexicale achevée. La temporalité des événements est donc strictement sérielle et les différents mécanismes impliqués n'interagissent pas les uns avec les autres.

Figure 2
Figure 2 : Modèle sériel WEAVER issu de Levelt et al (1999).

Pour appui de la sérialité des événements cognitifs énoncés dans leur modèle, Levelt et Roelofs se sont servis des résultats obtenus par Schriefers et al (1990) avec un paradigme d'interférence mot-image chez des locuteurs de langue maternelle hollandaise. Nous avons vu précédemment qu’un mot amorce présenté en surimpression sur une image influençait le temps nécessaire à la dénomination, cette variation étant fonction de la nature des indices véhiculés par l'amorce (e.g. phonologiques, syntaxiques, etc.). Selon cette hypothèse, le modèle sériel prédit que la présentation auditive d'une amorce reliée phonologiquement à la cible induit une accélération du temps nécessaire pour nommer correctement le mot. Dans leur étude Schriefers et al ont utilisé des paires de mots véhiculant soit le même début, soit la même fin, soit des mots n'ayant aucune similarité phonologique. Les distracteurs étaient présentés avant (SOA de -300 ou -150ms), en même temps (SOA de 0ms), ou après le mots cible (SOA de 150ms). Lorsque le distracteur sémantique était présenté avant la cible, un effet de facilitation émergeait, tandis qu’un distracteur phonologique apparaissant après la cible induisait une facilitation de la dénomination. Ces résultats soulignent le découpage temporel strict entre le moment où sont récupérés les lemmes et celui où le locuteur va avoir accès au lexème.

Comme nous venons de le voir, une façon de départager le modèle sériel du modèle en cascade consiste à étudier l’activation des compétiteurs phonologiques. Selon la théorie unidirectionnelle, seule la forme phonologique du mot cible va être activée, bien que plusieurs candidats sémantiques aient été préalablement sélectionnés. Par contre, si le transfert des informations s’effectue selon un flot bidirectionnel, pour tout compétiteur sémantique activé, le lexème correspondant va également se trouver activé. Cette particularité de traitement a inspiré entre autres Levelt et al (1991). En montant une série d’expériences combinant une tâche de dénomination et une décision lexicale, comme décrit antérieurement, ils avaient enregistré pour une SOA de 73ms, un retardement des temps de réaction pour la décision lexicale lorsque les paires amorce-cible étaient reliées soit phonologiquement soit sémantiquement, alors même que cet effet venait à disparaître lorsque les sondes auditives (amorces) étaient phonologiquement associées au compétiteurs sémantiques. Ces résultats vont dans le sens où une activation des candidats sémantiques a bien été effectuée alors même que leurs formes phonologiques ne le sont pas.

Mais pour certains auteurs, cette absence d’activation au niveau phonologique ne serait pas forcement la conséquence d’un mécanisme sériel. Ainsi, Dell et O’Seaghda (1991) vont faire la distinction entre plusieurs sortes d'activations : (1) l’activation sémantique, phonologique ou sémantico-phonologique dite directe considérée comme relativement forte et (2) l’activation diffuse de faible amplitude. Cette baisse de l'amplitude aurait pour origine la réduction de la force d’activation lorsque la cible est amorcée par un distracteur relié de façon indirecte (e.g. activation de STRIPE par le parcours LION-TIGER-STRIPE). En effectuant cette différenciation, ils apportent une explication plausible quant à l’absence de coactivation phonologique obtenue par Levelt et al (1991). Dans le cas de l'activation directe, les informations phonologiques rétroagiraient sur toutes les étapes antérieures, alors que dans le cas d'une activation diffuse, l'interaction serait de nature locale c'est à dire basée entre les niveaux adjacents : les informations phonologiques rétroagissent sur l'encodage grammatical mais pas sur le niveau conceptuel. Cette vue interactive du processus de production des mots va être soutenue par d’autres études. Pour cela, Peterson et Savoy (1998) ont repris le paradigme de Levelt et al (1991) sur lequel ils procédèrent à deux modifications majeures, et ce dans l’optique d’augmenter la sensibilité de la tâche d’amorçage : le premier point correspondait au remplacement de la décision lexicale par un protocole de dénomination considéré comme étant plus sensible à l’activation diffuse ; alors que le second point consistait en la présentation visuelle plutôt qu’auditive des amorces. Ces amorces étaient soit reliées phonologiquement à un item cible (e.g. COUNT pour COUCH), soit à son synonyme proche (e.g. SODA pour SOFA), soit non reliées (e.g. COUNT pour SODA), soit sémantiquement reliées (e.g. COUCH pour SOFA). Dans un tel contexte expérimental, les données montraient la présence d’une activation précoce (i.e. SOA de 150, 200, 300 et 400ms) des multiples candidats phonologiques possibles, traitement toutefois subséquent à l’étape d’activation des lemmes, se traduisant par une absence d’effet d’amorçage phonologique des deux sens de l’item contrebalancé par un effet d’amorçage sémantique pour une SOA de 50ms. En parallèle, à un stade plus tardif du processus, correspondant à une SOA de 600ms, les résultats montraient que seule la forme du mot cible restait activée : il persistait uniquement l’effet d’amorçage phonologique (amplitude de l’ordre de 40ms) du sens principal de l’item comparé à une condition où les amorces et les cibles étaient non reliées, alors que l’effet d’amorçage sémantique disparaissait.

Dans le même domaine d’étude, Jescheniak et Schriefers (1998) se sont aussi penchés sur le phénomène de coactivation phonologique permettant de départager les deux modèles d’accès au lexique en production. Pour cela, ils exploitèrent le paradigme d’interférence utilisé lors de cinq tâches de dénomination de mots en double modalité : les images cibles présentées visuellement précédaient (SOA : -150ms) ou suivaient (SOA : 0, 150 ou 300ms) des distracteurs auditifs. Que les sujets procèdent ou ne passent pas par une étape de familiarisation ne modifiait en rien le pattern de résultats impliquant, d’une part un effet d’inhibition lorsque les distracteurs étaient phonologiquement reliés à un synonyme de la cible (amplitude de l’effet de 47ms avec familiarisation et 30ms sans pour des SOA de -150 et 150ms) et, d’autre part, un effet de facilitation lorsqu’ils étaient phonologiquement similaires à la cible (respectivement 75ms et 57ms avec et sans familiarisation pour des SOA de 0 et 150ms), et ce comparé à une condition où les items composant les paires amorce-cible étaient non reliés. En complément, pour un temps de présentation de l’amorce de -150 et 150ms, la dernière expérience soulignait la présence d’un effet d’inhibition (38ms) pour des distracteurs sémantiquement proches des images plutôt que non reliés. La mise en évidence d’une coactivation phonologique des synonymes proches et par là même, de l’existence de plusieurs compétiteurs actifs à un stade tardif de la lexicalisation apporte son soutient à la théorie bidirectionnelle du flux d’informations. Mais bien que conscients du conflit existant entre leurs résultats et la définition stricte du modèle sériel, les auteurs n’en suggèrent pas moins qu’il serait nécessaire avant toutes choses de déterminer si la coactivation phonologique se limite aux mots associés d’un point de vue de leur signification à la cible ou bien si cet effet est une caractéristique plus générale du processus de sélection lexicale.

Après avoir décrit avec de plus amples détails le fonctionnement du modèle en cascade nous listerons de façon plus détaillée les autres données comportementales se portant en faveur de cette théorie ainsi que ses limites.