2.1.4. Les transcriptions écrites

Pour les films vidéo, certains cédéroms proposent des transcriptions écrites et généralement, le film vidéo est découpé en séquences permettant que le texte s'affiche au fur et à mesure de l'enchaînement des séquences. Il est aussi possible d'arrêter le film à tout moment et de retourner à la séquence précédente. La présence des transcriptions écrites des paroles à côté du film vidéo a trois avantages principaux pour le décodage des unités lexicales : l'utilisation des stratégies de lecture (la décomposition des unités lexicales, une reconnaissance des termes transparents et l'inférence des informations sémantiques à partir de la cohésion et cohérence textuelle), la possibilité d'une référence directe ou indirecte avec les images et une aide pour la distinction des unités lexicales sur la chaîne parlée.

L'exemple d'une séquence du film vidéo "Jugendliche in Lüttenklein" (cédérom "Infolangue") montre le recours aux stratégies de lecture. Dans la séquence présentée ci-dessous, nous voyons en gros plan une jeune fille, alors que le narrateur parle des parents de la fille :

Figure 33 : film "Jugendliche in Lüttenklein" + transcription des paroles (cédérom "Infolangue")

Bien que l'image prépare à la perception des informations textuelles, elle ne permet pas la compréhension des unités lexicales "Postbotin" et "Kraftfahrer". Ce rapport entre l'image et les paroles n'est que très indirect et l’'apprenant doit se baser sur le contexte et les des stratégies de décomposition des unités lexicales. Le terme "Mutter" indique le lien de parenté avec la fille que l'on voit sur l'image. Ensuite, il convient de décomposer les unités lexicales "Postbotin" et "Kraftfahrer". et d'essayer de comprendre un des deux constituants. Pour "Postbotin", il est possible de reconnaître le terme transparent "Post" et de faire l'hypothèse que la mère travaille à la poste. Pour le terme "Kraftfahrer", l'apprenant peut reconnaître le verbe "fahren" et faire l'hypothèse que le père est conducteur.

Une enquête (annexe 2) auprès de nos étudiants confirme ce procédé : pour "Postbotin", ils ont effectivement reconnu le terme "poste", ils ont vu à partir du contexte que "Postbotin" est un métier et ils ont fait l'hypothèse que ce terme signifie "postière" (E.T., 2002). Pour "Kraftfahrer", ils ont déduit du contexte qu'il s'agit d'un métier. Ils ont décomposé le terme en "Kraft" (=force) et "fahren" (=conduire) et ils ont abouti à l'hypothèse de signification "conducteur de poids lourds" (E.T., 2002) ou "routier" (E.F., 2002).

L'aide des transcriptions écrites pour la distinction des unités lexicales sur la chaîne parlée peut être expliquée par l'utilité d'une aide de structuration textuelle, par le comportement de subvocalisation observé pendant la lecture et par le triple traitement cognitif des informations lexicales. C'est le cas pour le film sur la voiture (cédérom "Tell me more"). Sur l'image, nous voyons un jeune homme sur une moto :

Figure 34 : film sur la voiture (cédéom "Tell me more")

En effet, lorsque l'apprenant entend les paroles du film vidéo, il doit identifier les mots, les groupes de mots, différentes parties de phrases, des phrases entières. Il doit aussi reconstruire les schèmes contextuels. Bien que l'apprenant puisse utiliser des éléments comme la prosodie, l'ampleur et la vitesse de la prononciation, la distinction des unités lexicales sur la chaîne parlée reste une tâche difficile et ceci d'autant plus quand il s'agit de textes authentiques (Roher, 1990). Il peut alors être utile d'utiliser des transcriptions de paroles :

‘"Das Problem ist dabei nicht nur die Geschwindigkeit, die in einem mit normaler Sprechgeschwindigkeit gesprochenen Text reduzierten Lautmerkmale zu interpolieren; er muß auch Wörter und Wortgruppen abgrenzen können. Bei Tonaufzeichnungen authentischer Texte, zum Beispiel gesprochener Interviews, sind schriftliche Fixierungen solcher Texte ein sehr wirksames Hilfsmittel. " (Roher, 1990 : 27) ’

En absence d'une aide spécifique, l'auteur présume qu'un découragement de l'apprenant est possible :

‘"Die Gliederung des Lautstroms ist für den Ungeübten eine sehr schwierige Aufgabe, insbesondere bei unmanipulierten, authentischen Hörtexten. Wenn der Übende keine Gliederungshilfe bekommt und keine Möglichkeit hat, schwer Verständliches in Ruhe durchzuarbeiten, ist es nicht verwunderlich, wenn er schnell die Flinte ins Korn wirft." (Roher, 1990 : 46)’

De plus, les transcriptions écrites des paroles facilitent le décodage des unités lexicales en soutenant le processus de subvocalisation observé pendant la lecture. En effet, nous lisons parallèlement avec les yeux et les oreilles (Roher, 1990 : 43) :

‘"Die Subvokalisierung beim lautlosen Lesen ist durch elektromyographische und elektroenzephalographische Befunde schlüssig nachgewiesen worden. An den Befunden wird in der einschlägigen Forschung nachgewiesen, daß der lesende Mensch in der Regel innerlich mitspricht, und zwar umso stärker, je schwieriger der Text wird. Besonders beim Lesen in anderen Sprachen scheint das Subvokalisieren eine kritische Rolle zu spielen. Die These, daß wir immer mit Auge und Ohr lesen, erscheint angesichts dieser Befunde nicht mehr zu gewagt." (Roher, 1990 : 43) ’

De cette manière, l'effort cognitif engagé pour la subvocalisation est considérablement réduit puisque la forme sonore n'a plus besoin d'être cherchée. Ensuite, nous pouvons supposer une triple activation des concepts mentaux : à partir des formes graphiques dans les transcriptions écrites, à partir de la forme sonore entendue dans les paroles du narrateur et à partir de l'image. En effet, après avoir distingué les unités lexicales "Zweirräder", "Mofa" et "Motorrad" sur la chaîne parlée, l'apprenant peut se baser sur la référence directe entre l'image et les unités lexicales. Il peut certes hésiter dans le choix de l'unité lexicale qui correspond à l'image puisque le texte comprend au total trois phrases. Néanmoins, la présence des trois canaux d'information facilite considérablement le décodage des unités lexicales.

Paivio (1986), Baddeley (1992), Niegemann et al. ( 2003) supposent un encodage dual des informations lexicales. Leur modélisation des processus engagés a abouti à la construction du "Selection-Organization-Integration-Modell" (Niegemann, 2003). Ce modèle suppose un traitement du texte et des images par un canal visuel et l'utilisation du canal auditif pour le traitement du son et de la musique. Les unités lexicales présentées dans leur forme graphique sont traitées deux fois : après le traitement par le canal visuel, elles sont traitées par le canal auditif. Chacun des deux canaux possède cependant une capacité limitée et il existe une limitation dans le traitement parallèle des processus cognitifs. Ainsi, on peut supposer une surcharge de la mémoire de travail lorsque l'apprenant reçoit d'une part, trop d'informations à travers le même canal et lorsque la mémoire doit d'autre part, traiter parallèlement trop d'informations dans les deux canaux (Niegemann et al., 2003). Il semble donc être inefficace de présenter en même temps beaucoup de séquences d'images qui se succèdent rapidement et il convient d'éviter des textes trop longs. En se basant sur la théorie de "Split-Attention" et sur les travaux de Sweller (1999) et Mayer (2001), Niegemann et al. (2003) attirent notre attention sur le fait qu'une présentation parallèle d'un texte écrit et d'un texte parlé peut nuire à l'apprentissage. Ils mentionnent cependant deux exceptions pour lesquelles cette double présentation peut être profitable pour l'apprenant : premièrement, si elle permet aux apprenants de choisir la présentation qui correspond à leur style d'apprentissage, et deuxièmement, lorsqu'elle permet de baisser l'effort cognitif engagé. Ceci est le cas, par exemple, lorsqu'il est plus difficile de suivre un texte sonore que de le lire.

Une enquête (annexe 2) auprès de nos étudiants a permis de confirmer que les transcriptions sont ressenties par eux comme une aide. Ainsi, ils ont témoigné : "le fait d'entendre et de lire le texte permet une meilleure compréhension" (A.C., 2002) et "Es war sehr angenehm, zuerst den Text zu hören, dann den Text zu lesen"(S.P., 2002).