De même que l’on s’attache à présenter aux apprenants divers types textuels reflétant la variété de la langue écrite, un genre alliant la parole, la musique et les images nous semble propice à l’enseignement de la langue et culture contemporaines, il s’agit de la chanson. La télévision et les supports vidéo449 (cassettes et vidéo-disques) permettent de présenter du matériel récent, qui soit adapté à une certaine tranche d’âge et puisse correspondre au goût des apprenants450. La chanson française est un produit culturel qui cherche la reconnaissance internationale et fait partie d’une culture contemporaine. Sa forme la plus actuelle est celle du vidéo-clip que Gérard Vigner définit ainsi :
‘“Genre hybride par excellence, situé au point de rencontre du cinéma, de la publicité et de la musique, le clip tient tout à la fois de la bande-annonce de film, du spot publicitaire et du court métrage”.451 ’Techniquement, le vidéo-clip évolue très vite : au départ sa qualité était celle des images vidéo, c’est-à-dire assez médiocre, aujourd’hui, les images numériques utilisent un matériel sophistiqué et permettent des exploits techniques. Dans le vidéo-clip, le son a une place fixée (la chanson est essentielle), et l’image vient se rajouter à une musique qui se suffisait déjà à elle-même. A la différence de l’image de télévision ou de cinéma, il y a une distorsion entre les deux canaux : la synchronie image-son n’est pas à la base de l’art vidéo, l’image n’est pas liée au déroulement linéaire du son452. Cependant son et image ne sont pas pour autant indépendants, et c’est sous l’angle des relations intersémiotiques que nous voulons approfondir le sujet.
Pour l’enseignement/apprentissage de la langue, la compréhension d’une chanson ne se limite pas seulement à celle du sens linguistique, la compréhension d’un texte est soutenue par les images qui ont des caractéristiques esthétiques et iconique (mise en scène, lieux, effets ...) et montrent le locuteur : le chanteur est à l’écran, on peut lire sur ses lèvres ; des sous-titres peuvent aussi être insérés à l’écran avec les paroles. Le lien est ici très fort entre l’image et la musique, pour reprendre l’expression de Gérard Vigner, “la musique est dans l’image, elle la construit”. Il s’agit de représenter des espaces (décor, lieux, couleurs artificielles...) et de créer une histoire pour la musique.
Exemple 12 : musique, texte, images : l’intertextualité, l’interréférentialité
Document : vidéo-clip de Jean-Jacques Goldman “Envole-moi”, TV5
Durée : 2’
Caractéristiques : rapports son-image, texte écrit/texte oral
Utilisation en classe : compréhension et expression : mise en relation des paroles, du texte de la chanson et des images du clip
Niveau : intermédiaire
Activités : écoute sélective, compréhension détaillée orale/écrite, transcription, comparaison graphie-phonie, mise en relation avec des connaissances extra-textuelles culturelles et linguistiques.
A la différence d’une chanson disponible sur un CD-audio, le vidéo-clip permet de voir l’apparence du chanteur et de sensibiliser plus facilement l’apprenant aux thèmes de la chanson. Une première étape de compréhension passe par l’écoute, centrée davantage sur la musique que sur les paroles, et la perception des images : par exemple, la reconnaissance des instruments de musique, et du type de musique (on entend et on voit simultanément un piano et une main qui joue, puis Goldman qui joue de la guitare, et lors du refrain un quatuor à cordes qui joue sur un terrain vague). Les apprenants ont alors matière à exprimer leurs impressions sur les lieux, les thèmes, le chanteur. Les premières images, seulement accompagnées de musique, plantent le décor : vues d’une ville de banlieue, tours et immeubles de couleur bleu fluo, image légèrement floue, gyrophare d’une voiture de police qui fait une ronde dans les rues.... La musique est un élément de signification du message déterminant, mais ce peut être un élément perturbateur pour la situation d’écoute du texte. Le rythme lent peut faciliter l’écoute, au contraire la puissance des instruments peut couvrir les paroles et handicaper l’écoute. Pour surmonter cette difficulté, il est donc nécessaire de donner aux apprenants le texte ou une partie de la chanson et de pratiquer les activités habituelles de repérage et de recherche d’informations précises. En s’appuyant sur les spécificités de la chanson, notamment les éléments redondants (motifs visuels, rimes et refrain), l’apprenant recherche les mots importants, les constructions en parallèle, les éléments phatiques. L’apprenant sera amené à exposer oralement ses difficultés de compréhension, et à faire des interprétations : ainsi l’expression “envole-moi” pose des difficultés d’ordre sémantique et grammatical, mais montre également la liberté d’écriture entre un texte poétique et le langage ordinaire.
Pour travailler sur la compréhension du texte en s’appuyant sur les images, le texte est mis dans un deuxième temps en relation avec les signes iconiques et plastiques. Comme cela a été montré pour le message visuel, on rencontre deux situations : le chanteur est présent à l’écran, il y a écoute des paroles en son synchrone ; ou bien, le chanteur n’est pas visible à l’écran, les paroles sont en son “off” et les images servent de référent plus ou moins lointain au texte de la chanson. Dans le premier cas, l’attention de l’apprenant se porte davantage sur les paroles, soutenue par l’aspect kinésique du message (observation des lèvres et écoute simultanée). Puis, l’aspect prosodique du texte est à remarquer, car il est porteur d’informations sur le contenu, sur le locuteur ou l’auditeur. Le fait de chanter un texte met les ressources de la voix en relief et peut faire apparaître des variations intonatives (allongement de syllabes, accentuation d’un mot en début de séquence), ou des “déviations” par rapport à un cadre de communication habituel : on rencontre des caractéristiques relevant de la langue écrite comme les rimes, et des caractéristiques propres à la langue parlée, telle l’élision d’une partie de la négation. L’interprétation sera guidée par le texte de la chanson et les images assureront la fonction d’ancrage453. Dans le deuxième cas, lorsque le chanteur n’est pas à l’écran, l’apprenant prendra surtout appui sur l’image pour accéder au sens ; cependant, le contexte visuel apportera des informations qui ne seront pas toujours un soutien de la compréhension verbale. En effet, les relations entre l’image et le sonore sont complexes et nombreuses et, telles qu’elles ont été analysées par les sémiologues, elles reposent principalement sur l’interaction et la complémentarité. Les relations sont souvent classées en trois grandes catégories facilement utilisables dans un cadre d’apprentissage : la redondance, la complémentarité ou l’opposition. Mais différents procédés rhétoriques tels la suspension, l’allusion, le contrepoint complètent et affinent l’interprétation. En fait, les chercheurs en audiovisuel ont montré qu’il ne s’agissait pas tant de mesurer la dominance d’un canal sur l’autre, que plutôt leur influence mutuelle. On pense ici aux travaux effectués sur les relations entre graphie et image, notamment dans le roman-photos et la bande dessinée, qui montrent les interférences, les contaminations d’un système de signes à l’autre.454 Dans une perspective d’apprentissage, il ne s’agit donc pas tant d’analyser ces relations que les effets produits : comique, poétique, ironique qui enrichissent l’interprétation. En suivant Michel Chion455, on peut mettre l’accent sur les points d’indépendance des deux canaux en partant de la perception et en répondant à la question :
-Qu’est-ce que je vois de ce que j’entends ? Les sources sonores sont-elles visibles ou suggérées visuellement ?
La question doit aussi être renversée :
-Qu’est-ce que j’entends de ce que je vois ? Mais il est plus difficile d’y répondre car les sources potentielles de son sont plus nombreuses dans un plan qu’on ne peut l’imaginer.
Michel Chion parle de “sons en creux” que l’on peut repérer dans l’image : dans le clip, l’image évoque la sirène mais ne la donne pas à entendre. De même pour le son, on rencontre des “images négatives” présentes par la seule suggestion qui en est faite. On peut aussi comparer le son et l’image par rapport à un même critère, par exemple sur le plan de la vitesse : l’accélération du rythme musical n’est pas toujours suivi par celui des plans et inversement, ainsi des vitesses contrastées créent une subtile complémentarité de rythme ; sur la question de la définition : un son dur, chargé en détails se combine à une image imprécise, voire floue. L’image peut être peuplée de détails narratifs et le son comporter peu de bruitages, ou l’inverse, toutes ces combinaisons sont riches en suggestions et allient décodage et expressions linguistique et culturelle. Une autre dimension du document peut être apportée par l’écriture électronique du texte à l’écran, par un sous-titrage des paroles de la chanson. Cette possibilité technique présente l’avantage de mieux relier langue orale et langue écrite, et de développer une compétence de lecture456. L’intérêt des sous-titres réside surtout dans un usage individuel, par exemple lorsque l’apprenant travaille l’écoute au casque. Lors d’une écoute en groupe, les sous-titres sont certes soutien de la compréhension, mais aussi un élément visuel perturbateur car ils retiennent l’attention de l’apprenant qui délaissera alors l’image et l’écoute sélective.
Il s’agit essentiellement des cassettes vidéo car les vidéo-disques tels qu’ils sont apparus dans les années 80 n’ont pas connu le succès escompté ; le vidéodisque couplé à un ordinateur permet une lecture non linéaire des images et de nouveaux montages, cependant des raisons de coût expliquent l’échec commercial de ce support.
Arguments déjà présentés notamment par L.J. Calvet, la motivation des apprenants pour des chansons contemporaines, plus proches de leur univers, s’oppose souvent à celle de l’enseignant pour un répertoire plus classique. Les unes ne devant pas exclure les autres !
Gérard Vigner, “Images de la musique : les vidéo-clips”, FDM n°213, 1987, p. 63.
Certains clips de rap créent la nouveauté en combinant parole et mot écrit électroniquement qui “se promène librement de manière vivante entre l’écrit et l’oral, abolissant les barrières toutes faites de l’audio-logo-visuel et montrant un autre aspect de la vitalité de ce genre”, in L’audio-vision, Michel Chion, Nathan, 1990, p. 141.
Roland Barthes distingue dans son article “Rhétorique de l’image”, deux fonctions du texte par rapport à l’image : l’ancrage qui consiste à privilégier une interprétation parmi celles qu’offre l’image seule ; et le relais qui se manifeste lorsque le message linguistique vient prendre le relais, compléter l’image. in Communications 4, Paris, 1964.
A propos de la bande dessinée, il est intéressant de voir comment les recherches graphiques tendent à représenter dans l’écriture les caractères de l’oralité, par exemple la représentation des bruits est un motif de l’image. Le texte lui-même est contaminé et devient dessin : les paroles des bulles ont des marques de l’oralité (une écriture différente évoque le ton, l’accent étranger, l’intensité ...), une image peut remplacer un mot.
Michel Chion, L’audio-vision, Nathan, 1990, p. 163.
Quelques didacticiens ont réalisé des expériences visant à comparer les effets du visionnement d’extrait vidéo selon trois modalités : le son en français sans sous-titres, en français avec des sous-titres ou en langue maternelle (anglais) et sous-titres français ; le sous-titrage inversé favorise notamment le rappel de vocabulaire et est une aide pour la traduction. M. Danan, “Reverse subtitling and dual coding theory : new directions for foreign language instruction”, Language Learning, 42, 1992, p. 497-527.