4.1 L’Étude comparative de l’interprÉtation À diffÉrents niveaux de formation et d’expÉrience

La formation est un des thèmes principaux des études sur l’interprétation (Gile 1995a, 2000 ; Pöchhacker 1995b, 1995c). Dès les années 50, elle a occupé une place prépondérante dans les premiers écrits (Gile 1995a: 35 ; Gile 2000) – par exemple, l’ouvrage didactique de J.-F. Rozan (1956) sur la prise de notes (voir ch. 3, section 3). Pendant les décennies suivantes, parmi les thèmes dominants de la recherche (par ex., modèles cognitifs de l’interprétation, la qualité du travail), la formation est le thème qui a rassemblé le plus grand nombre d’écrits (Gile 1995a: 56-60). F. Pöchhacker (1995b) observe que, dans la période 1989-1994, la formation est l’objet de 25% des études de l’interprétation ; d’ailleurs, à peu près un quart (20/78) des articles recueillis dans la revue The Interpreters’ Newsletter entre 1988 et 1997 ont pour objet la formation (Mead 1997). Ces données s’accordent avec les résultats d’une étude scientométrique de la recherche en interprétation de conférence, réalisée par D. Gile (2000). Gile (2000: 318) indique que la formation a représenté, pendant quarante ans, à peu près 20-25% de la production totale (19%, 18%, 26% et 20% pendant les années 60, 70, 80 et 90 respectivement). L’importance des autres thèmes n’a pas été comparable, à part les aspects cognitifs de l’interprétation, qui ont eu une place importante (17% de la production totale) pendant les années 60, « marquées par l'intervention de psychologues extérieurs à la profession » (Ilg 1996).

Malgré l’importance quantitative des publications sur l’enseignement de l’interprétation, D. Gile constate pourtant « à quel point la véritable recherche sur la formation reste absente » (Gile 1995a: 182-183). A notre avis, le sens de cette remarque est qu’il manque des études visant à évaluer les méthodes de formation. Un certain nombre d’études évaluent l’évolution des compétences en cours de formation (par ex., Gile 1987 ; Kurz 1996: 107-124 ; Vik-Tuovinen 1995 ; voir sections 2 et 4.1.2 du présent chapitre), ou identifient la fréquence d’emploi de différentes méthodes d’enseignement (Pöchhacker (1999). En revanche, à notre connaissance, il n’y a pas eu d’études systématiques sur l’efficacité de différents préceptes didactiques (par ex., la notion que la consécutive est une étape propédeutique, en vue de l’enseignement de la simultanée) ou méthodes d’enseignement (par ex., l’utilité didactique de la traduction à vue dans le cursus d’interprétation).

Sur cette toile de fond, une comparaison entre différents stades d’apprentissage et d’expérience, du type proposé dans la présente recherche, comporte plusieurs problèmes. D’abord, étant donné que les études longitudinales se déroulent parfois pendant des périodes considérables (par ex., Vik-Tuovinen 1995), il n’y a pas de garantie a priori que tous les sujets achèvent l’étude. Un autre problème de ce genre d’étude est que la plupart des grands débutants ne sont pas capables de gérer d’emblée un exercice d’interprétation, surtout en simultanée. Il suffit pourtant une mise à niveau initiale (plusieurs semaines d’entraînement à l’écoute, traduction à vue etc.), pour que les débutants puissent affronter les premiers exercices d’interprétation. L’augmentation progressive du niveau de difficulté (dans un cursus de deux ans, probablement à partir du deuxième trimestre) ne permet pas nécessairement d’identifier un écart évident entre différents stades du cursus – surtout si la comparaison est basée sur des exercices faciles, à la portée de tout le monde. Des exercices plus difficiles, tout en permettant probablement d’identifier un écart plus sensible, comportent probablement l’inconvénient d’être hors de la portée des débutants. Dans de telles conditions, la comparaison n’a guère de sens.

Il est donc possible de comparer différents stades de la « courbe d’apprentissage », à condition que: (i) l’évaluation ne soit pas basée sur des exercices trop difficiles ; (ii) les débutants aient effectué une mise à niveau initial.

Les pauses et les autres variables temporelles peuvent représenter des termes de comparaison explicites, objectifs et comparables entre différents stades d’apprentissage. Elles permettent de mesurer le développement de compétences linguistiques et techniques en cours de formation (voir sections 2 - 2.3 du présent chapitre). En revanche, d’autres critères (par ex., inventaire des erreurs et omissions, appréciation de la fidélité informationnelle) comportent une certaine variabilité « inter-observateurs ». Les études de F. Evandri (1998) et de D. Gile (1999a) mettent en relief cette variabilité.

F. Evandri (1998) compare des évaluations de cinq interprétations simultanées et cinq interprétations consécutives, en allemand ; les interprétations ont été réalisées, à partir des mêmes discours source en italien, par cinq étudiants italophones. Toutes les interprétations ont été enregistrées et évaluées par des enseignants dans différentes Écoles d’interprétation (à savoir, 2 évaluateurs à Forlì, 2 à Innsbruck, 2 à Vienne, 1 à Trieste). L’évaluation a été exprimée, selon le système italien, sous forme de note sur 30 ; il faut au moins 18 pour réussir l’épreuve.

Evandri présente les résultats de chaque épreuve dans un tableau séparé. Nous les avons résumés dans le tableau 4.

évaluateur:
épreuve (sujet): Forlì
éval. n. 1 Forlì
éval. n. 2 Innsbruck éval. n. 1 Innsbruck éval. n. 2 Vienne
éval. n. 1 Vienne
éval. n. 2 Trieste
sim. (A) non adm. 15 21 17 18 17 non adm.
sim. (B) non adm. 17 20 20 12 12 non adm.
sim. (C) non adm. 16 18 18 22 22 non adm.
sim. (D) 23 22 23 20 22 21 non adm.
sim. (E) non adm. 10 15 5 0 5 non adm.
cons. (A) non adm. 18 17 23 22 20 non adm.
cons. (B) 26 20 24 26 30 30 22
cons. (C) 24 23/24 21 17 22 24 non adm.
cons. (D) 22 16 20 17 12 13 non adm.
cons. (E) non adm. 14 14 10 12 13 non adm.

Les seules appréciations sur lesquelles les évaluateurs sont unanimes concernent les deux épreuves du sujet E. Sur l’épreuve « sim. (D) » également, six évaluateurs sur sept sont plus ou moins du même avis. Dans toutes les autres épreuves, les évaluations sont plutôt variables. D’ailleurs, les résultats ne permettent pas d’identifier les évaluateurs individuels comme systématiquement plus ou moins généreux par rapport à la moyenne (à part l’évaluateur de Trieste, qui est toujours parmi les plus sévères). Par exemple, l’épreuve « sim. (B) » est jugée de façon plus sévère à Vienne qu’à Innsbruck ; en revanche, l’évaluation de l’épreuve « sim. (C) » est plus sévère à Innsbruck qu’à Vienne.

D. Gile (1999a) compare différentes évaluations d’une interprétation simultanée en français, réalisée par un interprète francophone, à partir d’un discours en anglais. L’évaluation, qui a consisté en l’identification des erreurs et omissions (e/o), a été basée sur la lecture d’une transcription (chez 48 évaluateurs) ou l’écoute du discours d’arrivée (chez 47 évaluateurs). Les évaluateurs étaient regroupés en plusieurs catégories (interprètes professionnels, doctorants, professeurs de traduction, étudiants en interprétation/traduction, spécialistes d’autres disciplines). Les hypothèses examinées concernent les différences des évaluations, en fonction: (i) de la méthode d’évaluation (identification de plus d’e/o dans l’examen des transcriptions) ; et (ii) du groupe d’évaluateurs (jugements moins sévères chez les interprètes que chez les autres groupes). Indépendamment des hypothèses de base, l’étude fournit des informations intéressantes sur la variabilité des évaluations: (i) l’identification des e/o varie considérablement chez chaque groupe d’évaluateurs (par ex., de 0 à 7 e/o, chez les interprètes professionnels qui évaluent la transcription du discours d’arrivée ; de 0 à 33 e/o, chez les interprètes professionnels qui évaluent le discours d’arrivée) ; (ii) il n’y a pas de rapport simple et évident entre le nombre d’e/o identifiées et l’évaluation du niveau de fidélité (par ex., plusieurs évaluateurs, tout en identifiant des quantités très variables d’e/o, attribuent le score maximum à la fidélité de l’interpétation).

L’évaluation de l’aisance, à partir de données objectives (nombre/durée de pauses etc.), ne devrait pas comporter la même variabilité que l’identification des e/o et l’appréciation de la fidélité informationnelle.

Sur cette toile de fond, les sections suivantes evoquent les limites des études précédentes de l’aisance, chez des interprètes à différents niveaux de formation et d’expérience. Les sections (a) et (b) examinent les études effectuées en début de cursus et en cours de formation respectivement ; la section (c) commente les comparaisons entre des étudiants et des interprètes professionnels.