Analyse

Nous analyserons ensemble les grilles d’évaluation des épreuves B1 et B3 car elles sont presque identiques : elles comportent les mêmes rubriques, et seule la présentation / formulation des critères à l’intérieur de la catégorie savoir-faire diffère légèrement. Le nombre de critères et de points est le même.

Ces deux grilles sont datées de mars 2003, mais elles sont en fait attestées par la Commission Nationale du DELF et du DALF depuis au moins 1996, date à laquelle ont été publiées des annales du DALF dans lesquelles on retrouve deux grilles-types identiques proposées par la Commission pour l’évaluation du compte-rendu et de la synthèse. Cela tend à confirmer les indications de la Commission (Dayez 2003 : 16) : « Le contenu d’une grille étant fonction de la nature des objectifs de l’épreuve et non lié à tel ou tel sujet particulier, la même grille peut, en règle générale, être utilisée d’une session à l’autre ». Est-ce à dire que ces grilles ont traversé les années et les réformes sans qu’on les ait modifiées ?

Les critères d’évaluation sont divisés en deux grandes catégories, savoir-faire et connaissance de la langue. Entre ces deux rubriques, la répartition des points n’est pas équilibrée, puisque la connaissance de la langue vaut presque deux tiers des points. Prenons le cas extrême d’un candidat qui n’aurait pas bien compris le texte et fait la différence entre les idées principales et secondaires, mais qui n’aurait pas pour autant recopié le document et qui surtout aurait une très bonne connaissance de la langue. On peut supposer que si le correcteur respecte à la lettre (et naïvement) la répartition des points telle qu’elle est dans la grille d’évaluation, ce candidat pourrait s’en sortir avec la moyenne. Au contraire, un candidat qui aurait très bien compris le ou les documents et qui maîtriserait la technique du compte-rendu ou de la synthèse, mais qui aurait de gros problèmes au niveau de la compétence linguistique, aurait sans doute beaucoup de mal à obtenir dix sur vingt. Ce sont bien évidemment des cas extrêmes, et la perfection est difficile (voire impossible) à atteindre dans un cas de production écrite, mais ne serait-il pas cependant envisageable de tâcher de rééquilibrer le poids du savoir-faire et de la connaissance de la langue ? Comme le disait en effet Christine Tagliante (propos recueillis en 1993), « le correcteur scrupuleux est parfois confronté à des aberrations qui consistent à accorder la moyenne à une copie en fonction du barème imposé alors que globalement, elle ne la « mérite » pas. Ou inversement ». A ce sujet, Y. Dayez (2003 : 12), parlant des grilles d’évaluation du DELF et du DALF, dit qu’il faut chercher à « maintenir un équilibre satisfaisant » entre la capacité à communiquer (i. e. les savoir-faire) et la compétence linguistique, cette dernière ne devant être « jamais considérée comme une fin en soi [cela aboutirait, cas d’école absurde, à surnoter une production écrite totalement « hors-sujet » mais linguistiquement correcte], mais en tant qu’elle conditionne dans la pratique l’aptitude à communiquer ». L’examinateur doit donc évaluer la compétence linguistique en fonction de la nature de l’épreuve, et ce faisant, évaluer aussi comment elle intervient dans la compétence communicative. Le DALF se situant à un niveau de perfectionnement linguistique, et ses épreuves s’inscrivant d’une certaine manière dans la préparation d’exercices universitaires, quelle place accorder à la compétence linguistique et à la compétence communicative ?

Les savoir-faire stipulés sont la restitution de texte (épreuve B1) et la restitution du contenu des documents (épreuve B3) en un nombre de mots limité, car le compte-rendu et la synthèse sont des exercices de contraction de texte. Pour ce faire, six critères ont été retenus, le tout valant 8 points. Le nombre de points est global, chaque critère n’est pas répertorié avec son nombre de points maximal.

La connaissance de la langue est divisée en deux catégories de poids différent en termes de points : la structuration du discours sur 4 points et la compétence linguistique sur 8 points. Chaque catégorie est constituée respectivement de deux et trois critères, mais là encore un nombre de points global est attribué aux catégories, et non pas un nombre de points par critère, ce qui suppose, pour les savoir-faire comme pour la connaissance de la langue, qu’une grande latitude est accordée aux correcteurs. Serait-ce « afin d’éviter un usage trop rigide du barème, aboutissant à une taxation mécanique des erreurs », comme le dit Maccario (1996 : 39) à propos de la latitude laissée aux correcteurs dans les examens et concours ?

La Commission Nationale du DELF et du DALF s’explique ainsi sur le degré de précision des grilles (Dayez 2003 : 18) :

‘« Nous nous sommes efforcés d’éviter des grilles trop détaillées et trop subdivisées pour les raisons suivantes :
Une grille soit être suffisamment simple pour pouvoir être mémorisée et intégrée par l’examinateur. […]
Une notation trop détaillée et pointilliste favorise une évaluation hypernormative qui va à l’encontre de l’esprit de l’examen […]
Une grille relativement sommaire s’avère dans la pratique bien plus fonctionnelle qu’un outil trop élaboré, visant à l’exhaustivité sous couvert d’objectivité « scientifique ». […] En revanche, il est vivement souhaitable que chaque critère auquel nous attribuons une enveloppe de points fasse l’objet dans les centres de discussions destinées à en affiner la signification et l’usage, par exemple lors des réunions préparatoires entre examinateurs et jury. […] Il est évident que de telles informations doivent être intégrées par l’examinateur : les détailler pour chaque rubrique d’une grille rendrait celle-ci rapidement illisible ».’

Bien qu’elles soient peu détaillées à cause d’un choix justifié et argumenté, les grilles de correction doivent donc être en quelque sorte « aménagées », puisqu’elles ne sont pas utilisables telles quelles. Elles doivent être complétées par le détail de l’attribution des points et celui des attentes par critère. Mais comment peut-on être sûr que la répartition des points et l’explicitation des critères soient identiques d’un centre d’examens à un autre ? Et même, comment savoir que les réunions dont il est question ici ont effectivement systématiquement lieu ? Tout cela ne pourrait-il pas en fin de compte introduire un facteur nuisant à la fiabilité des mesures ?

Une note précise que la compétence orthographique est à évaluer dans la compétence linguistique. Pourtant elle ne fait pas partie de la liste de critères proposés pour cette catégorie. Faut-il donc ajouter ce critère à la liste et lui attribuer une partie des 8 points de la compétence linguistique, ou bien exclusivement l’évaluer négativement en retranchant des points du total de la catégorie « compétence linguistique » ? Dans ce dernier cas, des candidats qui ne feraient pas d’erreurs d’orthographe ne gagneraient rien, alors que dans le premier cas ils pourraient bénéficier de points supplémentaires. C’est pourtant ce que prescrit la Commission Nationale du DELF et du DALF (Dayez 2003 : 17) : « pour les épreuves écrites, nous n’avons pas attribué de rubrique spécifique à la compétence orthographique. Celle-ci sera évaluée exclusivement en correction négative (retrait de points) sur l’ensemble de la rubrique « compétence linguistique ». La compétence orthographique ne peut être sanctionnée mathématiquement. Nous conseillons une évaluation globale, qui tiendra compte des paramètres suivants : la position de l’unité […] ; l’objectif communicatif de l’épreuve. » Mais cette évaluation globale, malgré les paramètres indiqués, ne risque-t-elle pas, elle aussi, de laisser une certaine liberté aux correcteurs ?

Une note explique le principe de correction négative en ce qui concerne le nombre de mots en deçà ou au-delà du nombre fixé, principe justifié par le fait qu’un exercice de contraction de texte doit être concis – mais dans une certaine limite.

Une seconde note donne des indications à respecter en cas de compte-rendu ou de synthèse créés à partir de morceaux de texte recopiés : la mesure prise dans un tel cas est la mise à zéro de la catégorie « compétence linguistique ». Pourquoi cette mesure, si le savoir-faire visé dans ces exercices est la restitution du contenu d’un ou plusieurs textes ? Ne serait-ce donc pas cette partie qui devrait être mise à zéro, puisque le candidat qui procède de cette façon montre qu’il ne sait pas faire un compte-rendu ? Certes, il ne prouve pas non plus qu’il possède la compétence linguistique nécessaire s’il se contente de recopier le texte de départ, mais à ce moment-là, pourquoi par exemple ne pas mettre directement zéro à l’exercice de contraction de texte ou diminuer la note finale de moitié, si l’on considère que le candidat n’a fait que la moitié du travail qui lui était demandé ? Ces exemples ne sont pas là pour demander plus de sévérité dans l’évaluation, mais simplement pour illustrer des points qui pourraient être discutés.

La Commission Nationale du DELF et du DALF préconise la fourniture aux correcteurs d’une liste des points les plus importants du ou des documents, destinée à les aider dans l’évaluation du compte-rendu (Dayez 2003 : 154) ou de la synthèse (idem : 168). On peut constater que finalement, cette recommandation n’est pas respectée par la Commission dans les sujets qu’elle conçoit.

En conclusion, on peut se demander si ces grilles d’évaluation ne nécessiteraient donc pas d’être revues afin d’éliminer des points litigieux. Peut-être cela pourrait-il aussi permettre un peu plus de fiabilité si on détaillait les points attribués à chaque critère d’évaluation ? L’évaluation ne pourrait-elle pas alors être plus juste, dans la mesure où tous les correcteurs, où qu’ils soient dans le monde, auraient entre leurs mains exactement la même grille de correction, tous avec le même nombre de points pour chaque critère d’évaluation, alors qu’à l’heure actuelle, il semblerait que chacun puisse finalement faire sa propre grille, ce qui ne met pas les candidats sur un pied d’égalité ?