2.2.1.d La rédaction d’essais

Wolfe, Schreiner, Rehder, Laham, Foltz, W. Kintsch et Landauer (1998) ont souhaité tester l’hypothèse selon laquelle la capacité à apprendre à partir d’un texte dépendrait de l’adéquation entre les connaissances initiales du lecteur et la difficulté de l’information textuelle. L’expérience réalisée par les auteurs comportait trois phases. L’objectif de la première phase était d’évaluer les connaissances initiales des participants (n = 106) sur le domaine abordé par le texte expérimental (le fonctionnement cardiaque). Parmi les participants, 12 étaient des étudiants en médecine. Au cours de cette étape, les sujets ont réalisé trois tâches successives : [1] la rédaction d’un essai de 250 mots sur le domaine, [2] le classement de 20 cartes sur lesquelles étaient inscrits des mots relatifs au domaine (e.g., ventricule droit, oxygène), et [3] la résolution de 17 questions ouvertes sur le domaine (e.g., dans quelle partie du coeur rentre le sang qui revient du corps?). Le but de la seconde phase était de tester la compréhension de quatre textes expérimentaux de difficulté croissante : [1] un texte A qui était le plus simple, car issu d’un livre sur le corps humain destiné à des enfants, [2] un texte B qui était une introduction sur la circulation sanguine rédigée pour des lecteurs adultes, [3] un texte C qui était issu d’un cours d’introduction à l’anatomie donné à des étudiants, et [4] un texte D qui était le plus difficile, car issu d’un ouvrage médical sur les différentes pathologies du coeur. Chaque participant lisait donc l’un des quatre textes auquel il était affecté aléatoirement. Au cours d’une troisième phase dont le but était de quantifier l’apprentissage à partir du texte, les sujets effectuaient de nouveau les trois tâches proposées au pré-test, soit 5 minutes, soit 2 jours après la lecture du texte.

Les quatre textes expérimentaux (A, B, C et D) ainsi que les essais rédigés par les participants aux pré- et post-tests ont été examinés à l’aide de l’Analyse Sémantique Latente, et ont été représentés sous forme de vecteurs dans un espace à 100 dimensions. LSA a été appliquée pour mesurer le chevauchement conceptuel entre les connaissances des lecteurs et les contenus textuels, et pour déterminer à terme une zone intermédiaire d’apprentissage (Kintsch, 1994). Dans cette zone, les textes d’apprentissage sont censés être suffisamment distants de ce que les lecteurs connaissent déjà, sans toutefois en être trop éloignés. L’espace dans lequel les textes et les essais ont été représentés sous forme de vecteurs, a été construit à partir d’un corpus de 36 articles encyclopédiques sur le fonctionnement cardiaque. Le cosinus EC calculé entre les vecteurs représentant l’essai effectué au pré-test (i.e., vecteur E) et le texte expérimental (i.e., vecteur C) est une mesure de la correspondance sémantique entre ces deux types de textes. En accord avec l’hypothèse d’une zone intermédiaire d’apprentissage, Wolfe et collaborateurs (1998) ont fait la prédiction que le nombre de connaissances acquises à partir du texte devrait être peu important lorsque la valeur du cosinus EC est, soit trop faible (Cas 1 : texte expérimental trop difficile), soit trop élevée (Cas 2 : texte trop facile). En revanche, l’apprentissage devrait être optimal pour des valeurs intermédiaires du cosinus EC (Cas 3 : texte ni trop facile, ni trop difficile). Les résultats ont confirmé cette prédiction, et ont mis en évidence une relation non-monotone entre la quantité d’apprentissage et les connaissances initiales du lecteur. De plus, ils ont montré que le vecteur E représentant l’essai réalisé par le sujet au pré-test était un bon prédicteur du niveau de connaissances initiales du sujet. Rehder, Schreiner, Wolfe, Laham, Landauer et W. Kintsch (1998) ont complété cette recherche (Wolfe & al., 1998), en apportant des précisions sur la valeur prédictive de l’essai. D’une part, l’essai doit contenir entre 70 et 200 mots (les 60 premiers mots n’étant pas prédictifs du niveau d’expertise initial). D’autre part, il n’est pas nécessaire de faire la distinction entre les termes scientifiques et non scientifiques utilisés par le sujet pour décrire le domaine testé, puisque les deux catégories de mots contribuent de façon équivalente à la prédiction du niveau d’expertise.