1. 3. 2. À long terme

L’effet d’intervalle est-il le même lorsque l’on élargit l’échelle de temps des études et que les répétitions se produisent lors de plusieurs sessions séparées par au moins un jour ? Seules trois études récentes, à notre connaissance, ont étudié cette question sur des échelles de plusieurs jours : Glenberg et Lehman (1980), Cepeda et al. (2009), et Cepeda et al. (2008). De plus, il faut ajouter à cette littérature récente un certain nombre d’études menées par les chercheurs en pédagogie au début du XXème siècle, et qui sont rarement citées : Ausubel (1966), Bunch (1941), Burtt et Dobell (1925), Lyon (1914), Peterson et al. (1935), Reynolds et Glaser (1964), Starch (1912), Strong (1916). Ces dernières études ne bénéficiaient pas de la méthodologie expérimentale ni des outils statistiques actuels, nous conduisant à les considérer comme un ensemble d’indications plutôt que comme des résultats fiables et définitifs. De plus, des différences de protocole par rapport aux études plus récentes rendent les conclusions difficiles (e.g., Strong ainsi que Burtt et Dobbel n’avaient pas égalisé les DR).

Glenberg et Lehman (1980, Expérience 2) présentaient aux participants des paires de mots à deux reprises, séparées par un IIR de 1 jour ou de 7 jours. Le DR durait ensuite 7 jours et, lors du rappel indicé, les participants devaient donner le mot associé au mot présenté. Les performances étaient plus élevées pour les items répétés suite à l’IIR de 1 jour que suite à l’IIR de 7 jours. La Figure 3 synthétise ces données, ainsi que celles décrites dans les paragraphes suivants.

Dans l’expérience de Cepeda et al. (2009, Expérience 1), les participants apprenaient des paires de vocabulaire swahili-anglais à l’aide d’un protocole informatisé consistant en un rappel indicé avec feedback (ce protocole était similaire à celui utilisé dans Cepeda et al., 2008, décrit plus loin). Les sessions d’apprentissage consistaient en des phases de présentation des paires suivies de phases de test sur ces paires. Pendant ces phases de test, les participants devaient rappeler le mot anglais en réponse au mot swahili, et, à la fin de l’essai, la bonne réponse était présentée (i.e., essais de type Test-étude, voir la section 1.4.1). Une paire bénéficiant d’une bonne réponse ne faisait plus l’objet d’un rappel indicé dans le reste de la session. Chaque paire était apprise lors des deux sessions d’apprentissage qui avaient lieu avec un IIR de 1, 2, 4, 7, ou 14 jours selon les sujets. Le délai de rétention était de 10 jours. Les résultats ont montré une courbe de performance en U inversé en fonction de l’IIR ; l’IIR optimum était d’un jour et la courbe était relativement plate pour des IIR plus grands que cet optimum, (i.e., sur la partie droite de la courbe, voir la Figure 3).

Figure 3 : Reproduction des résultats des études de Glenberg et Lehman (en haut), de Cepeda et al. (2009, Expérience 1 ; au milieu) et de Cepeda et al. (2009, Expérience 2 ; en bas). En abscisses est représenté l’IIR et en ordonnées le taux de bonnes réponses.

Enfin, dans la seconde expérience de Cepeda et al. (2009), on présentait aux participants à la fois des faits peu connus sous forme de question-réponse et des images d’objets peu connus avec le nom de l’objet associé, en suivant le même protocole informatisé que dans l’Expérience 1. Les deux types d’items étaient mélangés dans les sessions d’apprentissage. Chaque item était appris lors de deux sessions d’apprentissage qui avaient lieu avec un IIR de 0, 1, 7, 28, 84, ou 168 jours. Le délai de rétention était de 6 mois (i.e., environ 168 jours) avant le rappel indicé final. De nouveau, les résultats ont montré une courbe de performance en forme de U inversé en fonction de l’IIR, avec un optimum à 28 jours, et une courbe relativement plate à droite de l’optimum.

Ainsi, ces expériences ont mis en évidence, pour un délai de rétention donné, une fonction en U inversé, c’est-à-dire que l’intervalle optimal entre deux sessions semble être de durée moyenne, plus courte que le délai de rétention employé. De plus, cet intervalle optimal ne semble pas avoir une durée fixe.

Cepeda et al. (2008) ont alors fait le constat que dans les études déjà réalisées, un large spectre de durées d’IIR manquait au sein de l’ensemble des IIR possibles et que, de plus, peu d’études avaient étudié l’effet de la durée du DR et l’interaction entre DR et IIR. Ils ont réalisé une expérience à laquelle plus de 1300 sujets ont participé sur Internet. Afin d’observer un grand ensemble de combinaisons possibles entre ces deux intervalles, chaque participant a été réparti dans une condition combinant un IIR (0, 1, 2, 4 , 7, 11, 14, 21, 35, 70, ou 105 jours) et un DR (7, 35, 70, ou 350 jours). Lors de la première session, la tâche consistait pour les sujets à répondre à des questions relatant des faits vrais mais peu pertinents, comme par exemple : « Quelle nation européenne consomme le plus de nourriture Mexicaine épicée ? ». La question était posée, puis la réponse était présentée (e.g., la Norvège) dans le cas où la réponse donnée n’était pas exacte. Tant que la bonne réponse n’était pas donnée par le sujet, l’item était programmé pour se présenter de nouveau ultérieurement. Dès que la bonne réponse était donnée, l’item n’était plus présenté pendant la session. Lors de la deuxième session qui avait lieu après l’IIR particulier à chaque sujet, chaque item qui avait été appris lors de la première session était maintenant testé avec feedback à deux reprises, et ce, quelle que soit la réponse du sujet. Lors de la troisième session, qui avait lieu suite à un DR particulier à chaque sujet, les participants devaient répondre aux questions comme dans les deux sessions précédentes mais sans feedback, puis répondaient également à un questionnaire à choix multiple pour les mêmes questions. Les courbes de performance au rappel indicé sont représentées dans la Figure 3. Ces courbes décrivent une courbe en U inversé dont le sommet, c’est-à-dire l’IIR optimal, augmente avec la durée du délai de rétention. Par exemple, pour un délai de rétention de 7 jours, l’IIR optimal était de 1 jour, tandis que pour un délai de rétention de 350 jours, l’IIR optimal était de 21 jours. Cette observation est importante car elle montre que l’IIR et le DR ont des effets joints à long terme tout comme à court terme, et qu’il est absolument essentiel de prendre en considération la durée du DR pour rendre compte des effets de la répétition sur la rétention ultérieure.

Figure 4 : Reproduction des résultats de l’étude de Cepeda et al. (2008). Taux de bonnes réponses dans la tâche de rappel indicé selon l’IIR (axe des abscisses) et le DR (couleur de la courbe). Les courbes ont été lissées par les auteurs.

Nous avons considéré jusqu’à présent les cas où une information était présentée à deux reprises. Cependant, dans l’environnement, une information peut se présenter un plus grand nombre de fois. Or, comme nous l’avons vu, la rétention augmente en général avec le nombre de répétitions. Quel est l’effet des IIR lorsqu’une même information est répétée trois fois ou même davantage ? Un ensemble d’études à très long terme, c’est-à-dire sur des semaines, voire des années, a été conduit par Bahrick et ses collaborateurs (Bahrick, 1979 ; Bahrick & Phelps, 1987 ; Bahrick, Bahrick, Bahrick & Bahrick, 1993 ; Bahrick & Hall, 2005). De façon générale, ces études ont montré que pour un nombre de répétitions supérieur à deux, la rétention finale était la plus élevée pour les IIR les plus longs. Par exemple, dans Bahrick (1979, Expérience 2), les participants apprenaient des paires de vocabulaire espagnol-anglais à six reprises, séparées par des intervalles de 1 jour, 7 jours, ou 30 jours. Un participant était confronté à des intervalles ayant toujours la même durée. Après un DR de 30 jours, ce sont les participants avec l’IIR de 30 jours qui ont obtenu les meilleures performances.

Dans les études présentées jusqu’à présent, qu’elles aient comporté deux répétitions ou plus, la durée de la phase d’apprentissage, c’est-à-dire la durée de l’intervalle entre la première et la dernière occurrence de l’item variait selon les conditions. On peut alors s’interroger : pour une même durée de la phase d’apprentissage et pour un même nombre de répétitions des informations, la façon d’agencer temporellement les répétitions au sein de la phase d’apprentissage influence-t-elle la rétention ? Par le terme d’agencement, nous nous référons au rapport entre les durées des IIR successifs (P1-P2, P2-P3, P3-P4, etc). Est-il plus efficace de programmer des intervalles successifs tous de même durée, ou de durée progressivement croissante, ou encore de durée progressivement décroissante ? C’est l’objet de la section suivante et, plus largement, du présent travail.