3. Méthodologie

Ces hypothèses ont été envisagées pour ce qui est des résultats obtenus par des élèves de CE2 : d’une part, à l’évaluation nationale à l’entrée au CE2, d’autre part, à deux épreuves qui mettent à l’oeuvre la motricité de façon accrue.

L’étude effectuée consiste en l’enregistrement et l’analyse de performances que différents sujets ont réalisées à diverses épreuves. La pertinence de cette démarche est à discuter. On pourrait en imaginer une autre, visant à mesurer les effets d’un apprentissage au plan du transfert. Une phase d’apprentissage serait précédée d’un pré-test et suivie d’un post-test, ceux-ci concernant une situation de transfert. On pourrait envisager de proposer plusieurs situations de transfert ainsi que de comparer différents contextes d’apprentissage ; des groupes expérimentaux et un groupe témoin, au moins, seraient requis. Cette procédure peut paraître idoine à la vérification des deux hypothèses considérées. Elle apparaît cependant délicate à mettre en place à partir de l’analyse ayant conduit à formuler ces hypothèses. Il semble, d’une part, difficile de spécifier a priori et de façon exhaustive les situations de transfert correspondant à une phase d’apprentissage donnée. En proposer quelques-unes nécessite de plus l’adoption d’un présupposé relatif au transfert, ce qui est susceptible de biaiser la vérification des hypothèses. Ce postulat est aussi de nature à jouer quant à la perception du caractère plus ou moins favorable du contexte d’apprentissage. Aussi semble-t-il prudent, en première analyse, d’adopter une autre démarche.

Il s’agit de recueillir les performances de plusieurs sujets sur une série d’épreuves. Ce recueil autorise une confrontation de la distribution de résultats relatifs à une épreuve et de chacune de celles concernant les autres épreuves. Le repérage d’un lien significatif entre deux distributions, cependant, ne signifie pas en lui-même un transfert ou une transférabilité. Les sujets peuvent avoir réalisé parallèlement des apprentissages localisés expliquant leurs résultats aux épreuves concernées. Il en est autrement si les calculs indiquent que deux distributions de performances, Da et Db, sont liées, dont une seule, Db, l’est avec une troisième, Dc. Cela accréditerait l’idée que des parties différentes de ce qui sous-tend la performance relative à Db peuvent être utilisées pour en produire deux autres, concernant Da et Dc. Il est ainsi défendable d’exploiter les distributions de données engrangées pour envisager l’hypothèse relative aux « micro-expertises ». Il convient, en outre, d’étudier les performances de groupes d’élèves dont on estime que chacun a été placé dans un contexte d’enseignement le distinguant des autres. On peut juger qu’il en est ainsi si chaque groupe comporte les élèves d’une classe provenant d’une même classe de niveau inférieur, ces attributs étant discriminants. On peut alors déterminer s’il est, pour chaque groupe, des relations entre distributions de résultats qui le différencient des autres. Cela vaut, toutes choses étant égales par ailleurs, au regard de la vérification de l’hypothèse relative aux contextes d’acquisition.

Les choix du niveau de scolarité et des épreuves ayant occasionné le recueil des données sont dès lors à expliciter. Les évaluations nationales offrent la possibilité de faire passer à des élèves, dans un temps relativement court2160, plusieurs épreuves concernant différentes disciplines scolaires. Leur contenu est en outre censé correspondre à ce qu’on peut attendre d’un élève à un moment donné de son cursus : suivant le cas, à l’entrée au CE2, en sixième ou bien en seconde. Le brassage des élèves à l’entrée en sixième ou en seconde rend difficile la constitution de groupes ayant les caractéristiques requises ; cela explique que l’expérimentation a porté sur des enfants de CE2 (tableaux n° 1 et 2). L’adjonction d’épreuves mettant à l’oeuvre la motricité de façon accrue se justifie par un souci d’ouverture. D’une part, l’évaluation nationale n’a trait qu’au français et aux mathématiques. D’autre part, l’analyse conduisant aux hypothèses n’a intégré que des références concernant des réalisations en lesquelles la motricité n’a pas place majeure. Or, il en est, à l’Ecole, qui la requièrent de façon essentielle, notamment en EPS. Le choix des épreuves est fonction, pour partie, du souci de leur adéquation à l’âge des sujets. L’épreuve de Harre (tableau n° 3) est censée convenir aux enfants de premier âge scolaire2161. Un sprint plat sur une distance correspondant aux dimensions de ce parcours à obstacles est également adapté à leurs possibilités. Ces épreuves autorisent, par ailleurs, trois prises de performances : le chronométrage de deux temps ainsi que la détermination d’un taux. Or, l’ensemble des épreuves concernées est à passer dans un laps de temps court pour que les distributions de performances engrangées autorisent un examen au regard du transfert. Ainsi envisagées les différentes épreuves peuvent être passées par tous les sujets en une semaine.

La constitution des groupes d’élèves considérés s’explique en partie du fait des contraintes relatives à l’expérimentation. On a en fait exploité des résultats engrangés en début d’année scolaire 1994-1995. Ils concernent en effet trois groupes dont les caractéristiques autorisent l’étude envisagée. Les élèves de chaque groupe appartiennent à une même classe de CE2 et proviennent d’une même classe de CE1. Cette appartenance et cette provenance distinguent les élèves d’un groupe de ceux des autres groupes. Les performances relatives à un groupe, G1, G2 ou G3, doivent en outre pouvoir être comparées à celles concernant les deux autres, au regard de l’étude envisagée. L’examen de cette comparabilité a porté sur plusieurs paramètres. L’âge des sujets a été pris en considération. Il peut être révélateur de difficultés scolaires aiguës, il peut signifier aussi des potentialités intellectuelles ou physiques diverses. Il a été pris en compte en nombre de jours au premier septembre 1994. Le niveau intellectuel a, de plus, été considéré. Il peut rendre compte de la diversité des possibilités intellectuelles des sujets. Un quotient intellectuel a été déterminé pour chaque élève, suite à la passation d’un test (ECNI2162), à la rentrée de septembre 1994. La taille, le poids et le rapport taille / poids ont été également envisagés. Ils sont de nature à réfracter les possibilités physiques des sujets, même s’il est des procédures de spécification de l’âge biologique nettement plus fines2163. Ils sont aussi indicateurs d’éventuelles disparités physiques en regard des contraintes du parcours de Harre : celui-ci nécessite, notamment, des passages sous un banc. Ces données ont été mesurées le jour de la passation des épreuves de Harre et de sprint plat. G1, G2 et G3 se composent des élèves qui ont effectivement produit une performance à toutes les épreuves. Les effectifs sont de 14 en chaque cas : 5 filles et 9 garçons pour G1, 8 filles et 6 garçons pour G2 ainsi que pour G3. Compte tenu des caractéristiques des distributions en présence, le test de Kruskal et Wallis a été utilisé. Les résultats (avec correction compte tenu des rangs ex æquo) signifient qu’il est cohérent de confronter les distributions de performances (tableau n° 4).

Les modalités de passation et le recueil des données dont elles ont fait l’objet sont dès lors à présenter. Les épreuves de l’évaluation nationale CE2 se sont déroulées suivant les indications du document relatif à leur présentation2164. Le relevé de réponses fourni appelle à déterminer huit scores2165. Les intitulés concernant le français sont : « compréhension » (Fc), « connaissance du code » (Fcc), « production de texte » (Fpdet), « le temps et l’espace » (Ft&e). Pour ce qui est des mathématiques, on a : « travaux géométriques » (Mtg), « mesures » (Mm), « travaux numérique » (Mtn), « résolution de problèmes à données numériques » (Mrpb). Différents codages sont à porter sur le relevé de réponses. Seuls ceux signifiant la production d’une réponse attendue ont été pris en compte. Les autres, indiquant une réponse partielle, exacte pour une part seulement ou erronée n’ont pas été retenus : ils relèvent d’un autre niveau d’analyse. L’épreuve de Harre consiste en une course d’adresse. Les sujets effectuent un essai, puis passent l’épreuve ; ils sont alors filmés. Les images obtenues autorisent un chronométrage précis : on enregistre le temps compris entre le signal de départ et le franchissement par le buste du plan vertical contenant la ligne d’arrivée. Si la réalisation est erronée, l’essai est nul : les essais annulés n’ont pas été pris en compte ; ils ont été relativement rares (1 à 3 cas selon la classe). L’épreuve de sprint plat est réalisée sur une distance correspondant à la limite inférieure de celles réalisables sur le parcours de Harre. Elle occasionne une prise de performance s’opérant de la même manière que sur celui-ci. On peut alors disposer de deux temps, soit H relatif au parcours à obstacles, soit V concernant le sprint plat. Ils autorisent le calcul d’un taux, (H-V)/V, ou T. On enregistre ainsi trois performances.

Les données recueillies ont fait l’objet d’un traitement. Les distributions de résultats relatifs à V, H ou T sont à mettre en regard, pour chaque groupe d’élèves. L’examen des épreuves de l’évaluation nationale CE2 conduit à s’interroger quant aux résultats à considérer. Il est demandé aux enseignants de remplir des relevés de réponses concernant Fc, Fcc, Fpdet, Ft&e, Mtg, Mm, Mtn et Mrpb. La lecture du document présentant les épreuves conduit à envisager l’éventualité d’autres regroupements des performances2166. Il convient toutefois de remarquer que chaque rubrique du relevé de réponse est censée rendre compte d’un niveau et de difficultés dans un domaine de connaissance particulier : chacune en effet correspond à un croisement entre un ou plusieurs champs d’application et objectifs de compétence qui lui est particulier2167. Ces observations invitent dès lors à examiner les données telles qu’elles sont à consigner dans le relevé de réponses. Une étude statistique a été effectuée pour déterminer, par groupe, les liens entre distributions de performances. Les caractéristiques de ces distributions invitent à user d’un test non paramétrique ; le test de Spearman a été employé (calculs avec correction compte tenu des rangs ex æquo). L’inverse de chacune des valeurs de V, H et T a été pris en compte, pour rendre plus lisibles les résultats : plus le chiffre relatif à V, H ou T est important et moins la performance est bonne quand c’est le contraire dans les autres cas considérés. Les signes des coefficients de corrélation calculés ont ainsi tous même signification. 

Les résultats des calculs sont malgré tout à décrypter et doivent occasionner de nouveaux calculs. Pour un groupe d’élèves donné, seuls certains coefficients de corrélation positifs et significatifs concernant deux distributions sont de nature à accréditer l’hypothèse relative aux « micro-expertises » : les calculs doivent signifier qu’il est au plus un coefficient de corrélation positif et significatif concernant chacune d’elles et une troisième. Les coefficients de corrélation de Spearman calculés sont à examiner à nouveau pour vérifier l’hypothèse qui a trait aux contextes d’apprentissage. Pour deux groupes donnés, seuls ceux portant sur des distributions qui ne sont pas significativement différentes peuvent l’accréditer. Il convient alors de mettre en place le test de Mann et Whitney (calculs avec correction suivant les rangs ex æquo). Les calculs peuvent signifier que les données ne sont pas exploitables pour vérifier l’hypothèse qui a trait aux contextes d’apprentissage. Ils peuvent en effet indiquer que les distributions concernées diffèrent de façon significative. Il est possible, alors, de composer des sous-groupes, au sein des groupes concernés, dont les distributions de performances considérées ne diffèrent pas significativement. Il convient, de plus, de vérifier leur comparabilité au regard de l’âge, du quotient intellectuel, de la taille, du poids, du rapport taille / poids.

4. Résultats (tableau n° 5)

On peut vérifier les hypothèses considérées pour ce qui est de deux ensembles d’épreuves : d’une part, celles de l’évaluation nationale CE2, d’autre part, celles de Harre et de sprint plat. Il est envisageable, en outre, d’étudier les hypothèses en confrontant les performances produites au premier ensemble d’épreuves à celles réalisées au second. Il s’agit, en tout état de cause, d’examiner les coefficients de corrélation de Spearman calculés.

Seulement certains d’entre eux peuvent être de nature à accréditer l’hypothèse relative aux « micro-expertises ». Ils sont dès lors à trier. Il convient ainsi de s’enquérir des résultats indiquant qu’on a affaire à :

On peut alors considérer qu’on a effectivement un coefficient de corrélation positif et significatif concernant Da et Db. On peut en outre juger qu’il y a lieu d’en retenir un autre, au moins, relatif à Db et Dc ou à Db et D: il en est en ce cas au moins un qu’on ne peut suspecter d’être significatif simplement parce qu’une même variable influence deux variables mises en relation. On observe de plus qu’il n’est pas de coefficient de corrélation positif et significatif pour Da et Dc ainsi que Da et Dd. Ce cas de figure est alors cohérent avec l’hypothèse relative aux « micro-expertises »(tableaux n° 6 et 7).

La vérification de l’hypothèse concernant les contextes d’apprentissage appelle également un tri des coefficients de corrélation calculés. Il est judicieux de retenir ceux qui, pour un groupe donné, concernent toute distribution Da corrélée avec une seule autre distribution Db (coefficient de corrélation positif et significatif). Pour vérifier l’hypothèse considérée, il convient de s’intéresser aux observations qui, parmi celles-ci, concernent des distributions de performances qui ne diffèrent pas significativement. Il s’agit en effet de faire la part entre : ce qui peut procéder des niveaux des sujets dans les épreuves concernées et ce qui relève effectivement de leur appartenance à l’un des groupes en présence. Le test de Mann et Whitney pour les distributions considérées conduit à retenir les résultats autorisant la vérification visée. Il s’agit alors de déterminer si on a affaire au cas de figure suivant :

On a ainsi un coefficient de corrélation positif et significatif entre Da et Db pour un groupe d’élèves quand il n’en est rien pour l’autre. Chacune des deux distributions d’un groupe ne diffère en outre pas de manière significative de celle correspondante de l’autre groupe. De tels résultats sont alors de nature à accréditer l’hypothèse concernant les contextes d’apprentissage.

L’examen des coefficients de corrélation de Spearman calculés conduit à signaler un résultat qui vaut en tant que cas particulier. Il concerne la confrontation d’une distribution relative à l’évaluation nationale CE2 à une distribution qui a trait aux épreuves sollicitant la motricité de façon accrue (tableaux n° 6 et 7). On repère, pour G3, deux coefficients de corrélation négatifs et significatifs :

Il est prudent de ne pas exploiter ces résultats pour ce qui concerne l’hypothèse relative aux « micro-expertises » : pour G3, en effet, D1/H est corrélée (coefficient de corrélation positif et significatif) avec D1/T. Ces résultats ne sont pas, au demeurant, de nature à invalider l’hypothèse considérée. Les résultats du test de Mann et Whitney indiquent qu’on ne peut, non plus, les utiliser pour envisager l’hypothèse concernant les contextes d’apprentissage (tableau n° 8). Ce cas particulier au regard de l’ensemble des données examinées, en tout état de cause, n’occasionne pas sa mise en question. Ils suggèrent une possibilité de transfert négatif ou une impossibilité à réaliser un transfert requis.

Les calculs relatifs aux résultats obtenus à l’évaluation nationale CE2 font apparaître des coefficients de corrélation de Spearman positifs et significatifs. Il en est un pour G1 et onze pour G2 comme pour G3. On ne peut cependant les exploiter tous pour vérifier l’hypothèse relative aux « micro-expertises ». On observe le cas de figure recherché pour ce qui est de G3. Les distributions de performances concernées sont relatives à : Fpdet, Mtn, Mrpb et Fcc. On a en effet :

On peut considérer, à partir de ces observations, que ce qui cause la performance pour Mtn sous-tend en partie la performance pour Fpdet ainsi que pour Mrpb ou Fcc ; on peut observer, aussi, que ce qui détermine les résultats dans le cas de Fpdet n’est pas ce qui les fonde pour Mrpb ou Fcc. Ainsi peut-on envisager que deux parties différentes de ce qui est utile à la réalisation de Mtn sont utiles à celles de : Fpdet, d’une part, Mrpb ou Fcc, d’autre part.

La vérification de l’hypothèse concernant les contextes d’apprentissage appelle aussi un tri des coefficients de corrélation positifs et significatifs concernant les performances à l’évaluation nationale CE2. On retient que :

Ces observations autorisent une mise en regard de G1, G2 et G3. On s’aperçoit alors que :

Il s’agit cependant de ne s’intéresser qu’aux observations qui, parmi celles-ci, concernent des distributions de performances qui ne diffèrent pas significativement pour les groupes concernés. Le test de Mann et Whitney pour les distributions considérées conduit à retenir les résultats suivants (tableau n° 9) :

Il apparaît ainsi que des distributions de performances qui ne sont pas significativement différentes sont corrélées différemment suivant qu’on a affaire à G1, G2 ou bien G3.

Il s’agit, par ailleurs, d’examiner les coefficients de corrélation de Spearman concernant les épreuves de Harre et de sprint plat. Pour ce qui est de la vérification de l’hypothèse relative aux « micro-expertises », on a, dans le cas de G1 :

En ce cas, la distribution de performances sur le parcours de sprint (D1/V) est corrélée avec celle des résultats sur le parcours de Harre (D1/H). Seule la seconde est corrélée avec celle des taux (D1/T). Ces résultats donnent à penser que plus on court vite sur le parcours de sprint plat, plus il est probable qu’on réalisera le parcours de Harre rapidement. La distance à effectuer en sprint plat correspond en outre à celle minimale réalisable sur le parcours de Harre. Ce qui sous-tend la performance sur celui-ci apparaît alors de nature à contribuer au résultat obtenu sur celui-là. En outre, le taux calculé indique le temps additionnel à celui relatif au sprint plat dû aux contraintes du parcours de Harre, rapporté au temps réalisé en sprint plat. La distribution des taux (D1/T) est corrélée avec celle des performances sur le parcours de Harre mais pas avec celle concernant le sprint plat (D1/V). C’est alors que ce qui détermine la gestion des contraintes propres au parcours de Harre ne dépend pas de ce qui permet de négocier les phases de sprint plat. Il est question de deux déterminants distincts.

Des résultats apparaissent, dans un premier temps, à retenir, pour ce qui est de la vérification de l’hypothèse qui a trait aux contextes d’apprentissage. On repère que D1/V est corrélée avec D1/H pour G1 (coefficient de corrélation positif et significatif) et ne l’est pas pour G2 et G3. Les résultats du test de Mann et Whitney concernant les distributions relatives à V, H et T sont cependant décevants : on ne peut exploiter les coefficients de corrélation de Spearman calculés pour vérifier l’hypothèse considérée (tableau n° 9). Il convient alors de s’intéresser à des sous-groupes, par exemple de G1 et G2, qui occasionneraient des distributions ayant les caractéristiques requises pour cette vérification. On dispose de sous-groupes de ce type si on élimine les données relatives à quatre sujets : celles concernant les deux sujets les plus rapides de G1 et les deux sujets les moins rapides de G2 sur l’épreuve de sprint plat. On obtient alors les sous-groupes SG1 et SG2 (tableau n° 10). Les résultats du test de Mann et Whitney signifient des distributions de performances quant à V, H et T qui ne diffèrent pas significativement d’un groupe à l’autre. Ils indiquent qu’il en est de même de celles concernant l’âge, le quotient intellectuel, la taille, le rapport taille / poids. On observe alors que :

Ainsi des distributions de performances qui ne diffèrent pas de façon significative apparaissent-elles corrélées différemment suivant qu’on a affaire à SG1 ou bien SG2.

Les résultats expérimentaux ainsi présentés sont dès lors à discuter. Il s’agit de les considérer en regard des hypothèses examinées ainsi que de poursuivre la réflexion au transfert d’apprentissage.

Notes
2160.

Ministère de l’éducation Nationale, Direction de l’évaluation et de la prospective, Evaluation à l’entrée au CE2 (début du cycle des approfondissements), Français / Mathématiques, Présentation, consignes de passation, consignes de codage, commentaires, Document à l’attention du maître, 1994, p. 2

2161.

Harre (D.), Trainingslehre, Sportverlag, Berlin, 1976, p. 182

2162.

EAP, INETOP, CNAM, Echelle Collective de Niveau Intellectuel, Issy-les-Moulineaux : Editions scientifiques et psychologiques, 1988

2163.

Sempe (M.), La pédiatrie au quotidien : l’analyse de la maturation squelettique, Paris : Doin, 1987, pp. 8-14, 26-27, 33, 72-72, 84-88

2164.

Ministère de l’éducation Nationale, Direction de l’évaluation et de la prospective, Op. Cit., p. 3

2165.

Ministère de l’éducation Nationale, Direction de l’évaluation et de la prospective, Evaluation à l’entrée au CE2 (début du cycle des approfondissements), Français / Mathématiques, Relevé de réponses, Document à l’attention du maître, 1994, pp. 2-9

2166.

Ministère de l’éducation Nationale, Direction de l’évaluation et de la prospective, Evaluation à l’entrée au CE2 (début du cycle des approfondissements), Français / Mathématiques, Présentation, consignes de passation, consignes de codage, commentaires, Document à l’attention du maître, 1994, p. 8, 47

2167.

Ministère de l’éducation Nationale, Direction de l’évaluation et de la prospective, Op. Cit., p. 8, 47