La statistique comme discipline de service.

Par discipline de service, nous entendons discipline-outil au service des études et des recherches en sciences de l’éducation. Certes en tant que discipline de base, la statistique a à remplir sa fonction de discipline-outil, mais l’inverse n’est plus vrai. En tant que discipline de service, nous pourrions éventuellement la considérer comme optionnelle, non sans risque. En tout état de cause elle resterait fortement conseillée et les travaux d’étude pourraient comporter systématiquement une approche statistique pour limiter l’évitement. À l’idée de service pourraient être rattachées celles d’offre et de demande. Dans le domaine des sciences de l’éducation, les enseignements sont offerts, dans le cadre d’un service public, supposant répondre à une demande à la fois sociale et individuelle. Depuis 1991, nous avons cherché à explorer et à comprendre cette demande. Par l’intermédiaire de questionnaires et d’entretiens, nous avons tenté d’identifier les représentations et les croyances de nos étudiants à l’égard de la statistique et de ses usages. Dans notre contribution ‘« Le transfert de connaissances en statistique »’ [1994e] inscrite dans cette perspective, nous avons tenté de problématiser l’enseignement de la statistique. L’étude : ‘« La statistique : ses représentations et ses usages didactiques et pédagogiques à l’école élémentaire’. » (Coutanson 1999) conduite par Bernard Coutanson sous notre direction confirme le déficit de formation en statistique chez les enseignants de l’école primaire et même parfois le désintérêt fondé sur des représentations des connaissances requises qui les placent à un niveau excessif de complexité. Notons que cette catégorie d’enseignants constitue une partie des étudiants traditionnellement accueillis en sciences de l’éducation.

Cependant offrir un enseignement de discipline-outil ne se réduit pas à enseigner des notions-recettes et des algorithmes-recettes à visée utilitariste. De nos investigations, il ressort que les questions  articulées autour de l’idée centrale : de quoi avez-vous besoin qui se rattache à la statistique ? suscitent des réponses plutôt floues ou souvent pauvres pour pouvoir construire une offre de formation de statistique congruente à la somme des demandes individuelles, adressables en début de cycle universitaire. Quand elles sont sous-tendues par une logique de validation, c’est à dire celles des étudiants qui fixent le primat de l’obtention du diplôme sur la formation, ces réponses évoquent essentiellement l’évitement par la remise en cause de la fiabilité même des modèles statistiques ou par le coût excessif d’apprentissage. Sous-tendues par une logique de formation qui pose le primat de l’acquisition des connaissances et des compétences sur la certification, elles évoquent certes le bien-fondé mais en déplorant le coût d’apprentissage en relation à la durée et même la difficulté de concevoir clairement ce à quoi peut bien servir la statistique.

Durant les trois années universitaires de 1995 à 1998, nous avons assuré un séminaire libre d’une heure hebdomadaire, sorte de consultation statistique, visant à ‘« offrir à tout étudiant désirant recourir à des méthodes statistiques dans le cadre des travaux de recherche liés à la réalisation du mémoire’ ‘ 189 ’ ‘, une assistance technique. Cette séance est aussi l’occasion de découvrir par l’usage, un logiciel de traitement statistique : CHADOC. ’» 190 Ces séances qui se déroulaient dans une salle équipée d’ordinateurs, constituèrent un cadre pour nos investigations sur les attentes des étudiants quant à la discipline-outil statistique. Elles nous apportaient aussi des informations relatives aux effets de l’enseignement de statistique que nous assurions et la question du transfert des connaissances. Ce que nous en avons tiré, c’est que la demande des étudiants ne s’exprime que rarement durant la période de construction de la problématique de leur mémoire. Certes, d’une manière confuse et vague, ils envisagent bien comment ils vont opérer la validation/réfutation de leurs hypothèses. Mais la réflexion méthodologique, c’est à dire celle portant sur les méthodes à mettre en œuvre, sur leur pertinence, sur leur faisabilité, ne parvient pas à anticiper suffisamment tôt les problèmes relatifs à la construction des données et à leurs traitements. Ce n’est qu’après avoir recueilli leurs données par questionnaire ou par entretien, que, démunis face à la masse d’informations, les étudiants lançaient leur appel à l’aide et venaient nous rencontrer. Notre intervention en tant qu’expert à ce niveau du chemin, peut s’avérer délicate. En effet des données de mauvaise qualité issues d’outils trop défectueux ou de protocoles trop peu fiables ou des données non pertinentes relativement à l’objet d’étude ne peuvent produire des résultats à la hauteur des attentes qu’exprime la demande de l’étudiant, même soumises à des traitements sophistiqués fondés sur des outils statistiques robustes 191 . L’offre ne peut alors satisfaire la demande. Nous avons pu observer chez certains étudiants un effet de retour qui les confortait dans leur désintérêt pour la statistique et dans l’inutilité de leur effort, dans la mesure où nous nous trouvions dans l’incapacité de mobiliser des traitements statistiques satisfaisants re-qualifiant les données. Les échanges que nous avions au cours des entretiens, finissaient par faire surgir qu’ils se réjouissaient de n’avoir pas trop investi pour apprendre la statistique. Toutefois nous avons pu aussi observer des conduites inverses par lesquelles les étudiants s’engageaient dans un processus d’apprentissage du type tâtonnement expérimental, par lequel ils ont accédé à des connaissances en statistique et à un niveau de compétence leur permettant de conduire des traitements statistiques en autonomie. L’usage même du logiciel Chadoc a favorisé ce développement.

À ce jour où nous rédigeons cette note de synthèse, il nous semble que les neuf années d’expérience d’enseignement de statistique et d’encadrement de travaux de recherche et d’étude nous ont permis d’avancer dans les champs de la pédagogie et de la didactique universitaires de la statistique conçue comme discipline de service.

Toutefois, la pratique de l’enseignement se réalise principalement en situation frontale, autrement dit sous forme de cours magistraux face à un groupe très hétérogène 192 de plus d’une centaine d’étudiants. Les situations problèmes que nous avons progressivement construites pour accompagner cet enseignement, ont donné lieu aux publications [1996e] et [1997i] mises à la disposition des étudiants. Chacune constitue, à sa manière, un cadre d’étude plausible transposable à une situation analogue qu’un étudiant pourrait mobiliser dans son étude pour le mémoire. Chacune comporte une difficulté qui a émergé lors de son étude même. Citons, pour exemple, la question des données manquantes qui surgit d’une situation visant l’étude d’une variable ‘« nombre de réussites à un QCM’ » dans laquelle nous avions introduit des absents dans le tableau de série statistique correspondante. Ou encore la question du lissage de l’histogramme [1997d] qui, lors de la construction d’un polygone des fréquences, permit de révéler des obstacles de type bachelardien auxquels les étudiants se sont trouvés confrontés.

Quant à l’encadrement, il se déroule sur un mode plus individuel et personnalisé permettant un recours plus systématisé à un logiciel de statistique. Là, nous avons pu trouver matière à donner un sens à la nature des variables statistiques et l’importance du choix. En effet la constitution de la base de données, c’est à dire le tableau des séries statistiques, impose des déclarations préalables des variables statistiques selon leur nature qualitative ou quantitative. Cette compétence requise par l’usager pour qu’il soit autonome dans la première phase que constitue la saisie des données, correspond à la question posée systématiquement dans les documents ‘« proposition de traitement’ » des situations problèmes : de quoi s’agit-il ? à l’heure actuelle, quand il s’agit des variables qualitatives, c’est le choix même du logiciel qui est en cause : le fait qu’elles soient qualitatives fermées va renvoyer à un logiciel (Spad_N, Chadoc) alors que des variables qualitatives ouvertes requièrent un autre logiciel (Spad_T).

Notes
189.

Ici, l’élaboration du mémoire concerne la licence, la maîtrise et le DEA. À ces étudiants viennent s’ajouter des doctorants.

190.

extrait de la présentation du cours intitulé Aide à la mise en pratique des approches statistiques figurant dans le Guide de l’étudiant de l’ISPEF- Lyon 2

191.

La robustesse en statistique correspond au fait que des traitements peuvent être appliqués même si les conditions théoriques mathématiques ne sont pas absolument vérifiées. Les propriétés des outils robustes demeurent acceptables dans un voisinage des conditions théoriques. Exemple : un test qui requiert que la variable étudiée soit de type Laplace-Gauss, reste applicable pour une variable non gaussienne dont l’histogramme suggérerait un histogramme gaussien.

192.

Cette hétérogénéité est à considérer selon plusieurs facteurs : âge, rapport à la statistique, parcours personnel et professionnel, niveau de connaissance et de compétence dans le domaine de la statistique, stratégies d’étude (logique de formation, logique de certification)