4.5.1. Les collections

Nous avons choisi de créer une collection principale par séance contenant l’ensemble des ces épisodes. Nous avons fait ce choix pour deux raisons :

Dans un premier temps l’ensemble des séances indexé en épisodes ce qui nous permettra dans la suite d’utiliser notre travail pour d’autres objectifs de recherche.
En effet, à l’inverse de certains travaux qui prennent une structure imbriquée de collections d’unité d’analyse comme par exemple le travail de Seck (2007, 2008), nous avons choisi de construire nos collections d’une façon « linéaire ». Si nous revenons à son travail³⁷, Seck explique l’architecture analytique qu’il a construite sur Transana comme suit :
« [À l’échelle microscopique, les] mots ou expressions considérés dans Transana comme des mots clés, sont identifiés et logés dans des micro-clips qui sont eux logés dans des collections appelées « collections de mots ou expression ». Ces dernières sont aussi logées à l’intérieur « les collections sous-thèmes » qui sont elles aussi logées dans « les collections de thèmes ». Nous obtenons ainsi une architecture imbriquée de ces collections ». Il précise que cela permet « de suivre la variété des mots ou expression que la classe utilise suivant les sous-thèmes et en même temps suivant les phases didactiques et les organisation de la classe, ce qui […] donne les conditions d’utilisation de ces mots » (idem, page, 106).
Nous pensons qu’une structure « linéaire » – sur la base de collection d’un seul niveau et prenant en compte l’ensemble des séances – permet une exploitation plus large de données qu’une structure arborescente. La procédure de création d’autres collections sera faite à partir des opérations booléennes effectuées sur la collection principale, celle des épisodes.
Dans un second temps , nous pensons – et nos observations multiples l’ont prouvée – qu’une décision est prise sous l’effet de plusieurs raisons présentes dans l’environnement de travail de l’enseignant. Nous aurions pu isoler les épisodes de contenu sans nous occuper des autres types puisque notre questionnement tourne autour des décisions chronogénétiques. Cependant, une raison qui se trouve dans un épisode de gestion de la classe peut avoir des conséquences sur les décisions présentes dans les épisodes de contenu.

Une autre raison de ce choix est que nous avons remarqué après notre découpage en épisodes que ces épisodes sont microscopiques et peuvent être élémentaires. À partir de ces unités nous pourrons construire des unités plus grandes sur l’échelle mésoscopique et macroscopique (telles que des unités thématiques (Cf. Badreddine & al, 2007)). D’un point de vue plus technique, nous avons évité de créer une structure arborescente complexe des collections d’épisodes afin d’optimiser le temps de « recherche » et d’exportation de nos traitements et de notre base de données. La structure linéaire que nous avons construite vise aussi à optimiser le temps de parcours d’un nombre important de données vidéographiques.

À partir des transcriptions déjà marquées par des repères temporels, nous avons créé des collections de clips d’épisodes pour chaque séance. Nous avons utilisé un système d’indexation des collections et des clips qui est cohérent avec la dénomination des fichiers vidéo dans le script de continuité.

La figure 8 représente l’ensemble des 26 collections de l’ensemble des 26 séances regroupées en clips.

Figure 7 Impression d’écran de l’ensemble des collections de notre banque de données vidéo.

Le clip « 03_S02A_16 » encadré dans la figure 8 correspond dans le script de continuité à l’épisode 16 de la séance « 2006_04_06 S02A_Prof_Eli ».

La dénomination des clips est dérivée de la dénomination dans les fichiers du script de continuité de la façon suivante :

Si nous revenons aux deux premières colonnes du script (tableau 13, ci-dessous) nous remarquons que cette dénomination (« 03_S02A_16 ») représente une forme réduite; nous avons remplacé la date par le numéro de passage de la séance (03) dans les deux classes ; nous avons supprimé l’acteur et l’établissement (Prof_Eli). Nous avons ajouté à cette dénomination un nouvel emplacement : un numéro du clip dans une séance. De cette façon chaque épisode aura un numéro unique dans la séquence qui pourra l’identifier. Le « 03_S02A_16 » (tableau 13) correspond, par conséquent, au 16ème épisode de la séance 2 de la classe A ; c’est la troisième séance de l’ensemble des deux classes.

Tableau 14 Mise en relation de la dénomination des séances dans le script de continuité et la dénomination dans Transana

Au fur à mesure de la construction de cette base de données, nous avons vérifié une deuxième fois le découpage en épisodes que nous avions fait ; ceci trois mois après le premier découpage. Cette étape nous a permis de remarquer la régularité du découpage.

Notes

37.

Ce travail est déjà cité dans le chapitre « cadre théorique », partie « une revue de travaux récents »