Nous avons choisi de créer une collection principale par séance contenant l’ensemble des ces épisodes. Nous avons fait ce choix pour deux raisons :
Une autre raison de ce choix est que nous avons remarqué après notre découpage en épisodes que ces épisodes sont microscopiques et peuvent être élémentaires. À partir de ces unités nous pourrons construire des unités plus grandes sur l’échelle mésoscopique et macroscopique (telles que des unités thématiques (Cf. Badreddine & al, 2007)). D’un point de vue plus technique, nous avons évité de créer une structure arborescente complexe des collections d’épisodes afin d’optimiser le temps de « recherche » et d’exportation de nos traitements et de notre base de données. La structure linéaire que nous avons construite vise aussi à optimiser le temps de parcours d’un nombre important de données vidéographiques.
À partir des transcriptions déjà marquées par des repères temporels, nous avons créé des collections de clips d’épisodes pour chaque séance. Nous avons utilisé un système d’indexation des collections et des clips qui est cohérent avec la dénomination des fichiers vidéo dans le script de continuité.
La figure 8 représente l’ensemble des 26 collections de l’ensemble des 26 séances regroupées en clips.
Le clip « 03_S02A_16 » encadré dans la figure 8 correspond dans le script de continuité à l’épisode 16 de la séance « 2006_04_06 S02A_Prof_Eli ».
La dénomination des clips est dérivée de la dénomination dans les fichiers du script de continuité de la façon suivante :
Si nous revenons aux deux premières colonnes du script (tableau 13, ci-dessous) nous remarquons que cette dénomination (« 03_S02A_16 ») représente une forme réduite; nous avons remplacé la date par le numéro de passage de la séance (03) dans les deux classes ; nous avons supprimé l’acteur et l’établissement (Prof_Eli). Nous avons ajouté à cette dénomination un nouvel emplacement : un numéro du clip dans une séance. De cette façon chaque épisode aura un numéro unique dans la séquence qui pourra l’identifier. Le « 03_S02A_16 » (tableau 13) correspond, par conséquent, au 16ème épisode de la séance 2 de la classe A ; c’est la troisième séance de l’ensemble des deux classes.
Au fur à mesure de la construction de cette base de données, nous avons vérifié une deuxième fois le découpage en épisodes que nous avions fait ; ceci trois mois après le premier découpage. Cette étape nous a permis de remarquer la régularité du découpage.
Ce travail est déjà cité dans le chapitre « cadre théorique », partie « une revue de travaux récents »