5.1.1.1. L’outil de discrétisation des données numériques

La recherche de points d'intérêt dans des courbes représentant des données analogiques est un problème très classique en mathématique analytique. C'est pourquoi nous sommes en mesure de proposer une relative standardisation de cet outil de collecte. Ces points "remarquables" des courbes sont présentés à la Figure 52.

Figure 52 : Points d'intérêt avec leurs propriétés d'intérêt.

Ces points sont classiquement :

  • Les franchissements de seuils.
  • Les extremums locaux (minimums et maximums).
  • Les points d'inflexion.

Les extremums locaux correspondent aux zéros de la dérivée première. Cela correspond au moment ou la pente de la courbe change de sens. Pour un maximum : avant ce point la courbe montait, après ce point elle descend et inversement pour un minimum.

Les points d'inflexion correspondent aux zéros de la dérivée seconde. Cela correspond à des maximums ou des minimums de variation de la courbe. Par exemple pour un point d'inflexion convexe ascendant : la courbe monte plus vite avant ce point et moins vite après ce point.

Nous nous sommes également intéressés aux zéros de la dérivée troisième qui correspondent à des maximums ou des minimums d'inflexion. Ces points sont parfois cités comme des indicateurs de charge mentale au motif qu'ils indiquent des corrections brusques effectuées par l'opérateur . Boer propose un indicateur de charge mentale qu'il nomme "entropie comportementale". Il choisit le terme "entropie" pour désigner une imprédictibilité du comportement. La fonction de prédictibilité qu'il utilise est une extrapolation par un polynôme de degré 2 (parabole) à partir des trois derniers points de mesure. Les points d'entropie de Boer correspondent donc à des maximums de la dérivée seconde, c'est pourquoi nous avons choisi de les inclure dans nos traces et de les désigner comme lui par le terme points d'entropie. Ils peuvent être vus comme des "chocs" sur la courbe, c'est-à-dire des moments ou la variation de la courbe est très brusque.

Notre outil de discrétisation des données analogiques accepte en entrée des paramètres propres à chaque variable :

  • Les paramètres appropriés de filtrage de la courbe (prétraitement).
  • Les valeurs de seuil significatives.
  • Le seuil d'inflexion minimum des points d'entropie.

Cet outil génère tous ces points d'intérêt et leurs propriétés associées, représentés à la Figure 52 : la valeur de la variable en ces points, la valeur de sa variation (dérivée), et la valeur du "choc" pour les points d’entropie (dérivée seconde). Ensuite, nous appliquons une sélection pour ne garder que les types de points réellement jugés utiles selon les variables. Ces différentes sources sont ensuite fusionnées pour produire la trace collectée représentée sur la Figure 53.

Sur cette figure, la ligne du bas représente la trace collectée. Les cercles de différentes couleurs représentent les événements en provenance de différentes sources. Leurs propriétés d'intérêt sont enregistrées dans la trace.

Figure 53 : Fusion des différentes sources dans la trace collectée

L’outil de discrétisation génère un fichier de type tableur, avec un événement par ligne et les propriétés en colonnes. Nous avons utilisé, pour ce fichier, le format CSV (Comma Separated Values), dans lequel les valeurs sont enregistrées au format texte, séparées par des virgules. C’est le standard de base pour enregistrer les données de type tableur. Ces fichiers peuvent être ouverts et visualisés avec Excel.

L'avantage de cette méthode d'extraction de points d'intérêt est sa simplicité et le fait qu'elle soit facilement comprise par des ergonomes ayant une culture mathématique standard. Il serait également intéressant d'appliquer des méthodes plus élaborées par exemple des méthodes basées sur des algorithmes markoviens telles que celles présentées au paragraphe 2.4.4.