IV.1.5.Prototypes prosodiques

IV.1.5.1.Création des prototypes prosodiques

Dans cette section, nous allons étendre les travaux concernant les prototypes de F0, au corpus MULTEXT, et intégrer un plus grand nombre de dimensions prosodiques : F0, amplitude, F1, F2, F3, et les variations de F1, F2 et F3, soit 8 dimensions présentées en fonction du temps. En outre, nous utiliserons un ensemble de 15 mesures statistiques pour chaque dimension :

  1. première valeur ;
  2. valeur finale ;
  3. valeur maximale ;
  4. position du maximum ;
  5. valeur minimale (différente de 0) ;
  6. position du minimum ;
  7. moyenne ;
  8. écart type ;
  9. rapport de la durée des valeur non nulles par la durée des valeurs nulles ;
  10. nombre de montée et descente (données par le changement du signe de la variation) ;
  11. nombre de montée et descente divisé par la durée ;
  12. moments d’ordre 2 à 5 (Le moment d’ordre 2 est en lien avec la variance, celui d’ordre 3 avec le Skewness, celui d’ordre 4 avec le Kurtosis).

Nous obtenons donc un vecteur de 120 composantes qui représente un mot ou un groupe de mots de même type lexical. Nous appliquons une analyse discriminante pour évaluer les performances de classement de ces 120 indices, et leur contribution par rapport à la durée des mots (ou des groupes de mots le cas échéant).