2.2.1. Nature des indices acoustiques

L’identité de chaque langue se définit à travers un ensemble de propriétés linguistiques de natures différentes :

  1. les unités segmentales et/ou suprasegmentales (caractérisées à l’intérieur de chaque système par leurs traits regroupent les informations de type : consonnes (modes et lieux d’articulation) ; voyelles (définies en fonction de leur degré d’aperture, leur caractère antérieur vs. postérieur et arrondies vs. non-arrondies, etc.) ; tons (variations de hauteur et/ou de mélodie affectées à certaines syllabes dans certaines langues) ; accents (mise en relief d’une — ou de plusieurs — syllabes dans une unité lexicale) et autres schémas prosodiques (variations de la fréquence fondamentale et organisation temporelle (rythme) des unités segmentales dans la chaîne parlée) caractéristiques de chaque langue et/ou dialecte.

  2. les règles de combinaisons — ou règles phonotactiques — régissent l’organisation des différentes unités pour chaque langue/dialecte.

  3. les fréquences d’occurrence relatives aux unités segmentales et/ou suprasegmentales en général, et aux combinaisons possibles de ces unités dans chaque langue/dialecte en particulier.

  4. les variations phonétiques rencontrées par chaque unité dans les différentes langues/dialecte.

D’un point de vue méthodologique, la mise en valeur de ces différentes unités s’effectue par le biais d’une analyse linguistique classique au cours de laquelle il s’agit :

  1. d’établir l’inventaire des segments distinctifs (i.e. unités phonologiques) et des principales réalisations phonétiques (i.e. variantes allophoniques) attribuées à chacun des segments pour chaque langue/dialectes.

  2. de définir les structures syllabiques mises en oeuvre par les différents systèmes ainsi décrits.

  3. de calculer la fréquence d’occurrence relative34 des différentes unités extraites par l’analyse dans les diverses langues/dialectes (i.e. phonème fréquent vs. rare, structure syllabique préférentielle etc.).

  4. d’observer les variations encourues par les unités distinctives en fonction (1) de la nature du contexte dans lequel elles s’inscrivent ; (2) des fluctuations de débit ; (3) de l’influence des facteurs socio-linguistiques (âge, sexe, niveau socio-économique du locuteur, etc.).

D’un point de vue plus global, les langues peuvent aussi être comparées sur la base de calculs statistiques effectués sur la fréquence fondamentale (Fo), des schémas d’évolution de la courbe de la fréquence fondamentale, et/ou enfin en fonction du rapport son voisé/son non-voisé qu’elles fournissent à l’analyse.

Notes
34.

Cet aspect est omis dans la plupart des descriptions phonétiques (à l’exception peut-être des études effectuées dans le cadre méthodologique de l’Ecole de Paris). Il possède pourtant dans le cadre de l’identification automatique des langues un intérêt non-négligeable. En effet, une connaissance de la fréquence relative assignée aux différents segments des langues du monde permettraient d’établir des modèles statistiques de reconnaissance basés sur la recherche d’unités dites « rares » (voir Hombert & Maddieson, 1999).