V.1.Résoudre l’identification lexicale

Nous avons abordé trois des questions liées à l’identification des mots de fonction et de contenu : l’intégration d’indices prosodiques ainsi que le traitement de ces indices provenant de sources diverses et dans une moindre mesure, la segmentation de ces mots.

V.1.1.Les indices prosodiques

Quelques articles ont étudié les indices prosodiques permettant la distinction entre les mots de contenu et les mots de fonction (Morgan et coll., 1996 ; Shi et coll., 1998 ; Durieux et Gillis, 2000 ; Monaghan et coll., 2003). Cette littérature stipule que de nombreux indices acoustiques et phonologiques peuvent être utilisés par diverses approches automatiques pour distinguer les mots de contenu et les mots de fonction. Nous avons retrouvé que la durée des voyelles est un indice important (cf. IV.1.1). En outre, nous avons prouvé que la fréquence fondamentale contenait des informations susceptibles d’améliorer cette distinction, mais plus particulièrement dans le cas du Français (cf. IV.1.2, IV.2.1 et IV.2.2).

Ensuite, nous avons proposé une interprétation en terme de perception de ces résultats en comparant les prototypes de la F0 à une représentation des pics de F0. En utilisant l’algorithme MOMEL qui a été démontré pour représenter les composantes macro-prosodiques de l’intonation, nous avons montré que les pics de F0 caractérisaient les mots de contenu en Français (cf. IV.1.4). Ceci suggère que l’intonation ne pouvait pas être représentée correctement par l’écart type des valeurs de F0 (normalisé par la durée) dans l’article de Shi et coll. (1998), étant donné que le taux d’identification est nettement supérieur au hasard dans notre cas, et ce même pour l’Anglais.

L’intonation ne semble pas avoir été examinée, pour savoir si les nouveau-nés peuvent l’utiliser pour l’identification des mots de fonction et de contenu. Etant donné la sensibilité des nouveau-nés pour les contours prosodiques, une expérience perceptuelle pourrait montrer leur aptitude à effectuer cette distinction lexicale à partir des pics de F0 .

Le fait que les mots de fonction soient rarement marqués par un pic de F0 exprime que ceux-ci sont moins saillants dans le signal de parole, ce qui rejoint l’hypothèse de « minimalité » exprimée pour les mots de fonction (Shi et coll., 1998).

Enfin, nous retrouvons également à travers d’autres indices que les mots de fonction sont minimaux. Effectivement, ces mots peuvent être distingués par leur durée, généralement plus courte que les mots de contenu. Ce dernier point nous amène à discuter les résultats proposés par Shi et coll. (1998). Ils tiennent compte dans leurs indices de la durée moyenne des syllabes ainsi que du nombre de syllabes. En conséquence ces indices combinés peuvent donner la durée totale des mots. Or, nous montrons dans notre étude que la durée des mots permet de distinguer, aux alentours de 80 %, les mots de fonction des mots de contenu. Leurs études indiquent que le meilleur indice (durée des voyelles) pris isolément a des performances moindres.