III.1.3.Le corpus LSCP

Il s’agit d’un corpus multilingue (18 langues en tout), créé à l’origine par Thierry Nazzi (Nazzi et coll., 1998). Ce corpus comporte 54 phrases écrites en Français, et traduites approximativement dans chacune des autres langues. Ces phrases sont déclaratives et typiques de bulletins d’informations radiophoniques. Elles ont été lues par 4 locutrices natives de chaque langue qui énoncent chacune 5 phrases. Chacune de ces phrases est relativement courte : autour de 2 à 3 secondes de signal de parole. Huit d’entre elles ont été segmentées en consonnes et voyelles par F. Ramus. Nous avons étudié les paires de langues utilisées dans les expérimentations chez le nourrisson (Nazzi et coll., 1998), pour simuler ces expériences en employant le réseau TRN pour traiter directement une représentation spectrographique des basses fréquences du signal acoustique (section IV.4).