3.1.1. Maîtrise du voisement

La maîtrise du voisement est également intimement reliée à la taille du tractus vocal de l’enfant. Articulatoirement, le voisement correspond aux vibrations périodiques des cordes vocales (CsVs) (Jakobson et Halle 1956). En phonologie, on sait depuis l’étude de Lisker et Abramson (1964) que la définition du trait [±voisé] ne suit pas une définition acoustico-articulatoire stricte. Par exemple, en anglais les occlusives portant le trait [+voisé] en attaque de syllabe accentuée ne sont pas, à strictement parler, voisées, le voisement de ces consonnes ne se manifestant qu’après l’explosion. Comme le souligne Serniclaes (1987), en anglais, le VOT 16 (Voice Onset Time) dépend de l’accentuation et de la position de l’occlusive dans la syllabe. En position initiale et dans une syllabe accentuée, les occlusives sourdes de l’anglais sont aspirées et leur VOT moyen est de l’ordre de 70 ms (Lisker et Abramson 1967, Klatt 1975). En ce qui concerne les occlusives sonores, elles sont fréquemment dévoisées. En français, par contre, les occlusives sonores [b], [d] et [ɡ] suivent la définition acoustico-articulatoire du voisement, leur VOT est négatif ce qui veut dire que leur voisement se manifeste avant l’explosion de la consonne (57).

(57) VOT en français et anglais (valeurs de VOT en ms tirées de Serniclaes 1987)

En ce qui concerne la difficulté articulatoire des consonnes prévoisées du français, un premier indice nous est donné par la comparaison du nombre d’occlusives voisées par rapport aux occlusives non voisées dans les systèmes phonologiques des langues du monde. D’une manière générale, d’après la base de données UPSID 17 recensant les systèmes phonologiques de 451 langues (Maddieson 1984, Maddieson et Precoda 1990), ce sont les obstruantes non voisées qui sont les plus nombreuses. Ainsi, en moyenne, 70% des obstruantes (occlusives, fricatives et affriquées) d’un système phonologique sont non voisées.

Les occlusives voisées (comme les occlusives aspirées de l’anglais) sont en effet moins naturelles et plus difficiles à prononcer que les occlusives dont la valeur de VOT oscille entre 0 et 30 ms. Ainsi, c’est ce type d’occlusives qui est produit par les enfants aux environ d’un an (p. ex. Preston et al. 1967 ; Enstrom 1982). Cette constatation n’est pas dépendante de la langue maternelle (Kewley-Port et Preston 1974). La simplicité articulatoire des occlusives dont le VOT est légèrement positif est confirmée par les recherches sur la production de la parole chez les malentendants. Ces locuteurs parviennent à produire correctement les occlusives sonores dévoisées de l’anglais (VOT = 15 ms) tandis qu’ils éprouvent des difficultés particulières à prononcer les occlusives aspirées (Monsen 1976, Serniclaes 1984). La simplicité articulatoire des occlusives ayant un VOT compris entre 0 et 30 ms provient du fait qu’elles ne demandent pas de coordination temporelle très précise entre les mouvements de la glotte et ceux des articulateurs de la bouche (Serniclaes 1987).

De plus, d’un point de vue aérodynamique, le maintien d’un voisement pour les occlusives prévoisées est plus difficile pour les occlusives vélaires que pour les occlusives alvéolaires ou bilabiales, la présence de voisement étant liée à une différence de pression entre la cavité sub-glottique et supra-glottique (Ohala et Riordan 1979). Ainsi, si rien ne se passe dans le tractus vocal et que les CsVs sont ouvertes, la pression de l’air est la même peu importe l’endroit où l’on se trouve dans l’espace qui va des poumons aux lèvres. Lors de la phonation (le voisement), les CsVs sont accolées et tendues. Elles vont donc dans un premier temps retenir l’air qui arrive des poumons avec pour effet de faire augmenter la pression dans la cavité sub-glottique (Psub), la pression Psupra de l’autre côté de la glotte (dans les cavités supra-glottiques) restant la même a). Après un temps, Psub augmente tellement que les CsVs vont céder et s’ouvrir et, puisque Psub est supérieure à Psupra, l’air va s’échapper dans les cavités supra-glottiques (58b). Ceci va faire baisser significativement Psub avec pour effet d’accoler à nouveau les CsVs (effet Bernoulli, sachant que cet effet seul ne permet pas d’expliquer l’accolement des CsVs, et qu’il faut également prendre en compte leur élasticité propre) (58c). À ce stade, les CsVs auront effectué une vibration (un cycle). L’air va alors à nouveau s’accumuler derrière les CsVs et un nouveau cycle débutera. Le voisement se définit comme correspondant justement à ce processus de vibration des CsVs (multiples cycles d’ouverture / fermeture). Ce qu’il faut retenir de ce cycle c’est que pour qu’il y ait voisement il faut que Psupra < Psub.

(58) Un cycle de vibration des CsVs décrit en termes de variation de pression

Concernant plus particulièrement le voisement des occlusives,la cavité supra-glottique étant obstruée, après une première vibration des CsVs, l’air qui s’échappe de la glotte ne peut sortir par les lèvres, faisant augmenter Psupra (58). Après chaque vibration, Psupra augmente toujours plus, si bien qu’au bout d’un certain temps, Psupra est si élevée que Psub ne peut plus lui être supérieure. On a donc Psupra = Psub, ce qui signifie que l’air ne peut plus circuler, et donc que le voisement s’arrête. On observe alors que le voisement est plus difficile à maintenir pour une occlusive vélaire que pour une alvéolaire ou une bilabiale, car la taille de la cavité supra-glottique est alors très réduite. La taille de la cavité pour les occlusives vélaires étant réduites, le point Psupra = Psub est atteint beaucoup plus rapidement, la taille de la cavité supra-glottique étant corrélée au temps qu’il faut pour la remplir.

(58) Taille de la cavité supra-glottique pour les occlusives et voisement

Le fait que les occlusives vélaires soient phonétiquement plus difficile à produire que les occlusives alvéolaires ou bilabiales semblent avoir une conséquence sur les systèmes phonologiques des langues du monde. En effet, toujours d’après la base de données UPSID, 185 langues possèdent soit les six consonnes suivantes [p], [t], [k], [b], [d], [ɡ] soit cinq d’entre elles. La répartition de ces 185 langues est la suivant : 49 possèdent cinq des six consonnes mentionnées et les 136 autres possèdent ces six consonnes. Dans les systèmes qui ne possèdent que cinq consonnes sur les six, l’occlusive voisée la plus fréquemment omise est l’occlusive vélaire (45% des 49 systèmes l’omettent) comme l’indique le tableau en (59). Ce résultat rejoint ainsi celui de Sherman (1975) portant sur 87 langues.

(59) Recensement des systèmes phonologiques omettant une occlusive
  Labiale Alvéolaire Vélaire Total
Non voisée 19 (39%) 1 (2%) 1 (2%) 21
Voisée 0 (0%) 6 (12%) 22 (45%) 28
Total 19 7 23 49

En résumé, pour le français, les occlusives voisées sont plus difficiles à produire que les occlusives non voisées car elles demandent une coordination temporelle plus précise entre les mouvements de la glotte et ceux des articulateurs de la cavité supra-glottique. De plus, parmi les occlusives voisées, la vélaire est la plus difficile à réaliser du fait de la petite dimension de la cavité supra-glottique impliquée par cette consonne. Ces deux difficultés sont accentuées chez l’enfant. Dans le premier cas, l’enfant n’a pas encore acquis la précision de geste de l’adulte, et dans le deuxième cas, comme nous l’avons vu en section , la taille de sa cavité buccale est réduite, ce qui rend encore plus difficile la production de l’occlusive vélaire voisée du français. Comme nous le constaterons dans le prochain chapitre, l’ordre d’acquisition des occlusives reflétera ces contraintes articulatoires portant sur le voisement.

Enfin, en ce qui concerne les fricatives, on peut supposer qu’elles seront moins affectées par une difficulté dans le maintien du voisement, puisque au contraire des occlusives, elles laissent échapper de l’air ce qui maintient la pression supra-glottique à un bas niveau. Toutefois ce n’est pas le cas. Statistiquement, la tendance majoritaire des fricatives est d’être non voisée. Ohala (1983, 1994) a ainsi montré que si 24% des langues du monde possèdent uniquement des occlusives non voisées, ce nombre s’élève à 38% pour les langues qui ne comptent que des fricatives non voisées. En réalité, pour les fricatives voisées, deux conditions à leur réalisation s’opposent. D’une part, la différence de pression entre la cavité sub-glottique et la cavité supra-glottique doit être maximale pour favoriser le voisement (60a), mais, d’autre part, la différence de pression entre la cavité supra-glottique et l’atmosphère doit également être maximale (60b). Ceci signifie que dans le premier cas, il faut maintenir la pression sub-glottique à un bas niveau pour le voisement, mais que pour qu’il y ait friction, il faut que la pression supra-glottique soit la plus élevée possible.

(60) Conditions de pression pour le voisement et la friction (d’après Ohala 1997)

D’après ces conditions contradictoires, l’enfant qui ne possède pas encore la maîtrise précise des gestes articulatoires a le choix entre deux stratégies pour la production des fricatives voisées : perte du voisement ou perte de friction.

Notes
16.

Le VOT est l’intervalle de temps entre la détente de l’occlusion et le départ de la phonation. Dans les représentations acoustiques, on mesure le VOT en prenant l’écart entre le bruit transitoire, correspondant à la détente de l’occlusion, et le début des stries périodiques régulières, correspondant à la vibration des cordes vocales. Par convention, le VOT est positif lorsque la vibration des cordes vocales intervient après la détente, négatif lorsque la vibration des cordes vocales précède la détente.

17.

UPSID (UCLA Phonological Segment Inventory Database), est une base de données compilée par Ian Maddieson, elle est constituée à ce jour d’un échantillon de 451 langues, représentatif de la diversité généalogique et géographique du panorama linguistique actuel. Cette base a été compilée afin d’analyser la structure des systèmes phonologiques.