CTLF Corpus de textes linguistiques fondamentaux • IMPRIMER • RETOUR ÉCRAN
CTLF - Menu général - Textes

Delattre, Pierre. Studies in French and Comparative Phonetics – T30

| Table des matières | Fiche | Texte |

Les attributs acoustiques de la nasalité
vocalique et consonantique *1

Les remarques qui vont suivre ne forment pas un tout sur la physique de la nasalité;
elles ne sont présentées que comme complément à l'étude de Marguerite Durand “De
la formation des voyelles nasales”, parue récemment dans cette revue. Une étude
complète sur la nasalité paraîtra plus tard. Nous y travaillons depuis cinq ans et
avons encore beaucoup à faire.

Résumons d'abord l'apport de Mlle Durand. Ayant pu comparer entre eux quelques
spectrogrammes de voyelles orales, de voyelles nasales, de consonnes orales et de
consonnes nasales, elle a pensé y découvrir essentiellement ceci: les formants des
voyelles nasales françaises qui en caractérisent la nasalité (qui les font percevoir
auditivement comme nasales au lieu d'orales) ont une fréquence extrêmement élevée
(environ 7500 cycles seconde) et ces hauts formants ne sont visibles que sur les
spectrogrammes de voyelles nasales, les spectrogrammes de consonnes nasales n'en
portant pas trace. Du point de vue historique, cela la conduit à “contester la formation
de la nasalité vocalique par assimilation due à une consonne suivante” parce
que “la consonne nasale … ne peut pas étendre dans le domaine de la voyelle précédente
un caractère qu'elle n'a pas” (p. 41). Et elle conclut hardiment — et imprudemment,
de son propre aveu (p. 35) — que les voyelles nasales “… ne sont pas dues à
une assimilation, mais semblent constituer une création” (p. 53).

Dans son article, Mlle Durand note que nous la mettions en garde contre les formants
supérieurs (p. 36). Nos raisons en étaient les suivantes.

1. D'abord, il semble que si la caractéristique de nasalité vocalique était en dessus
de 3500 cycles, on ne comprendrait pas les voyelles nasales au téléphone (qui ne
transmet les ondes qu'en dessous de cette limite). Or on les comprend fort bien. Ce
qu'on comprend mal, au téléphone, ce sont les consonnes comme les [s] dont les
ondes non périodiques (bruits de friction) s'étendent au delà de 3500 cycles.

2. L'intensité (mesure objective) des composantes de la parole, on le sait, n'est pas
égale à tous les points du spectrogramme. Elle est d'autant plus faible que la fréquence
de la composante est plus haute. En dessus de 500 cycles, cette atténuation est
d'environ 9 décibels par octave. L'audibilité (évaluation subjective de l'intensité), par
contre, augmente jusqu'aux environs de 4000 cycles, puis diminue brusquement. Les
243spectrographes que Mlle Durand a utilisés étaient réglés pour compenser l'atténuation
d'intensité par une augmentation de 9 décibels par octave. De la sorte l'image visuelle
du son que présente le spectrogramme correspond mieux, jusqu'à 4000 cycles, à
l'audibilité. Mais en dessus de 4000 cycles, le spectre ainsi amplifié n'a guère d'utilité
que pour l'étude des bruits consonantiques. Sur un spectrogramme qui représenterait
soit l'intensité non amplifiée, soit l'audibilité, il est probable qu'un formant à 7500
cycles ne serait pas visible.

3. Lorsqu'on enregistre le son dont on veut obtenir le spectre, il ne faut pas que
l'indicateur d'intensité dépasse un certain niveau au delà duquel il y a déformation
du son. Sur le spectre, cette déformation se traduit surtout par des formants dont les
fréquences sont des multiples simples de formants plus bas. En général, en l'absence
de toute déformation, seuls les bruits consonantiques peuvent se voir entre 7000 et
8000 cycles. Ainsi les spectrogrammes de Mlle Durand semblent tous avoir subi
quelque déformation. En tout cas, celui de [ɛ̃] que nous lui avions envoyé, et qu'elle
cite pour son formant à 7500 cycles, avait sans doute une forte déformation qui était
nécessaire pour qu'apparaisse un certain formant d'intensité très faible, vers 2000
cycles. Nous voulions qu'elle ait connaissance de ce formant parce que c'est un des
seuls que toutes les nasales aient en commun. A cette fréquence, l'audibilité est assez
forte, malgré la faible intensité. Dans la synthèse, surtout celle des consonnes, ce
formant à 2000 semble contribuer au degré de nasalité perçue.

4. Nous avons vu des centaines de spectrogrammes de voyelles nasales qui n'avaient
pas de formant vers les 7500 cycles. Si ce formant était la marque de la nasalité, toutes
les voyelles nasales l'auraient. Il est certain que tous les spectrogrammes de Mlle
Durand l'avaient, mais il est aussi possible qu'ils aient tous été enregistrés avec
déformation. De plus, leur nombre est très limité.

5. Il est bien délicat de comparer acoustiquement la nasalité d'une voyelle à celle
d'une consonne. La première se faisant à bouche ouverte possède une intensité et une
audibilité très supérieures à la seconde. Pour comparer les formants de la résonance
d'une consonne nasale à ceux d'une voyelle nasale, il faudrait enregister la consonne
à une intensité égale à celle qui est normale pour une voyelle orale. Quand l'enregistrement
spectrographique est réglé pour que les voyelles les plus intenses de la phrase
ne soient pas déformées, les formants nasals des consonnes sont si faibles qu'on ne
voit guère que le premier sur le spectrogramme.

6. Enfin — et c'est là notre meilleur argument contre le formant de 7500 cycles — aux
Laboratoires Haskins de New York on peut, par la synthèse, produire de bonnes
voyelles (et consonnes) nasales, transformer des voyelles orales en voyelles nasales,
sans avoir aucunement besoin d'un formant à 7500 cycles. Quelques détails s'imposent
ici.

Rappelons que la machine à synthétiser la parole, construite aux Laboratoires
Haskins de New York, consiste essentiellement en un jeu de 50 tons purs, les 50
premières harmoniques d'une fondamentale à 120 cycles. La manipulation de ces 50
tons au moyen de la machine permet de faire entendre à volonté, isolément ou en244

image F4 | F3 | F2 | F1 | FN | a | ã

Fig. 1. Ce spectrogramme montre le changement acoustique qui se produit quand on baisse et relève alternativement le voile
du palais en tâchant d'immobiliser la langue, les lèvres et les mâchoires. En passant de la voyelle orale à la voyelle nasalisée, on
observe (a) que le deuxième formant (F2) conserve à peu près la même intensité, (b) que le premier fomant (F1) perd énormément
d'intensité, (c) qu'un formant nouveau (FN1) apparaît vers les 250 cycles (il a pour centre, ici, le deuxième harmonique), (d) que le
troisième formant (F3) monte et le quatrième (F4) descend. C'est ce rapprochment de F3 et F4 qui a été pris pour la marque
acoustique de la nasalité. La synthèse indique que c'est (b) et (c), et non (d), qui caractérisent acoustiquement la nasalité vocalique.
(Notons que les voyelles nasalisées du spectrogramme ci-dessus ne sont pas des [ã], mais seulement des [a] nasalisés. Leur timbre est
entre [ɛ̃] et [ã]. Les formants un et deux d'un [ã] français bien timbré sont plus bas que cela: leurs fréquences sont plus proches de
celles d'un [ɔ] que de celles d'un [ɑ].insert

groupes, les éléments acoustiques d'un spectrogramme peint à la main ou fait au
spectrographe.

Le meilleur moyen de déterminer le rôle des divers formants dans la perception de
la nasalité était de les reproduire ainsi par synthèse séparément et en une infinité de
combinaisons, et de juger de l'effet produit sur l'oreille. C'est à quoi nous avons passé
l'hiver 49-50. (Pendant l'été 47 nous avions fait de nombreux spectrogrammes de
nasales aux Laboratoires Bell Telephone, sans arriver, par leur seul examen, à déterminer
avec certitude les attributs acoustiques de la nasalité.) En juin 1950, nous avons
lu une communication à la réunion de la Société d'Acoustique d'Amérique, avec
démonstration sonore et visuelle de la transformation, en synthèse, de voyelles orales
en voyelles nasales. Ces résultats n'ont pas été publiés parce qu'ils n'étaient pas encore
satisfaisants. Depuis lors, nous avons progressé, mais il reste encore des points à
éclaircir, entre autres, justement, la relation entre nasalité de consonne et nasalité de
voyelle. Ce n'est donc encore qu'à titre provisoire que nous formulons ci-dessous les
faits essentiels.

Les principaux attributs acoustiques de la nasalité se trouvent dans les fréquences
basses
du spectre! (Ceci contredit toutes les études précédentes parce que les fréquences
basses sont très difficiles à analyser dans la décomposition harmonique.
Seule la synthèse a permis de le faire.)

Le premier facteur de la nasalité vocalique est sans contredit l'extrême faiblesse
d'intensité du premier formant
, comme on peut le voir sur Fig. 1. (Par premier formant,
nous voulons dire celui qui correspond au premier formant, le formant le plus
bas, des voyelles orales. Les voyelles nasales semblent en avoir un autre, encore plus
bas, que nous nommons dans le paragraphe suivant “premier formant nasal”.) Dans
la synthèse, pour transformer une voyelle orale en une voyelle nasale, il faut commencer
par fortement réduire l'intensité du premier formant. Après ce seul changement
la voyelle est perçue comme nasale par une oreille française.

Le deuxième facteur est un formant très bas, vers les 250 cycles pour une voix
d'homme (bariton). L'addition de ce formant accentue la nasalité. Appelons-le
“premier formant nasal”.

Le troisième facteur est un formant vers les 2000 cycles. Appelons-le “deuxième
formant nasal”. Il semble être d'autant plus faible que le son est plus ouvert. Ainsi
dans la synthèse il contribue fort à nasaliser les consonnes, moins à nasaliser [ɛ̃], [œ̃]
et [ɔ̃], presque pas à nasaliser [ɑ̃]. (Sur Fig. 1, il n'est même pas visible, la voyelle
étant ouverte).

Le deuxième formant de la voyelle orale ne change guère d'intensité dans la nasalisation.
Il ne change pas non plus de fréquence si les organes buccaux ne changent
pas de place (cf. Fig. 1). (Le fait que les deux premiers formants des voyelles nasales
n'ont pas la même fréquence que les deux premiers formants des voyelles orales qui
sont supposées leur correspondre indique simplement que la position des organes
buccaux n'est pas la même.)

Au dessus du deuxième formant, de nombreux changements se voient sur le
245spectre de la nasale, surtout dans les troisièmes et quatrièmes formants (le troisième
monte toujours, le quatrième descend toujours). Mais, à la synthèse, aucun de ces
changements ne produit d'impression de nasalité perceptible à l'oreille
!

Quant à la nasalité des consonnes nasales, l'analyse des spectrogrammes ne fournit
presque pas d'indication, l'intensité étant trop faible ou les fréquences importantes
trop basses. Dans la synthèse par contre, la nasalisation a été relativement facile à
produire. Elle dépend en tout premier lieu d'un formant bas, vers les 250 cycles (qui
pourrait être le même que le formant de 250 cycles des voyelles nasales — point qui
sera très difficile à vérifier), en deuxième lieu, d'un formant de fréquence assez fixe,
vers 2000 cycles (qui semble bien être le même que le formant de 2000 des voyelles
nasales), en troisième lieu, d'un formant de fréquence variable, vers les 900 cycles.
La fréquence de ce dernier formant varie un peu selon la voyelle qui précède ou qui
suit. Elle varie aussi selon que la consonne nasale est labiale, dentale ou vélaire, mais
on sait que le rôle primordial dans l'identification du lieu d'articulation est réservé
aux transitions du deuxième et troisième formant (cf. Cooper, Delattre, Liberman,
“Some Experiments on the Perception of Synthetic Speech Sounds”, Journal of the
Acoustical Society of America
, 24, 6, p. 604, et Liberman, Delattre, Cooper, “The
Role of Consonant-Vowel Transitions in the Perception of the Stop and Nasal
Consonants”, Psychological Monographs, 68, 8, pp. 1-12).

On pourrait conclure ici que les voyelles nasales et les consonnes nasales ont en
commun pour produire l'impression de nasalité deux formants à environ 250 cycles
et 2000 cycles, et seulement ces deux formants. Mais les faits sont peut-être tout
différents. Il se pourrait fort bien que la nasalité consonantique provienne principalement,
comme la nasalité vocalique, de la faiblesse d'un premier formant relativement
à un second. Dans ce cas le premier formant très faible devrait être bas puisque la
bouche est fermée (cf. Delattre, “The Physiological Interpretation of Sound Spectrograms”,
Publication of the Modern Language Association of America, 66, 5, pp.
864-875); et le deuxième formant serait celui que nous avons décrit sous facteur trois
dans le paragraphe précédent. Espérons que l'expérimentation par synthèse arrivera
à éclaircir ce point.

7. Il faut savoir que les voix hautes (hauts ténors ou femmes), ayant leurs harmoniques
trop espacées, ne permettent pas de voir le détail des formants. Dans l'article
de Mlle Durand, les spectrogrammes des pages 36 et 49 sont des sprectrogrammes de
voix hautes: les formants du bas n'y sont pas séparables.

8. Il nous faut maintenant répondre à une question qui s'impose ici. Pourquoi les
phonéticiens ont-ils toujours perçu dans les voyelles nasales un ton haut, aigu, en
même temps qu'un effet voilé, doux? La réponse nous est fournie par les pages qui
précèdent. Le ton haut vient de la forte atténuation du premier formant, laquelle fait
ressortir l'intensité du deuxième formant (dont la fréquence est haute et dans une
région à grande perceptibilité). L'impression douce et voilée peut venir (a) du premier
formant nasal à 250, fréquence très basse qui, isolément, s'identifie à la voyelle [u],
jugée subjectivement la plus “douce” des voyelles; (b) de la presque absence d'un des
246deux formants caractéristiques, ce qui enlève de la netteté au timbre; (c) du fait que
l'intensité totale d'une voyelle nasale est beaucoup plus faible que celle d'une voyelle
orale de la même émission de voix (ce à quoi il fallait s'attendre étant donnée la forte
réduction d'intensité du premier formant.)

Conclusion

Pour compléter l'analyse acoustique de la nasalité présentée dans cette revue par
Mlle Durand, nous avons résumé les résultats obtenus aux Laboratoires Haskins
par la synthèse du son. Ces résultats diffèrent de ceux de Mlle Durand: ils ne permettent
pas de conclure que la voyelle nasale possède un caractère acoustique qui ne se
trouve pas dans la résonance nasale de la consonne.247

1* Déjà publié dans Studia Linguistica, VIII, 2 (1954), pp. 103-109.