CTLF Corpus de textes linguistiques fondamentaux • IMPRIMER • RETOUR ÉCRAN
CTLF - Menu général - Textes

Meillet, Antoine. Linguistique historique et linguistique générale. [Tome I] – T02

Sur la
méthode de la grammaire comparée 1

L'objet de la science qu'on est convenu d'appeler grammaire
comparée est de faire l'histoire de développements linguistiques
au moyen de rapprochements entre des langues diverses. Ce que
doit déterminer le comparatiste dans chacun des cas qu'il étudie,
c'est ce qui, parmi les faits examinés, suppose l'existence d'un seul
et même idiome ancien, ce qui par suite résulte de la différenciation
progressive d'une langue anciennement parlée d'une
manière sensiblement une. Il doit faire un départ entre les rapprochements
qu'il observe, et ne tenir compte que de ceux de ces
rapprochements qui obligent à admettre un état de choses identique
à un moment donné du passé dans le groupe des langues
comparées.

Le problème de méthode consiste donc, étant donnés des faits
linguistiques, à rechercher comment on peut reconnaître quels
sont ceux de ces faits qui imposent, pour s'expliquer, l'hypothèse
d'un point de départ identique.

On aperçoit immédiatement les deux types de questions qui
se posent à tout historien : d'une part établir l'existence d'un certain
fait ou d'un certain état de choses à un moment donné du
passé, d'autre part poser le rapport qui existe entre faits de dates
différentes. En l'espèce, les deux types de questions ne se laissent
pas séparer.

Ce que l'on se propose ici, c'est de décrire le procédé de raisonnement
des comparatistes et d'examiner quelle en est la valeur
probante.19

Le raisonnement est de la forme suivante : on observe dans telles
et telles langues telles et telles manières de s'exprimer plus ou
moins exactement concordantes ; ces concordances ne s'expliqueraient
pas s'il n'y avait eu à une certaine date une forme commune
dont toutes les formes semblables — mais en partie
diverses — sont des continuations. Soit par exemple les pronoms
personnels sujets dans les langues néo-latines :

tableau je | tu | roumain | eo | tu | italien | io | tu | vieux français | jo | tu | espagnol | yo | tu

Il n'y a pas de raison générale pour que la personne qui parle
se désigne par des formes telles que eo, io, jo, yo ; sans même
s'adresser à des langues très différentes ou très éloignées, on voit
que la personne qui parle se désigne tout autrement, en allemand,
par ich, en russe, par ja (prononcer ya), en persan, par man. Il
n'y a pas davantage de raison pour que la personne à qui l'on
parle soit désignée par tu ; si les diverses langues indo-européennes
ont conservé à cet égard des formes assez pareilles (allemand
du, russe ty, etc.), il suffit de sortir du groupe indo-européen
pour voir qu'on désigne la personne à qui l'on parle par
sen en turc, par anta en arabe, par o oe en samoan, etc. Si donc,
dans un groupe de langues, on a des formes concordantes pour
désigner la personne qui parle et la personne à qui l'on parle,
c'est que ces formes continuent une seule et même forme
employée à date antérieure, et qu'il y a entre les deux une tradition,
dont il reste à déterminer la nature. C'est précisément
l'une des tâches principales de la linguistique historique que de
déterminer les modalités diverses de la tradition linguistique ; les
types généraux sont peu nombreux, mais le détail est d'une
extrême complexité. On doit ici faire abstraction de ces faits particuliers,
puisqu'il s'agit seulement de dégager le principe de la
méthode.

Les raisonnements présentés ci-dessous sont de simples schèmes,
20les choses sont en fait très complexes, et, comme en toute
méthode historique, si le tact personnel et le bon sens ne
guident pas constamment le chercheur, des erreurs énormes et
ridicules se produisent à tout instant ; enfin, comme tout savant,
le linguiste a sans cesse des vérifications de détail qui le dispensent
de penser aux principes de la méthode. Les raisonnements
indiqués ici ne représentent donc pas à proprement parler
la manière de procéder des linguistes : on sait qu'il faut avoir
pratiqué une science pour en saisir exactement la méthode et en
contrôler les résultats. Seuls, ceux qui ont étudié les langues,
savent combien sont divers les rapports de fait qui peuvent exister
entre une langue et toutes celles dont on la rapproche
pour en expliquer l'histoire.

Le point essentiel du raisonnement est celui-ci : la concordance
de roumain eo, italien io, vieux français jo, espagnol yo ne peut
pas être fortuite.

En effet les éléments phonétiques existant dans des langues
comme l'italien, l'espagnol, le français, admettent un très grand
nombre de combinaisons possibles. Si pour exprimer un même
sens il se trouve que plusieurs langues recourent à une même
combinaison (ou à des combinaisons qui s'expliquent par une
même origine), cette rencontre exige une explication. Or, il n'y
a dans les éléments phonétiques dont l'italien io est composé ou
dans la manière dont ces éléments sont combinés rien qui explique
l'usage fait de io pour désigner la personne qui parle. D'une
manière générale, les tentatives qui ont été faites pour expliquer
par des propriétés de la nature des sons le sens des mots n'ont
jamais abouti à aucun succès. Le fait que les mêmes notions
sont exprimées dans les diverses langues humaines par des sons
infiniment divers et que le sens attribué aux mots varie sans que
les sons y soient intéressés ou que, inversement, la prononciation
des mots varie sans que le sens y soit intéressé suffit à montrer
qu'il est inutile de rien chercher de ce côté.

D'autre part on sait par expérience qu'une même langue est
parlée de manières sensiblement différentes par les divers individus
qui l'emploient ; qu'elle est parlée de manières, encore beaucoup
21plus différentes sur les divers points du territoire étendu
où elle peut venir à être employée et aux époques successives
où on la rencontre dans l'usage. Ces différences tendent constamment
à augmenter. Si donc on rencontre chez deux groupes
de sujets parlants des formes grammaticales identiques ou susceptibles
d'être des transformations de formes identiques, on
admettra que, à cet égard, ces deux groupes de sujets continuent
la tradition d'une même manière de parler.

Il n'y a pas lieu d'essayer de chiffrer, au moyen du calcul des
probabilités, quelles chances il y a pour qu'une notion donnée soit
exprimée par une combinaison de sons donnée. Les notions à
exprimer sont choses trop variables et trop peu précises pour se
laisser saisir ; les combinaisons de sons ne sont pas toutes également
admises par une langue donnée ou par les langues en
général. D'autre part certaines combinaisons phoniques s'associent
mieux à certaines notions que certains autres sons, et ces
associations ont facilité la fixation de ces groupements, pour
exprimer ces notions : les verbes craquer ou glisser ont une forme
phonétique qui s'associe dans notre esprit au sens qu'ils
expriment ; mais ceci n'est pas nécessaire ; et des sons analogues
expriment des notions tout autres : traquer ou braquer n'indiquent
pas des bruits, plisser n'indique pas un mouvement aisé et continu.
Les conditions qui entrent en jeu sont trop multiples, elles
échappent trop à une appréciation numérique pour que l'on
puisse faire intervenir un calcul.

Sans recourir au calcul, qui n'a rien à faire ici, on a le droit
d'affirmer qu'une rencontre de quatre langues dans l'expression de
la première personne par des formes aussi pareilles, du typeyo,
peut malaisément être tenue pour un accident. Et si, comme il
arrive en l'espèce, toute une série d'autres langues présentent des
formes analogues : eu en roumain, iou en rhéto-roman, etc., le
hasard devient plus invraisemblable.

Le hasard est plus exclu encore si l'on observe que la personne
à qui l'on parle est désignée en italien et en espagnol par tu
(prononcé tou), en français par tu ; que la personne qui parle se
désigne avec une ou plusieurs autres, en italien par noi ,en espagnol
22par nos, en français par nous ; qu'une forme de pronom de
la première personne servant de complément est en italien mi,
en espagnol me (prononcé ), en français me, etc.

Dans le cas des langues citées, italien, espagnol, français, rhéto-roman,
etc., les concordances observées s'expliquent aisément :
ces langues sont celles de populations qui occupent des pays
ayant tous fait pendant plusieurs siècles partie de l'empire
romain, dont la langue était le latin. Or, le latin est attesté par
de nombreux textes et bien connu. Toutes les concordances
signalées s'expliquent par le fait que les formes en question continuent
des formes latines : ego « moi », tu « toi », nos « nous »,
vos « vous », me « me », etc. La démonstration de l'origine commune
des formes considérées qui a été obtenue par la comparaison
trouve dans des données historiques une vérification. C'est
une heureuse rencontre, qui a facilité rétablissement de la théorie,
mais qui n'ajoute, au fond, rien à la preuve. Car, d'une
part, la démonstration est suffisante sans cela et, de l'autre, rien
n'empêche que là où se parlait le latin durant la période de
l'empire romain, il se parle aujourd'hui une langue qui ne soit pas
néo-latine ; ainsi en Illyrie, où le latin a été, sous l'empire romain,
la langue courante et où il a subsisté longtemps des parlers
néo-latins, on n'emploie plus aujourd'hui que des parlers slaves ;
le français et l'italien parlés actuellement en Tunisie ne sont pas
des continuations du latin qui s'y parlait sous l'empire romain.
La preuve des parentés de langues fournie par la méthode comparative
se suffit à elle-même, et elle est la seule valable.

La preuve résulte tout entière de ce qu'il est improbable que
certaines concordances existent là où il n'y a pas une tradition
historique commune. Tout le problème se ramène donc à celui-ci :
quels sont les types de concordances qui supposent cette communauté
de tradition.

Les concordances qui reconnaissent des causes générales,
valables pour l'ensemble des langues, sont dénuées de valeur
probante pour le comparatiste historien. Par exemple la présence
d'un type de consonnes qui se trouve presque partout, comme
le t et le k, n'établit à aucun degré que deux langues soient
23parentes ; l'emploi universel det ou de k tient à ce que la structure
des organes articulatoires rend aisée la réalisation de ces
types phonétiques. Au contraire, la présence dans deux langues
voisines d'un même phonème de type tout particulier et rare
parmi les langues humaines, comme lejery du russe et du polonais,
est une première raison de croire à la parenté de ces deux
langues ; ce n'est d'ailleurs qu'une simple indication, et ce n'est
pas sur un phénomène de ce genre, de nature encore beaucoup
trop générale, qu'on peut fonder l'affirmation d'une parenté.

Ce qui établit une origine commune, c'est l'existence concordante
dans deux ou plusieurs langues de particularités telles
qu'elles ne s'expliquent pas par des conditions générales, anatomiques,
physiologiques ou psychiques. Le fait que tous les pronoms
envisagés ci-dessus sont des mots courts ne prouve rien ;
car il tient au rôle que les pronoms jouent dans la phrase, et
presque jamais, dans aucune langue., les pronoms ne sont des
mots de plus de deux syllabes ; le plus souvent, ils sont monosyllabiques.
Ce qui tend à prouver une parenté, c'est que la première
personne du singulier soit caractérisée par un y ou par un
phonème qui, comme le j français, s'explique aisément par un
ancien y, et par une voyelle du timbre o ou capable de sortir
aisément de o ; c'est que la deuxième personne du singulier soit
caractérisée par un t et par un u (ou français) ou par une voyelle
susceptible de sortir aisément d'un ancien u (ou), comme l'u français
ou le jery russe ; c'est que la première personne du pluriel
soit caractérisée par un n suivi d'un o (ou d'une voyelle qui
s'explique par l'existence d'un ancien o) et d'un autre élément ; et
ainsi de suite, car il n'y a pas de raison générale pour que la première
personne du singulier soit caractérisée par y plutôt que par
t , par n ou par v, et pas de raison pour que la voyelle qui suit
la consonne soit celle qui se rencontre dans chacune des formes
citées, et non une autre.

Du principe de la méthode il résulte que les faits probants en
matière de grammaire comparée sont des faits particuliers, et ils
sont d'autant plus probants que, par leur nature, ils sont moins
suspects de pouvoir reconnaître une cause générale. Il n'y a rien
24là que de naturel : puisqu'il s'agit de poser par des procédés
comparatifs le fait historique de l'existence d'une langue particulière,
c'est-à-dire une chose qui, par définition, se produit en
vertu d'un concours de circonstances diverses n'ayant pas de
rapports nécessaires les unes avec les autres, ce sont des faits particuliers
de caractère historique qui doivent seuls entrer en considération.

La preuve est particulièrement nette là où l'on observe des
variations concomitantes ; ainsi la troisième personne du singulier
du verbe « être » est de la forme è en italien, est en français,
es en espagnol ; la troisième personne du pluriel, de la forme
sono en italien, sont en français, son en espagnol. Cette opposition
d'une forme reposant sur un ancien est et d'une forme reposant
sur un ancien sont (latin sunt) est propre aux langues néo-latines.
D'autres langues indo-européennes offrent des faits parallèles :
l'allemand par exemple a ist et sind. En dehors des langues indo- européennes,
cette manière d'exprimer le verbe « être » par une
racine es-alternant avec s-et une désinence -ti au singulier,
-enti ou -onti au pluriel ne se rencontre jamais. Dans le parallélisme
particulier des faits néo-latins relatifs à il est, ils sont, et
dans le parallélisme un peu moins complet des faits latins, germaniques,
slaves, etc., relatifs à ce même verbe, on a une preuve
de la parenté spéciale des langues néo-latines entre elles et de la
parenté plus lointaine du latin, du germanique, du slave, etc.,
langues qui toutes sont des formes prises par un même idiome,
l'indo-européen.

Car un état de choses aussi singulier résulte du concours de
toute une série de circonstances : l'expression du verbe « être »
par es-, de la troisième personne du singulier par -ti, et de la troisième
du pluriel par -enti ou -onti, l'emploi d'une alternance de
forme radicale avec un e au singulier et sans e au pluriel ; il est
improbable qu'aucune de ces circonstances considérée à part
vienne à se reproduire exactement dans deux langues d'une
manière indépendante, plus improbable encore que ces quatre circonstances
se retrouvent simultanément à un moment donné
d'une manière indépendante dans deux langues différentes. Deux
25langues qui présentent de pareilles concordances sont donc des
formes diverses prises par une seule et même langue, en l'espèce
l'indo-européen. En toute science, démontrer, c'est découvrir
des faits qui apparaissent « évidents » ; on est ici devant les « évidences »
de la grammaire comparée : certaines concordances de
faits particuliers sont telles qu'il est « évident » qu'elles ne sauraient
se trouver dans deux langues différentes ; si donc les deux
langues considérées sont distinctes — et souvent au point que
les sujets parlants ne s'entendent pas entre eux — , c'est que ces
deux langues sont deux aspects pris par une seule et même langue
en différents lieux et en différents temps.

C'est par des faits particuliers de ce genre qu'on établit les
parentés de langues. Là où, comme il arrive souvent, la structure
des langues considérées ne fournit que peu ou ne fournit
pas de faits singuliers qui puissent être rapprochés, l'établissement
rigoureux de parentés de langues rencontre les plus graves difficultés,
et la linguistique historique arrive à peine à se constituer.
Au contraire, là où, comme sur le domaine indo-européen, sur
le domaine sémitique, sur le domaine finno-ougrien, sur le
domaine bantou, sur le domaine indonésien (malais), les concordances
singulières de cet ordre abondent, la linguistique historique
est déjà créée et progresse rapidement.

Des analogies de structure, même grandes, si elles ne sont pas
accompagnées de faits particuliers significatifs, ne prouvent pas
une parenté de langues.

On a souvent parlé d'une grande famille de langues ouralo-altaïques,
comprenant à la fois le finno-ougrien (groupe du finnois
et du magyar, etc.) avec le samoyède, le turc et le mongol
et même le japonais. En effet il y a entre toutes ces langues
des ressemblances frappantes de structure générale. Mais, aussi
longtemps qu'on n'aura pas reconnu des faits particuliers communs,
comme ceux à l'aide desquels on a établi l'existence d'un
groupe finno-ougrien et samoyède, on n'aura pas le droit de parler
d'une famille de langues ouralo-altaïques, c'est-à-dire d'affirmer
que le finno-ougrien (finnois, magyar, etc.) et le turc par
exemple sont des transformations diverses d'une seule et même
26langue ayant existe à un moment du passé. Telle langue indo-européenne
a pu prendre un aspect général pareil à celui qu'offrent
ces langues : l'arménien moderne a une structure grammaticale
analogue à celle du turc, et pourtant l'origine de la grammaire de
l'arménien moderne est indépendante du turc. Et l'on ne rapproche
pas l'arménien moderne du turc parce que le détail des
formes qui indiquent le nombre et le cas des noms, le nombre,
la personne et le temps des verbes est entièrement différent en
arménien et en turc.

Pour donner une idée plus précise de l'application des principes
précédents, il ne sera pas inutile d'indiquer avec quelque
détail comment on peut établir l'étymologie d'un mot.

Faire l'étymologie d'un mot, c'est déterminer toute l'histoire
de la manière dont ce mot a été transmis dans une langue donnée
depuis une date donnée.

Par exemple ce mot peut s'être transmis de génération en génération
entre les deux dates considérées ; et alors il peut avoir
subi des changements spéciaux tenant à des conditions particulières :
le sens peut être demeuré le même, ou il peut avoir
varié, soit que les objets désignés se soient modifiés avec le
temps, soit que les groupes sociaux qui emploient le mot ordinairement
viennent à changer de nature ou d'étendue, soit enfin
que le mot ait reçu dans la phrase des rôles nouveaux. Ou bien
le mot peut être entré dans la langue à un moment compris
entre les deux dates considérées ; et alors il peut avoir été créé
de toutes pièces — cas très rare semble-t-il — , ou formé à l'aide
d'éléments existant dans la langue, ou emprunté à un autre
idiome, proche ou lointain. On voit que les problèmes qui se
posent, dont il n'est possible de donner ici qu'un aperçu
général, sont infiniment nombreux si l'on tient compte du fait
que les conditions dont il vient d'être question sont sujettes à
changer constamment et qu'un mot peut, dans un bref espace de
temps, être soumis à l'action de conditions très diverses. Ce n'est
pas poser au linguiste un problème simple que de lui demander
l'étymologie d'un mot, c'est lui demander de décrire une histoire
complexe, et dont il est impossible de prévoir le degré de
complexité.27

Même les cas qui paraissent au premier abord le plus simples
sont encore très compliqués. Par exemple, le mot français père
est l'un des mots, assez peu nombreux, qui semblent s'être transmis
d'une manière continue de génération en génération depuis
l'époque de la langue indo-européenne commune jusqu'au latin
classique et jusqu'au français d'aujourd'hui. Mais il a subi dans
sa forme des modifications profondes : entre la façon dont le
mot se prononçait en indo-européen et celle dont il se prononce
aujourd'hui en français il n'y a qu'un trait commun, le fait que
le mot commence par un p ; la forme grammaticale a changé du
tout au tout, puisque le mot indo-européen admettait plus de
quinze formes différentes suivant les nombres et les cas et que
le mot français est invariable (l's du pluriel est purement orthographique).
Le sens n'a pas moins changé ; le mot indo-européen
désignait un rôle social ; le « père » était le chef d'une maison,
et c'est pour cela que le mot a une valeur religieuse ; il sert à
désigner le « ciel père », le Jupiter romain ; encore en latin le
mot pater a un sens avant tout social ; ce mot désigne une situation
de famille, non un fait naturel ; et le procréateur est désigné
plutôt par un autre mot, qui a expressément ce sens, genitor ;
actuellement, au contraire, le « père » est celui qui est physiologiquement
le procréateur, et ceci est si vrai que la langue populaire
emploie pour les animaux le mot père au sens de « mâle »
et dit d'un lapin que c'est un père pour indiquer que c'est un
mâle ; ou bien père désigne tout homme d'un certain âge, non
pas avec la nuance de respect qu'un Romain mettait quand il
appelait un homme âgé un pater, le traitant par là de chef, mais
au contraire de manière familière et peu respectueuse ; ou, si le
mot père est employé avec une nuance de respect, c'est, dans la
langue spéciale de l'église catholique, pour s'adresser à des moines
qui. de par leur profession, ne sont jamais des chefs de famille. On
voit combien, dans un cas pourtant très favorable à la stabilité du
mot considéré, les changements de toutes sortes sont profonds
de l'indo-européen au français, c'est-à-dire durant un laps de
temps qu'on peut évaluer à quelque quatre mille ans.

En général, le vocabulaire évolue vite. Des mots dont la valeur
28s'affaiblit rapidement par l'usage sont renouvelés pour obtenir
une expression plus intense. Des changements dans les choses,
des changements sociaux, des usages qui empêchent momentanément
ou pour toujours l'usage de certains vocables., les événements
historiques, des emprunts, souvent innombrables, à des
langues étrangères ou à des parlers de groupes sociaux particuliers,
et, d'autre part, les changements de prononciation, les innovations
qui s'introduisent dans la grammaire, une infinité de circonstances
variées font que le vocabulaire de la plupart des
langues change sans cesse : depuis le XVIIe siècle, la prononciation
et la grammaire du français employé par la bonne société
parisienne n'ont changé que dans le détail ; il ne faudrait pas
un grand effort à un contemporain de Molière pour s'adapter au
système linguistique du français d'aujourd'hui ; mais il comprendrait
très mal ce qu'on lui dirait parce que les mots et le sens
des mots lui seraient en grande partie nouveaux. Et quiconque
n'a pas fait de la langue du XVIIe siècle une étude approfondie
est exposé tantôt à ne pas comprendre un texte de cette époque
et tantôt à faire en le lisant de grossiers contresens, simplement
parce que les mots employés sont, pour une large part, autres
que les nôtres, ou qu'ils ont un sens autre.

Il résulte de cette variabilité du vocabulaire que donner l'étymologie
des mots est chose difficile, souvent impossible pour
peu qu'il s'agisse d'une langue dont on connaît mal l'histoire.
Pour pouvoir affirmer qu'un mot est la continuation de tel ou
tel mot connu à une date antérieure ou qu'il a été formé à l'aide
de tels ou tels éléments, il faut, suivant le principe posé ci-dessus,
déterminer des concordances de détail précises dont la
rencontre ne puisse passer pour fortuite. Une longue expérience
a maintenant appris aux linguistes que les ressemblances de son
ou de forme qu'on constate au premier abord sont souvent trompeuses,
et ce n'est plus de ressemblances vagues et indéfinies que
s'autorisent les étymologistes méthodiques.

En ce qui concerne la forme, les linguistes s'attachent à déterminer
des correspondances régulières. Soit par exemple deux
mots de forme analogue dans les langues néo-latines.29

tableau père | mère | italien | padre | madre | espagnol | padre | madre | provençal | paire | maire | français | père | mère

De pareils parallélismes montrent que les ressemblances de
forme extérieure que l'on observe entre les mots de chaque série
s'expriment par des formules précises et que par suite elles ont
chance de n'être pas accidentelles. C'est uniquement à l'aide de
ces formules, jamais à l'aide de ressemblances apparentes, qu'un
linguiste fait des étymologies. Tant qu'on n'est pas arrivé à poser
des formules de correspondances de cette sorte, on tâtonne. Pour
les langues où les formules sont reconnues, quiconque essaie de
faire des étymologies sans connaître et sans appliquer les formules
fait une besogne vaine.

Un mot est défini par l'association d'un sens donné à un
ensemble donné de sons susceptible d'un emploi grammatical
donné. Pour avoir une valeur, une concordance entre deux mots
doit donc porter à la fois sur les sons, sur le sens et, s'il y a lieu,
sur l'emploi grammatical. Plus la concordance est parfaite à la
fois
aux trois points de vue et plus l'étymologie a de chances
d'être correcte.

Les concordances entre les sons doivent être établies au moyen
des formules de correspondances dont il vient d'être question.
Elles ont d'autant plus de valeur qu'elles s'étendent à un nombre
d'éléments phonétiques plus grand. Une concordance portant
sur quatre ou cinq ou six éléments a beaucoup moins de chances
d'être fortuite qu'une concordance portant sur un ou deux
éléments seulement. Il est donc très difficile de faire des étymologies
sûres dans les langues où les mots sont courts, bornés à
une consonne suivie d'une voyelle comme il arrive souvent. Un
mot comme latin pater, patris qui comprend quatre éléments
caractéristiques (p, a, t, r) ou comme frāter, qui en contient
cinq (f, r, a, t, r) fournit un point de départ excellent à là
recherche. Au contraire les mots monosyllabiques à voyelle
30finale, qu'on rencontre souvent dans les langues du Soudan
ou de l'Extrême-Orient ne se prêtent que mal à l'étymologie. Les
combinaisons du type de ba ou ta, qu'on peut former avec
deux éléments, sont trop peu nombreuses pour prouver beaucoup
si on les rencontre dans deux langues à la fois.

A l'égard du sens, les concordances ont d'autant plus de valeur
que les mots considérés ont des sens plus précis et rigoureusement
déterminés. Si la notion d'un même animal est attachée à
un groupe nombreux d'éléments phonétiques se répondant suivant
les formules de correspondances établies comme italien
cavallo, provençal cavall, français cheval, espagnol caballo, pareille
concordance exclut évidemment le hasard. Plus les sons considérés
sont vagues et plus l'étymologie devient incertaine ; car la concordance
entre certains sons et une certaine notion devient moins
frappante. Les étymologies de « racines » à sens vague et très
général sont beaucoup plus incertaines que les étymologies de
mots bien définis, sauf bien entendu au cas où l'on peut mettre
en évidence l'existence dans les langues rapprochées de mots bien
définis à sens bien défini appartenant à une racine : il n'y a pas
de rapprochement plus sûr que celui de grec φέρω, latin fero,
gotique baira « je porte », arménien berem « je porte », sanskrit
bharāmi « je porte », c'est-à-dire le présent de la racine bher- dans
les diverses langues indo-européennes. Il arrive que les
mots changent de sens : la différence de sens entre les mots
rapprochés doit être expliquée par des raisons précises, autant que
possible par des raisons tirées de faits positivement attestés, car
il n'existe pas de règles sémantiques permettant de dire que tel
ou tel développement de sens est exclu.

Les explications de noms propres auxquelles on se complaît
souvent et dont beaucoup de linguistes aiment à tirer des conclusions
historiques ont peu de valeur. La force probante d'une
étymologie provient de ce que l'on ne peut tenir pour fortuit
que dans deux ou plusieurs langues un même sens soit exprimé
par des sons identiques ou susceptibles d'être ramenés à une
identité antérieure en vertu des formules de correspondances ;
mais si l'on rapproche un nom propre d'une langue d'un nom
31commun d'une autre en soutenant que le nom commun fournit
une interprétation du nom propre il est clair que toute la force
de la preuve disparaît, puisque le sens attribué au nom propre
est arbitraire. On ne peut donc interpréter des noms propres
que là où l'explication est évidente ; par exemple il y a en français
une série de noms propres qui sont des noms de professions :
Charpentier, Bouvier, Vacher, Pasteur, Boucher, Boulanger,
etc. ; il est donc légitime de penser que Sueur est le mot
ancien français sueur « cordonnier » (lat. sutor) et Fèvre, l'ancien
nom du « forgeron » (lat. faber). Si l'on avait quelques doutes,
on serait rassuré par le fait que Lesueur est à Sueur ce que Lecomte
est à Comte, Lepelletier à Pelletier. Hors les cas évidents de
cette sorte, les interprétations de noms propres ne sauraient être
prouvées et n'ont, par suite, que la valeur de jeux d'esprit.

Les rapprochements reçoivent des confirmations utiles quand
on peut constater que des concordances grammaticales s'ajoutent
à la concordance du son et du sens. Si, par exemple, on pouvait
douter de la concordance de l'italien cuocere et du français cuire
garantie par l'exacte concordance des sons (malgré la première
apparence) et du sens, la concordance des participes cotto et cuit
(cuite) ferait beaucoup pour lever le doute. Les langues qui,
comme les langues indo-européennes (surtout dans la période
ancienne) et les langues sémitiques, ont des particularités grammaticales
attachées à certains mots se prêtent donc mieux à la
démonstration de l'étymologie que les langues où tous les mots
se conforment aux mêmes règles grammaticales. La difficulté
qu'on éprouve à poser la grammaire comparée de certaines
langues, notamment en Extrême-Orient, vient en partie de là.

Ce qui rend l'étymologie encore plus incertaine et difficile
qu'il ne paraît à en juger par ce qui vient d'être dit, c'est que les
mots qu'on trouve dans une langue donnée proviennent toujours
de plusieurs langues diverses et que, d'autre part, des mots nouveaux
sont sans cesse formés, à l'aide soit d'éléments existant
dans la langue, soit d'éléments empruntés à d'autres langues. On
n'a donc jamais le droit d'affirmer que tel ou tel mot ne peut
s'expliquer qu'à l'aide de tels ou tels éléments existant à un
32moment donné dans telle ou telle langue. Les difficultés de fait
que rencontre l'étymologiste sont innombrables, et, s'il est aisé
d'apercevoir des ressemblances entre les mots, il faut être du
métier pour savoir à quel point il est malaisé d'établir la justesse
d'un rapprochement étymologique.

Des faits cités il ressort que le seul moyen de preuve employé
dans les démonstrations de grammaire comparée consiste à constater
des concordances entre certains sons (ou certains procédés
d'expression très définis) et certaines notions, et à examiner si
ces concordances peuvent être fortuites. Le degré de valeur de
la preuve tient uniquement au degré de probabilité que la concordance
ne puisse pas être accidentelle. De là vient que les étymologies
sont probables à des degrés très divers ; certaines,
comme le rapprochement du français père et de l'italien padre,
de cuire et d'italien cuocere, peuvent passer pour sûres ; mais
d'autres rapprochements sont simplement possibles, et entre
une probabilité qui touche à la certitude et une simple possibilité,
il y a tous les degrés de probabilité imaginables.

On peut utiliser la méthode comparative d'une autre manière
et se demander ce qu'il y a de commun à toutes les langues
humaines ou à plusieurs langues indépendamment du fait que
certaines de ces langues sont les transformations d'une même
langue ayant existé antérieurement, comme le français et l'italien
sont des transformations du latin, comme l'arabe de Syrie, l'arabe
d'Egypte, et l'arabe du Maroc — très différents aujourd'hui
dans l'usage parlé — sont des transformations de l'arabe des
conquérants arabes. On aboutirait ainsi à constituer une linguistique
générale. Tel n'est pas l'objet de ce qu'on appelle « grammaire
comparée ». La linguistique générale qu'on obtient en faisant
abstraction de l'histoire est une science encore peu faite,
difficile à faire et qui pour se faire suppose du reste qu'on ait
déjà décrit aussi complètement que possible l'histoire du plus
grand nombre de langues possible. Ce qui sert à l'établissement
de la linguistique générale est ce qui est dénué de valeur pour
la grammaire comparée et inversement. Par exemple le fait que
33le sémitique et l'indo-européen ont également une distinction
nette du nom et du verbe ne prouve pas que ces deux langues
soient apparentées ; mais le fait que deux langues nettement distinctes
à l'époque historique ont, par des procédés différents,
distingué le nom du verbe est l'une des preuves qu'on peut
alléguer à l'appui de la doctrine générale que toutes les langues
tendent à distinguer ces deux catégories grammaticales essentielles.
— Le sémitique avait une déclinaison à trois cas, l'indo-européen
une déclinaison à huit cas ; or, on observe que, au
cours du développement historique de la langue sémitique et de
la langue indo-européenne, le nombre de ces cas tend à se réduire et
que chaque nom tend à avoir une seule forme ou, tout au plus, deux
formes distinctes, l'une pour le singulier, l'autre pour le pluriel ;
ce parallélisme de développement ne prouve aucune parenté ; il
s'explique par des causes générales qui ont agi séparément dans
chacune des langues sémitiques et dans chacune des langues indo-européennes,
et qui ont d'ailleurs agi à des degrés très différents ;
car, si l'anglais, le persan, le français par exemple ont
perdu toute flexion casuelle, comme le syriaque ou l'arabe
moderne, c'est par suite d'évolutions relativement récentes dont
on suit l'histoire. Une concordance générale de développement
ne peut servir à démontrer une communauté d'origine historique.
Le comparatiste historien doit se méfier avant tout de ce
que les biologistes appellent des phénomènes de convergence.

Ce qui vient d'être dit de la linguistique s'applique au fond
à toute méthode comparative. Il y a deux manières d'employer
la comparaison : ou bien l'on constate des concordances particulières
qui ne pourraient être fortuites, et l'on en conclut à une
origine historique commune. Ou bien l'on constate des concordances
entre tous les faits examinés, et l'on aboutit à poser des
lois générales. Le second procédé qui, en des matières aussi complexes
que les faits sociaux, présente d'extrêmes difficultés n'a
pas à être discuté ici. Le seul but qu'on s'est proposé était de
faire ressortir comment avec une méthode comparative on peut
conclure à des faits de caractère historique. En linguistique, la
méthode a fait ses preuves, et de nombreuses confirmations de
34fait en ont établi la légitimité. Ailleurs, notamment en matière
de religion, d'institutions politiques ou juridiques, de technique
industrielle, elle réussit moins : nulle part, autant qu'en matière
de langue, les procédés employés n'admettent des combinaisons
multiples ; nulle part par suite, les combinaisons réalisées n'ont
aussi peu de chances de se retrouver fortuitement. Quand on
voudra se rendre compte des erreurs que commettent souvent les
linguistes ou les personnes qui se mêlent de raisonner de linguistique
historique, il suffira de remonter au principe de la démonstration ;
du même coup on sera en garde contre les erreurs que
l'on est exposé à commettre toutes les fois que l'on emploie la
méthode comparative à reconstituer des évolutions de faits
sociaux autres que le langage, et l'on verra dans quelle mesure il
est légitime d'employer, en un cas donné, un pareil moyen de
preuve.35

1. Revue de métaphysique et de morale, 1913, p. 1-15.