CTLF Corpus de textes linguistiques fondamentaux • IMPRIMER • RETOUR ÉCRAN
CTLF - Menu général - Textes

Meillet, Antoine. Linguistique historique et linguistique générale. [Tome I] – T06

Le problème
de la
parenté des langues 11

La dernière liste de langues publiée, celle qu'a donnée le
regretté F. N. Finck, Die Sprachstāmme des Erdkreises, en renferme
plus de deux mille. Ce chiffre n'a, par lui-même, aucune
importance : la liste n'a pas été faite suivant un principe un, et
il ne serait pas possible d'en dresser une avec rigueur. En effet on
peut convenir de compter autant de langues distinctes qu'il existe
de parlers inintelligibles pour les sujets employant tout autre parler.
Mais cette limite d'intelligibilité est fuyante : le provençal et
le français sont assurément deux langues distinctes ; car pour
qui ne sait que l'une de ces deux langues, l'autre est inintelligible
à l'audition ; mais le provençal et le catalan sont-ils deux
langues distinctes ? Au premier abord, les sujets qui parlent l'une
de ces deux langues ne saisissent pas l'autre ; mais il faut peu
d'efforts à un Provençal pour comprendre un Catalan et inversement.
Il est donc impossible de dire combien il existe actuellement
de langues. Une chose du moins est sûre : les langues
distinctes se comptent par centaines, et il se parle actuellement
beaucoup plus de mille idiomes assez différents les uns des
autres pour rendre nécessaire l'usage d'interprètes.

Pour mettre un ordre dans cette variété, on a tenté de classer
les langues d'après les traits généraux de leur structure grammaticale
en langues isolantes, agglutinantes, incorporantes et
flexionnelles. Mais on n'a pas réussi à poursuivre ce classement
jusqu'au bout, et, dans la mesure où il a été fait, il s'est trouvé
dénué de toute utilité soit pratique, soit scientifique ; c'est une
76amusette dont aucun linguiste n'a pu tirer parti. Dans son petit
livre sur les principaux types de langues, F. N. Finck n'a pu que
décrire huit langues particulières arbitrairement choisies.

Fr. Müller, dans son grand exposé des principaux types de
langues, et F. N. Finck, dans le petit ouvrage cité ci-dessus, ont
été réduits à ranger les langues d'après les races d'hommes qui
les parlent. Mais comme il n'y a aucun lien nécessaire entre la
langue et la race et que personne ne soutient sérieusement
qu'un certain type linguistique soit lié à un certain type somatique,
ce procédé n'a été adopté que comme un pis-aller, et un
pis-aller fâcheux. Car il éveille une idée fausse.

Toutefois, si l'on ne connaît aucun principe qui permette
actuellement de classer toutes les langues, on a déterminé l'existence
de plusieurs groupes linguistiques nets ; personne ne doute
qu'il y ait un groupe roman, composé de l'italien, de l'espagnol,
du français, du roumain, etc. ; un groupé germanique, composé
de l'allemand, de l'anglais, du danois, du suédois, etc. ; un
groupe slave, composé du tchèque, du polonais, du russe, du
serbe, du bulgare, etc. ; et ainsi de beaucoup d'autres. Les ressemblances
entre les langues qui constituent chacun de ces
groupes sont évidentes ; la valeur de ce classement se traduit
pratiquement par le fait que si l'on possède l'une des langues du
groupe, on acquiert plus facilement les autres. Il y a donc un
classement linguistique qui s'applique d'une manière satisfaisante
en certains cas. Dès lors il vaut la peine d'examiner si, en appliquant
le procédé, on n'arriverait pas à classer toutes les langues.

Le principe de ce classement est simple. Toutes les langues
actuellement parlées du groupe roman sont des transformations
diverses d'une seule et même langue qui ne se parle plus, mais
dont on a des monuments écrits, le latin. Les langues du groupe
germanique sont des transformations d'une même langue commune,
dont on n'a pas de monuments, mais dont on doit supposer
l'existence ; les langues slaves sont les formes diverses
prises par une seule et même langue slave commune non attestée.
Plus on remonte dans le passé de chacune des langues germaniques,
plus se manifeste la ressemblance ; et de même pour
77le groupe slave ; si les documents conservés permettaient de
suivre l'histoire plus loin en arrière, on finirait — et assez vite —
par trouver l'identité complète, dans la mesure très approximative
où une langue est jamais une. Les groupes de langues utilement
constatables sont donc définis par l'unité d'origine. Dire
que plusieurs langues appartiennent à un même groupe, c'est
dire qu'elles sont des différenciations d'une langue plus ancienne :
des langues parentes sont en réalité une seule et même langue modifiée
de manières diverses
au cours du temps.

Il y a donc une classification linguistique qui, en certains cas
au moins, est satisfaisante, la classification « généalogique » ;
elle a abouti pour beaucoup de langues à des résultats précis que
Fr. Müller et F. N. Finck ont insérés au milieu de leur classification
ethnique générale ; elle a permis, depuis une centaine
d'années, de faire l'histoire des langues indo-européennes, des
langues sémitiques, des langues finno-ougriennes, des langues
bantoues, des langues indonésiennes, et sa fécondité se montre
chaque jour plus grande ; il était permis de croire qu'elle ne donnerait
plus lieu à des discussions et qu'on s'efforcerait seulement
d'en poursuivre l'application. Mais elle a été dans les dernières
années l'objet de discussions de principe. Il y a en effet des obscurités
dont les unes proviennent de la manière dont les langues
se transforment, et les autres tiennent à ce qu'il est malaisé de
mettre en évidence des communautés d'origine. D'autre part, la
difficulté de fait qu'on éprouve à faire entrer toutes les langues
dans la classification généalogique a conduit certains linguistes
éminents à ôter au principe de cette classification sa précision et
sa rigueur ou à l'appliquer d'une manière inexacte. Il ne sera
donc pas inutile de remonter à ce principe même et de montrer
en quelle mesure une classification généalogique des langues est
actuellement possible, jusqu'où elle peut être utile, et ce que l'on
en peut espérer.

I

La formule suivant laquelle certaines langues sont les transformations
78d'une langue plus ancienne recouvre des réalités historiques
diverses et complexes. En effet les langues ne sont pas
des objets ayant une existence matérielle autonome et se développant
par eux-mêmes. Une langue est une institution propre à
une collectivité sociale, et les modifications qu'elle subit sont
liées à l'histoire de cette collectivité. Elle ne se transforme pas
comme un manuscrit ou comme un outil. Elle résulte d'une
activité mentale des sujets parlants. Elle n'est pas la même chez
deux sujets parlant une même langue : il n'y a pas deux Français
qui parlent exactement le même français. Sans doute il existe
pour chaque langue une norme à laquelle les sujets parlants
tendent à se conformer ; mais cette norme est plus ou moins
définie suivant les cas, et le sentiment qu'on en a est plus ou
moins délicat. Des variations, même étendues, n'empêchent pas
les gens de se comprendre entre eux. Par suite, il existe des
communautés linguistiques où l'unité est très imparfaite ; et il
n'y en a aucune où tous les sujets parlent d'une manière sensiblement
identique. La formule : une langue est une forme modifiée
d'une autre, n'a donc pas un sens linguistique précis, puisque
ni l'une ni l'autre langues ne se laissent exactement saisir à aucun
moment.

Du reste les langues ne se maintiennent qu'en se transmettant
d'un individu à un autre. Or, les enfants qui apprennent à parler
ne reçoivent pas la langue toute faite. Ils ne peuvent reproduire
que ce qu'ils entendent, et il est inévitable que des nuances
délicates échappent à leur attention. En constituant leur système
linguistique avec ce qu'ils ont entendu et remarqué, ils ne reproduisent
pas exactement le système linguistique des générations
antérieures. Même quand ils emploient les mêmes formes, ils ne
les sentent pas toujours de même. Par sa discontinuité naturelle,
la transmission du langage donne lieu à des changements. Les
enfants sont d'autant plus libres vis-à-vis des générations antérieures
que la norme est moins précisément établie et que l'unité
est moins réalisée dans la communauté où ils apprennent à parler.

La langue ne se transmet pas seulement de génération en génération.
79Sans cesse il se produit des situations qui engagent ou
qui obligent certains sujets à employer, de préférence à leur parler
maternel, une langue susceptible de servir à des communications
avec un plus grand nombre d'hommes ; sans cesse, il y a
par suite des groupes d'hommes qui changent de langue. Mais
on ne sait jamais parfaitement une langue étrangère ; on n'en saisit
pas toutes les finesses ; on n'en reproduit pas exactement tous
les détails ; on n'en applique pas correctement tout le système.
Chaque sujet qui emploie une langue étrangère apporte donc un
trouble dans la communauté linguistique. Partout où il y a des
populations d'origines diverses, la situation linguistique devient
incertaine, et la liberté des enfants qui apprennent à parler s'accroît.
Quand, ainsi qu'il arrive souvent, une population entière
change de langue, il est inévitable que la langue nouvellement
apprise, d'une part, ne soit pas en tous points conforme au
modèle imité, et, d'autre part, soit pendant un certain temps
moins stable que n'est une langue fixée par une longue tradition.

Quels que soient les procès, en partie mal éclaircis, par lesquels
se réalisent les changements, une chose est sûre : entre l'aspect
d'une langue à un certain moment et l'aspect de cette même
langue à une époque postérieure, il y a souvent une différence
profonde ; en quelques siècles, une langue peut devenir méconnaissable.
Le français du XIe siècle est du latin, à savoir le latin
vulgaire qu'ont adopté vers le Ier siècle après J.-C. les populations
de la Gaule du fait de la conquête romaine ; mais un
Romain du 1er siècle n'aurait pas compris ce latin nouveau pas
plus qu'un Français du XIe siècle n'était capable d'entendre le
latin ancien. Depuis, le français a continué de changer rapidement
en s'éloignant de plus en plus du latin. Mais, si fort que la
divergence grandisse, le français ne cessera pas pour cela d'être
du latin transformé, aussi longtemps qu'il se parlera.

En effet, la définition de l'identité linguistique ne peut être
que sociale : quelles que soient les différences de fait entre les
sujets parlants, il y a langue une là où des individus, se comprenant
entre eux, ont, d'une façon consciente ou inconsciente, le
sentiment et la volonté d'appartenir à une même communauté
80linguistique. La langue change au cours du temps ; mais, si l'on
considère des sujets contemporains les uns des autres, il y a en
un sens unité à chacun des moments successifs qu'on peut envisager.
Entre la conquête de la Gaule par les Romains et l'époque
actuelle, il n'y a eu aucun moment où les sujets parlants aient
eu la volonté de parler une langue autre que le latin. Les habitants
de la Gaule ont voulu acquérir le latin, et ils y sont parvenus ;
le latin vulgaire dont le français est une transformation diffère
très peu de celui qui a abouti aux autres langues romanes.
Depuis ce temps, les habitants de la France actuelle n'ont jamais
eu l'intention de parler une langue nouvelle ; ils se sont toujours
efforcés de parler leur langue traditionnelle, et ils ont toujours
eu le sentiment de parler une même langue. Une différence
tranchée n'apparaît que si l'on envisage deux moments éloignés
du développement. — Par le fait de la diversité des conditions
historiques, une même langue peut subir des changements divers
dans les différentes régions où elle est employée ; dès lors, malgré
la persistance de la continuité avec le passé en chaque région,
cette langue se brise en un certain nombre de langues qui progressivement
deviennent distinctes. Ainsi le latin est devenu
suivant les lieux l'italien, le provençal, le français, l'espagnol, le
roumain, etc. — On voit par là que ce qui définit une parenté
linguistique, c'est seulement un fait historique : une langue sera
dite issue d'une autre si, à tous les moments compris entre celui
où se parlait la première et celui où se parle la seconde, les sujets
parlants ont eu le sentiment et la volonté de parler une même
langue, soit que cette langue se soit transmise normalement de
génération en génération, soit que certains groupes d'hommes
l'aient adoptée à la place de leur ancien parler. Sont parentes
entre elles toutes les langues issues ainsi d'une même langue.
Ainsi la parenté de langues résulte uniquement de la continuité
du sentiment de l'unité linguistique.

Le sentiment et la volonté qu'ont les sujets parlants d'employer
une certaine langue sont chose inconsciente là où il n'existe
qu'une langue : dans un milieu linguistique homogène, les sujets
parlent comme on parle autour d'eux. Mais, dans les milieux où
81il existe plusieurs manières de parler, on sait toujours qu'on se
sert de tel ou tel système : un Breton qui pratique le français et
le breton sait en chaque cas s'il parle français ou breton, et il ne
mélange pas l'un des systèmes avec l'autre ; car les systèmes
grammaticaux de deux langues sont, on le verra, impénétrables
l'un à l'autre.

On peut être tenté de dire que la langue issue d'une autre plus
ancienne, si elle n'est ni identique ni même semblable à celle-ci,
est constituée du moins avec les mêmes éléments linguistiques.
Mais il n'y a rien à tirer de là.

Tout d'abord ce fait n'a par lui-même guère d'intérêt. Sans
doute le -ai du français je ferai et le -ais du français je ferais sont
des formes modifiées du latin habeo et habebam. Mais ces mots
latins sont si profondément altérés qu'on les reconnaît à peine ;
même si je ferai était clair, le simple examen du français ne
donnerait pas le moyen d'analyser je ferais. Et, s'il est vrai que
-ai et -ais sont des éléments latins, ils ont pris un emploi qui
n'a pas son équivalent en latin et que rien en latin ne laissait
prévoir : entre les formes grammaticales françaises je ferai et je
ferais
et les mots latins habeo, habebam, il n'y a de commun
qu'un fait matériel : -ai et -ais sont des déformations de habeo et
de habebam. En tant que formes grammaticales, ce sont de véritables
créations. Dans des conditions favorables pour le linguiste,
comme celles offertes par les langues romanes, de pareilles créations
se laissent expliquer. Mais, dans la plupart des cas, elles
demeurent mystérieuses. La grammaire comparée explique bien
les survivances d'un état de choses ancien ; mais elle échoue souvent
quand il s'agit d'expliquer les innovations qui sont de véritables
créations. Donc, si l'on considère deux moments du développement
d'une même langue séparés par un large intervalle de
temps ou par une période de transformations multiples et rapides,
on n'arrivera peut-être à presque plus rien expliquer dans le
second moment par la considération du premier moment. Les
éléments du premier moment considéré seront méconnaissables
dans le second.

En second lieu, les langues sont sujettes à emprunter des éléments
82à des langues étrangères. Il y a en français moderne des
mots nouvellement empruntés à l'anglais, à l'allemand, à l'italien,
à l'espagnol, etc., et dont les sujets parlants savent bien
qu'ils n'appartiennent pas au vieux fonds français. En ce sens
toute langue est mélangée d'éléments étrangers. La part de ces
éléments étrangers peut être grande ; le persan actuel a un vocabulaire
dont, surtout dans la langue littéraire, la plus grande
partie se compose de mots arabes ; le turc osmanli est plein de
mots arabes et de mots persans ; l'anglais a pris, depuis la conquête
normande, un nombre considérable de mots au français et
au latin ; le vocabulaire d'une langue peut ainsi se renouveler
presque totalement par des emprunts à des langues étrangères.
Certains linguistes parlent alors de langues mixtes. L'expression
est impropre. Car elle éveille l'idée qu'une pareille langue résulterait
du mélange de deux langues placées dans des conditions
égales et qu'on ne pourrait pas dire si une langue est la continuation
d'une langue A ou d'une langue B, si le persan par
exemple est la continuation de l'ancien perse ou de l'arabe. Dans
les cas qui ont pu être observés d'une façon précise, on ne constate
rien de pareil, et ce n'est pas un hasard historique ; cela
tient aux conditions mêmes d'existence du langage. Chaque
langue constitue un système, et les sujets bilingues qui ont le
choix entre deux langues ne mêlent pas ces deux langues : quel
que soit le nombre de mots arabes qu'il introduit, le Persan sait
s'il adopte le système persan ou le système arabe, et il n'y a
jamais de doute sur le système adopté. Les Anglais, qui ont admis
des mots français innombrables, n'ont pas mélangé pour cela
le système français au système saxon. Il y a donc, même dans
les cas où les emprunts sont le plus nombreux, deux situations
distinctes : celle de la langue que le sujet veut parler et dont il
emploie ou cherche à employer le système linguistique, et celle
à laquelle il emprunte d'autres éléments, dont le nombre peut
d'ailleurs être aussi grand qu'on le voudra. Il y a, d'une part,
un fonds indigène, et, de l'autre, des emprunts.

Une langue est définie par trois choses : un système phonétique,
un système morphologique et un vocabulaire, c'est-à-dire
83par une manière de prononcer, par une grammaire et par certaines
manières de désigner les notions. Chacune de ces trois
choses comporte un nombre pratiquement illimité de combinaisons,
possibles, et par suite on n'a aucune chance de trouver deux
langues qui, distinctes par ailleurs, aient ou exactement le même
système phonétique ou exactement le même système morphologique.

La prononciation et la grammaire forment des systèmes fermés ;
toutes les parties de chacun de ces systèmes sont liées les
unes aux autres. Le système phonétique et le système morphologique
se prêtent donc peu à recevoir « des emprunts ». En fait
il est rare qu'on emprunte à une autre langue soit un phonème
(un son du langage), soit une forme grammaticale ; quand pareil
fait se produit, il ne modifie pas l'ensemble de chacun des systèmes
et demeure un accident. Au contraire, les mots ne constituent
pas un système ; tout au plus forment-ils de petits
groupes ; on peut soit changer le nom d'un objet, soit introduire
un nom nouveau sans que cela retentisse sur l'ensemble du vocabulaire ;
chaque mot existe pour ainsi dire isolément. Aussi peut-on
emprunter à des langues étrangères autant de mots que l'on
veut ; il suffit qu'une langue étrangère ait un prestige, qu'elle
soit par exemple celle des maîtres comme l'a été l'anglo-normand
en Angleterre à partir du XIe siècle, pour que les emprunts se
multiplient. Tous les mots ne s'empruntent pas avec une égale
facilité : les mots usuels sont plus malaisément remplacés par des
mots étrangers que les mots d'emploi rare ; on emprunte volontiers
les noms d'objets nouveaux ou d'objets à la mode. La grammaire
rend parfois les emprunts malaisés : une langue qui,
comme le français, a des substantifs sans flexion, mais une conjugaison
compliquée, emprunte volontiers des substantifs, mais
relativement peu de verbes. En somme, le vocabulaire est le
domaine de l'« emprunt ». Il n'y a pas de mot d'une langue
dont on puisse dire a priori qu'il n'est pas emprunté à une
langue étrangère. Il n'y a pas de langue ayant une histoire connue
dont le vocabulaire ne renferme des emprunts. C'est donc
avant tout par la persistance de la prononciation et de la grammaire
84que se traduit linguistiquement la volonté continue de
parler une certaine langue qui définit la « parenté de langues ».

Ces systèmes se transforment souvent d'une manière complète.
Notamment quand une langue est adoptée par une population
qui perd son idiome indigène, le changement peut se précipiter ;
la prononciation peut alors changer d'un coup ; la grammaire
peut être simplifiée à l'extrême, comme il est arrivé dans les parlers
créoles. Ici encore, certains linguistes seront tentés de parler
de langues mixtes ; mais le matériel de la langue appartient à
un idiome défini ; le créole de la Réunion ou de la Martinique
est du français imparfait, mais c'est du français ; car c'est à
l'imitation seule du français de leurs maîtres que les nègres l'ont
constitué. La plus grande partie de la conjugaison a été sacrifiée ;
mais ce qui en subsiste, l'infinitif, est français, et l'on n'y
trouve pas le moindre élément africain. Il y a eu perte brusque
d'une très grande partie d'un système grammatical au moment où
une population de langue très différente et placée dans une
situation sociale inférieure a appris une langue nouvelle. Les
changements portent sur l'ensemble de chaque système, et l'on
peut relier le système ancien au nouveau par un ensemble de
formules de transformation. D'ailleurs, au début du moins, il
subsiste toujours dans le système nouveau une portion notable
du système ancien, et le peu que le créole a de grammaire est
de la grammaire française. Tout ce qu'exige la définition, c'est
qu'entre deux moments du développement de la langue immédiatement
voisins l'un de l'autre, il y ait continuité dans l'emploi
du système grammatical.

On ne peut pas dire que tout emprunt phonétique ou grammatical
soit impossible. Dans certaines conditions favorables où
des populations se mélangent d'une manière intime et où des
sujets parlants, perdant le sentiment net d'appartenir à une certaine
nation, ne s'attachent pas à parler leur langue avec pureté,
il peut se produire des emprunts de ce genre. Ainsi, sur le
domaine gallo-roman, à l'époque des invasions franques et de la
domination mérovingienne, la langue de civilisation qu'était le
latin s'est maintenue et a fini par s'imposer au peuple conquérant,
85de langue germanique. Toutefois durant longtemps les
conquérants ont gardé leur langue qui avait le prestige d'être la
langue des maîtres. Le gallo-roman a donc emprunté beaucoup
de mots à la langue des Francs. Mais cette langue comprenait
des phonèmes dont le gallo-roman n'avait pas l'équivalent. ; le
latin vulgaire n'avait pas d'h, alors que h était fréquent en germanique,
et le latin vulgaire avait un v labio-dental (le v français),
alors que les Francs employaient la bilabiale w (w anglais). Les
Francs qui parlaient latin ont gardé h et w dans les mots germaniques
qu'ils mêlaient à leur latin, et les populations gallo-romanes
ont tenu à prononcer correctement ces mêmes mots
germaniques ; hapia a donc gardé son h dans la forme empruntée,
et le mot est représenté en français par hache, avec une h « aspirée » ;
werra a gardé son w qui a fini par se prononcer gu, et ce
mot est représenté en français par guerre ; deux phonèmes nouveaux
se sont introduits ainsi en gallo-roman. Ils ont même été
adaptés à des mots latins ; altu « haut » du latin vulgaire a reçu
h sous l'influence du synonyme germanique hauh ; vespa « guêpe »
a reçu w sous l'influence du synonyme germanique wefsa ; et
ainsi de nombreux autres cas : ceci montre que, pendant un
temps, il a été élégant de prononcer ces mots latins avec un
« accent » germanique. Des mots latins désignant des choses
militaires se sont ainsi conservés avec une prononciation germanisée :
vagina « fourreau » est devenu wagina, qui est représenté
en français par gaîne. Ces deux additions au système phonétique
latin sont quelque chose d'exceptionnel et dont les
langues romanes autres que le français n'offrent pas l'équivalent ;
chose curieuse , elles n'ont guère été durables :le w a rapidement
passé à gu, puis à g tel qu'on l'avait dans des mots indigènes
comme goût ; quant à l'h, elle s'est maintenue davantage ; mais
elle a fini par disparaître aussi, et l'on sait que le français actuel
n'a pas d'h ; la présence ancienne de h se traduit seulement par
des hiatus : la haute montagne. Il y a aussi des emprunts grammaticaux ;
mais, comme les emprunts de phonèmes qu'on vient de
voir, ils sont liés à des emprunts de mots, et ils concernent ce
qu'il y a pour ainsi dire de moins grammatical dans la grammaire.
86Il n'y a pas d'exemple qu'une flexion comme celle de j'aimais,
nous aimions ait passé d'une langue à une autre ; on n'emprunte
une chose de ce genre que si l'on emprunte tout le système d'un
coup, c'est-à-dire si l'on change de langue. Mais le turc a pu emprunter
au persan le relatif ki. Prenant au latin des noms en
-ariu indiquant un métier, le germanique a pu développer un
suffixe -arja-, et, de même que le latin avait- librarius en face de
liber, on a fait en gotique bokareis « scribe » en face de boka
« lettre », bokos « livres » ; et ainsi le suffixe des noms d'agents
en germanique (celui de l'allemand schreiber) se trouve être d'origine
latine ; mais ce n'est encore que de l'emprunt de vocabulaire.
On a même signalé, dans un endroit où le portugais et
l'anglais étaient en contact, l'emploi de tours tels que gobernador's
casa
d'après l'anglais governor's house ; il y a eu ici emprunt
de l'ensemble d'une expression ; d'ailleurs l'élément 's est si autonome
dans ce tour anglais qu'il peut presque passer pour un
mot, et le cas est assez comparable à celui de l'emprunt du relatif
ki par le turc. Il arrive - — en une mesure du reste assez faible
et dans des situations très particulières — qu'on emprunte à une
langue étrangère des petits mots à valeur grammaticale ; on
n'emprunte guère de vraies formes grammaticales. Ainsi l'on est
toujours ramené à la même conclusion : ce qui s'emprunte, ce
sont essentiellement des éléments de vocabulaire.

L'exposé précédent repose sur l'idée que le sujet parlant a toujours
l'intention de parler une langue définie ; et le principe est
valable tant qu'il s'agit de langues nettement distinctes, qui
excluent une communication entre sujets de langues différentes,
comme le français, le provençal, l'italien, l'allemand, le hongrois,
etc. ; peu importe que ces langues soient ou non de
même famille. Les choses se présentent autrement si l'on envisage
des parlers divers appartenant à un même groupe dialectal
ou des patois employés par des gens qui ont par ailleurs une
grande langue commune de civilisation de type voisin de leur
parler local. Alors les sujets parlants peuvent imiter un parler qui
passe pour plus élégant ; le français d'un paysan du centre de
la France est du patois plus ou moins francisé, et toujours incomplètement ;
87le patois de ce même paysan est souvent en grande
partie du français patoisé. Il peut en pareil cas n'y avoir aucun
sentiment net qu'on emploie tel ou tel parler ; alors il y a vraiment
mélange, non de langues, mais de parlers divers d'une
même langue, et l'on ne saurait toujours dire, au terme d'un
développement linguistique de ce genre, quel parler a triomphé.
Mais ceci n'empêche pas de savoir quelle langue ont parlée les
sujets considérés ; le français commun d'aujourd'hui repose avant
tout sur le parisien ; et il s'y mêle de plus en plus tant d'éléments
provinciaux qu'il n'est pas licite de dire que ce soit du
parisien ; en revanche, c'est du français, parce que les sujets
n'ont jamais eu l'intention de parler autre chose que français ;
on ne saurait dire au juste si le grec moderne est de l'attique ou
de l'ionien ; car les sujets n'ont pas toujours voulu parler attique
ou ionien ; mais il est évident que c'est du grec ionien-attique :
la volonté de parler ce grec a été constante chez les sujets qui ont
transmis la langue, et ceci suffit.

La définition de la parenté de langues ne s'applique donc qu'à
de grands groupes, nettement distincts les uns des autres, non
à des parlers distingués par de simples nuances. Et ceci encore
résulte du caractère social de la définition.

II

Ces principes une fois posés, on voit comment peut se prouver
une parenté de langues.

Partout où le système phonétique et le système grammatical
présentent des concordances précises, où des correspondances
régulières permettent de reconnaître l'unité d'origine des mots
et du système phonétique et où le système des formes grammaticales
s'explique en partant d'un original commun, la parenté
est évidente. Les langues romanes sont visiblement parentes,
parce que le nombre des concordances de détail qu'elles offrent
est grand et que leur grammaire et leur système phonétique
s'expliquent dans l'ensemble par une origine commune. L'identité
des grammaires est évidente. Ainsi l'on a à l'infinitif : italien
88cantare, espagnol cantar, français chanter ; à l'indicatif présent,
3e personne, au singulier it. et esp. canta, fr. chante, au
pluriel, it. cantano, esp. cantan, fr. chantent ; au prétérit simple,
2e personne, singulier it. cantasti, esp. cantaste, fr. chantas, pluriel
it. cantaste, esp. cantasteis, fr. chantates etc. Ainsi que l'a
bien montré, ici-même 12, M. Grammont, la constatation de la
parenté facilite beaucoup l'apprentissage des langues en pareil
cas : la seule correspondance, espagnol h — italien et français f,
fait prévoir la forme de beaucoup de mots, comme esp. haba =
ital. fava, fr. fève ; esp. hacer = ital. facere, fr. faire ; etc. Du
même coup l'on voit que l'h espagnole, qui apparaît comme une
divergence dans le système phonétique des langues romanes, est
la transformation d'une f, et comment, par suite, l'espagnol se
ramène historiquement au type général de ces langues. Il se
trouve de plus que les vocabulaires concordent dans une large
mesure ; le fait que l'espagnol a un grand nombre de mots
arabes qui ne se retrouvent ni en italien ni en français ou que
le français a des mots gaulois et germaniques qui ne se retrouvent
ni en italien ni en espagnol ne change rien à la parenté ; car il
s'agit d'emprunts. La preuve d'une parenté de langues est d'autant
plus solide qu'elle se rapproche plus du cas qui vient d'être
sommairement décrit.

Il va de soi que, pour établir une parenté de langues, il faut
faire abstraction de tout ce qui s'explique par des conditions
générales, communes à l'ensemble des langues. Ainsi les pronoms
doivent être des mots courts, nettement constitués avec des éléments
phonétiques aisés à prononcer, et en général sans groupes
de consonnes. Il en résulte que les pronoms se ressemblent plus
ou moins partout, sans que ceci implique une communauté d'origine.
Et, d'autre part, les pronoms se ressemblent souvent assez
peu dans des langues d'ailleurs très semblables ; qu'on compare
par exemple les pronoms de l'arménien avec ceux du gotique ou
de l'irlandais. Même des formes qui, en fait, se ramènent à un
même prototype, comme nous du français et us de l'anglais,
89peuvent ne plus offrir un seul élément commun (l's du français
nous n'étant que graphique). On ne peut donc tirer parti des pronoms
dans la détermination des parentés de langues qu'avec précaution.

Dans cet exposé on n'a tenu aucun compte des ressemblances
générales de structure que peuvent présenter les langues considérées :
le français et l'anglais s'accordent à caractériser plusieurs
catégories grammaticales par un ordre de mots défini, à employer
un article devant les substantifs, à se servir de petits mots accessoires
pour indiquer la possession, l'attribution ; tout cela n'implique
pas une origine commune, parce que, d'une part, les
ordres de mots en question offrent trop peu de variations possibles
pour que les concordances soient significatives, et que,
d'autre part, les petits mots accessoires de même valeur grammaticale
qui sont employés dans ces deux langues ne sont pas réductibles
à des origines communes : ainsi angl. the et fr. le, angl. of
et fr. de, angl. to et fr. à, angl. we et fr. nous, angl. you et fr.
vous, angl. he et fr. il n'ont rien de commun. Si l'on n'avait pas
les anciens dialectes germaniques d'un côté, et le latin de l'autre,
la parenté du français et de l'anglais ne serait pas démontrable.
Le chinois et telle langue du Soudan, celle du Dahomey ou ewe,
par exemple, peuvent se servir également de mots courts, en
général monosyllabiques, faire varier la signification des mots
en changeant l'intonation, fonder leur grammaire sur l'ordre des
mots et sur l'emploi de mots accessoires ; il n'en résulte pas que
le chinois et l'ewe soient des langues parentes ; car le détail concret
des formes ne concorde pas ; or, seule la concordance des
procédés matériels d'expression est probante. C'est pour cette
raison que les linguistes qui exigent des preuves rigoureuses ne
considèrent pas comme établie l'existence de la famille ouralo-altaïque
à laquelle on a autrefois attribué tant d'importance ;
entre le turc d'une part, le finnois et le hongrois de l'autre, il y
a des concordances générales de structure grammaticale ; mais ce
qui prouve une parente, c'est la concordance dans le détail matériel
des moyens d'expression ; or, si l'on trouve des formations
définies communes au finnois et au hongrois et si le finnois et le
90hongrois se laissent expliquer par une même langue commune
(qu'on voie par exemple le petit livre de M. Szinnyci, Finnisch-ugrische
Sprachwissenschaft
), on n'a constaté rien de pareil entre
le finno-ougrien et le turc, et dès lors aucune parenté n'est
démontrée. Le fait de procéder uniquement par suffixation, l'emploi
de l'harmonie vocalique, etc. ne constituent pas des preuves
de parenté.

Quand, dans son article de « Anthropos », VIII (1913), p. 389
et suiv., intitulé The Determination of Linguistic Relationship, un
américaniste éminent, M. Krœber, a protesté contre l'emploi
des concordances générales de structure morphologique pour
établir des parentés de langues, il a eu entièrement raison. Seulement
il n'est pas licite de conclure de là que les parentés
doivent s'établir par la considération du vocabulaire, non par
celle de la morphologie ; si juste qu'elle soit, la critique de
M. Krœber ne justifie pas le procédé de certains américanistes
qui fondent sur de pures concordances de vocabulaire leurs
affirmations relatives à la parenté de telles ou telles langues entre
elles. Les concordances grammaticales prouvent, et elles seules
prouvent rigoureusement, mais à condition qu'on se serve du
détail matériel des formes et qu'on établisse que certaines formes
grammaticales particulières employées dans les langues considérées
remontent à une origine commune. Les concordances de vocabulaire
ne prouvent jamais d'une manière absolue, parce qu'on
ne peut jamais affirmer qu'elles ne s'expliquent pas par des
emprunts. On sait maintenant que les nombreux mots turcs présentés
par le hongrois n'apportent à l'hypothèse d'une parenté du
turc avec le hongrois aucun commencement de preuve. A en
juger par le vocabulaire, l'anglais serait un mélange de germanique
et de roman ; tout au plus pourrait-on constater que le
fonds principal du vocabulaire courant, pronoms personnels,
noms de nombre, noms de parenté, noms des parties du corps,
noms des animaux les plus connus, verbes usuels tels que
« manger » et « dormir », est germanique, et non roman.
Mais il suffit de considérer la grammaire pour lever tout doute :
rien dans le détail matériel de la grammaire anglaise ne
91s'explique par le latin, tout s'y explique par la grammaire
ancienne du germanique.

Il est vrai que la structure générale de la morphologie anglaise
moderne diffère du tout au tout de celle de l'ancienne morphologie
germanique ; mais ceci est sans importance : la parenté
n'implique aucune ressemblance actuelle des langues considérées
, ni
surtout du système général des langues considérées ; et inversement
il y a beaucoup de ressemblances, soit de structure générale,
soit de vocabulaire, qui n'impliquent pas parenté.

Dans l'article cité ci-dessus, M. Krœber insiste sur l'importance
qu'il y a à tenir compte du voisinage géographique des
langues. Sans doute il arrive le plus souvent que les langues
parentes occupent des aires contiguës ou du moins voisines.
Mais, une fois mis à part ce fait grossier, il faut reconnaître que
la contiguïté apporte à la démonstration linguistique de la
parenté une gêne plutôt qu'un secours : les langues voisines sont
celles qui ont subi les mêmes influences, qui ont emprunté les
unes aux autres ou fait les mêmes emprunts à d'autres langues.
La contiguïté des langues oblige donc à faire un départ souvent
très délicat entre les emprunts et le vieux fonds de la langue, qui
seul prouve en matière de parenté. En revanche, le grand éloignement
géographique n'a pas empêché les linguistes de montrer
que la langue de Madagascar représente la même langue ancienne
que celles de Bornéo, de Java et des Philippines.

S'il s'agit de langues parentes qui ont cessé d'être très semblables
entre elles, une forte ressemblance extérieure entre deux
mots est, pour le linguiste, une raison de douter qu'ils représentent
un même terme de la langue originelle. Le français feu
n'a rien de commun avec l'allemand feuer ; en revanche l'allemand
feuer remonte à un original que représentent par ailleurs
des mots assez différents : grec pûr, arménien hur. A qui sait que
le latin, le germanique, le slave et l'arménien représentent une
même langue commune, relativement ancienne, il est facile de
montrer quels rapports il y a entre le français cinq (représentant
le latin quinque) et les équivalents five de l'anglais, piatʼ du russe,
hing de l'arménien ; mais, au premier abord, ces mots ne se
92ressemblent guère. Ce n'est pas sur la ressemblance extérieure
des mots que se fondent les linguistes pour les rapprocher et en
faire l'étymologie, mais sur des formules de correspondances
régulières. Ainsi à un p du grec ou du slave à l'initiale des mots,
répondent h en arménien, f en germanique, l'absence de toute
consonne en celtique. Ces formules une fois établies permettent
de reconnaître dans ses grandes lignes l'histoire de la prononciation
et d'établir comment les systèmes phonétiques se sont succédé
les uns aux autres dans des langues apparentées.

Comme on l'a noté déjà, il n'y a pas lieu pour faire la preuve,
d'exiger que toutes les formes grammaticales s'expliquent ; il suffit
d'établir que des portions notables de la morphologie ancienne
subsistent dans la langue considérée. Nulle part il n'est aussi aisé
d'établir une parenté de langues qu'entre les langues indo-européennes,
parce que la langue commune sur laquelle reposent les
idiomes de cette famille comportait une morphologie très compliquée,
d'une complication qui passe beaucoup la normale, et que
de nombreux restes de ses formes ont subsisté dans chaque
langue; ce sont par exemple les verbes irréguliers du grec, les
verbes forts du germanique, etc. Partout où l'on rencontre des
débris importants du système verbal indo-européen, système que
l'on connaît par les plus anciens textes, ceux de l'indo-iranien
ancien et du grec ancien, on est sûr d'être en présence d'une
langue indo-européenne. La démonstration de parenté est parfaite
si l'on peut expliquer par la transformation des mêmes éléments
anciens l'ensemble du système grammatical de deux
langues distinctes.

A la longue cependant des langues parentes finissent par différer
tant que leur communauté d'origine devient impossible à
reconnaître. Si par exemple on n'avait que le français, le bulgare
et l'arménien modernes pour représenter le groupe indo-européen, il ne serait pas aisé d'établir la parenté de ces trois
langues, et l'on ne pourrait songer à en poser la grammaire comparée.
Il suffit d'opérer avec ces mêmes langues, mais considérées
sous des formes de quelques centaines d'années plus anciennes,
à savoir le latin, le vieux slave des premières traductions et
93l'arménien classique, pour que la parenté devienne évidente et
pour qu'on puisse poser les principes essentiels d'une grammaire
comparée de ces trois langues. La parenté de deux langues peut
donc être, et est souvent, indémontrable, même alors qu'elle est
réelle. On n'est jamais en droit d'affirmer que deux langues ne
sont pas parentes au moins de loin : une parenté se découvrirait
peut-être si l'on avait des formes plus anciennes de ces mêmes
langues.

Bien qu'une démonstration complète de parenté de langues
soit difficile à fournir, on a établi plusieurs grandes familles linguistiques :
la famille indo-européenne qui occupe une aire immense
et qu'on suit historiquement depuis près de trois mille
ans ; la famille sémitique, moins vaste, mais dont les premiers
textes écrits sont plus anciens ; la famille finno-ougrienne ; la
famille bantoue ; la famille indonésienne ; la famille polynésienne
(extraordinairement une) ; la famille dravidienne ; la famille
caucasique du Sud ; d'autres encore. On voit que le principe ne
s'applique pas seulement à l'Europe, ou aux langues indo-européennes,
ou aux grandes langues de civilisation : il est universellement
valable. Il ne manque pas de cas où le travail n'est
pas encore fait, mais déjà l'on entrevoit clairement la possibilité
de mettre en évidence certaines autres familles linguistiques
définies : il doit y avoir par exemple une famille hamitique
dont la grammaire comparée n'est pas encore faite. Il suffit
d'un travail méthodique pour aboutir à coup sûr à des résultats
certains sur plusieurs domaines.

Mais il y a de graves difficultés.

Tout d'abord une difficulté de fait. Pour beaucoup de langues
de peuples non civilisés, on n'a que des vocabulaires, et la grammaire
est ou inconnue, ou connue d'une manière toute partielle.
Si, en pareil cas, on observe un très grand nombre de
communautés de vocabulaire entre certaines langues, et si ces
communautés concernent les mots les moins sujets à emprunt,
notamment les verbes qui indiquent les actions usuelles comme
aller et venir, boire et manger, vivre et mourir, entendre et voir,
dire et se taire, etc., ou des adjectifs comme vieux et neuf, grand
94et petit, long et large, etc., ce serait pur pédantisme que de se
refuser à en faire usage. Seulement il ne faut pas se faire illusion
sur la rigueur de la preuve ainsi faite, bien que la possession en
commun d'un certain fonds de vocabulaire indique le plus souvent
une parenté. Là où l'on n'a pas d'autres données, on peut
provisoirement, et en faisant les réserves nécessaires, se servir
des indications ainsi obtenues. L'observation attentive du vocabulaire
conduit du reste presque toujours en pareil cas à relever
quelques coïncidences grammaticales qui achèvent la démonstration.

En second lieu, les langues spéciales échappent en partie à la
définition qui résulte des considérations présentées ci-dessus.
Elles n'y échappent pas à la lettre ; elles la confirment même en
un sens : les langues spéciales ne comportent en général ni une
prononciation, ni une grammaire propres ; l'argot français par
exemple est caractérisé uniquement par des mots particuliers. Et
ceci montre comment le vocabulaire est indépendant des systèmes
phonétique et morphologique qui définissent une langue :
l'argot est une langue spéciale à l'intérieur du français. La chose
va parfois très loin ; ainsi le tsigane arménien est purement de
l'arménien pour la prononciation et la grammaire ; mais le vocabulaire
n'a rien d'arménien ; ceci s'explique par le fait que les
Tsiganes d'Arménie, sachant l'arménien, ont employé uniquement
le système arménien, mais que, désirant parler une langue
spéciale, inintelligible au reste de la population, ils ont gardé
leur vocabulaire traditionnel. Si l'on applique à la lettre la définition,
le tsigane arménien est purement et simplement de l'arménien ;
mais il faut convenir qu'on est ici en présence d'un cas
tout particulier. Ceci revient à dire que la définition générale
des parentés de langues, faite pour des populations de type normal,
s'applique mal aux langues spéciales de populations parasites.
Toutefois, comme, en ce cas, il n'y a mélange ni au point
de vue phonétique ni au point de vue grammatical, le principe
est rigoureusement confirmé.

En troisième lieu, il y a des langues qui, étant entourées de
langues d'une autre famille et paraissant être des débris isolés
95d'une famille disparue, ne se laissent pas grouper avec les langues
voisines et ne rappellent même aucune langue connue. Leur système
grammatical n'offre de concordances précises avec aucun
autre idiome, ou du moins n'en signale-t-on pas. C'est le cas du
basque par exemple. Un linguiste illustre, un de ces hommes
toujours rares dont les connaissances sont larges et qui se soucient
plus de ce qui reste à trouver que de ce qui est déjà découvert,
M. H. Schuchardt, a été conduit à rechercher si le basque
n'offrirait pas avec des langues hamitiques quelques concordances ;
il y a relevé des mots qui rappellent des mots nubiens, et, d'une
manière générale, des mots hamitiques, et a signalé ces concordances
dans deux articles récents. Mais ces concordances sont
vagues, peu nombreuses. Il n'est pas évident qu'on ne trouverait
pas entre le basque et le vocabulaire d'un groupe quelconque de
langues des concordances analogues. Dans son Baskisch und Hamitisch,
pag. 6 (extrait de la « Revue internationale des études
basques », VII (1913), M. Schuchardt dit que les jeunes gens
dont le coup d'œil n'est pas assez formé sont trop portés à tenir
les comparaisons de mots pour fortuites : on en juge tout autrement,
dit-il, quand on s'est beaucoup exercé aux comparaisons
de mots et qu'on a acquis en cette matière un certain sentiment
statistique. Mais on ne peut pas fonder une doctrine sur un sentiment
individuel. Et d'ailleurs, même si les ressemblances de
vocabulaire signalées ne sont pas fortuites, on n'a aucun moyen
de montrer qu'elles ne proviennent pas d'emprunts. Peut-être
dira-t-on que, si l'on n'avait de langues indo-européennes que le
français actuel et l'arménien moderne, les seules traces de la
parenté de ces deux langues qu'on pourrait découvrir seraient des
mots, comme le nom de mère, en arménien actuel ; mer ou mar,
suivant les dialectes ; ou le nom de nombre dix, en arménien
tas ou das suivant les dialectes ; et ce sont en effet des traces
valables pour qui connaît la parenté des deux langues, mais ce
ne seraient pas des preuves pour qui ne la connaîtrait pas, et
en fait la ressemblance frappante de ces mots, effectivement
parents, provient d'une série d'accidents fortuits. Au lieu de
converger, ces mots auraient pu tout aussi bien diverger comme
96fr. père et arm. her ou har, fr. vingt et arm. khsan, qui sont également
parents ; et la communauté d'origine serait impossible à
reconnaître directement. Si donc on peut d'abord constater des
ressemblances de vocabulaire entre deux ou plusieurs langues
pour indiquer de quel côté il faut chercher, ce n'est pas de là
que peut venir une démonstration définitive ; le vocabulaire ne
peut servir qu'à orienter la recherche ; la preuve se trouve ailleurs.

Enfin, le procédé de démonstration des parentés de langues
indiqué ici s'applique bien à des langues dont le type originel a
comporté une grammaire compliquée. S'il s'agit de la famille
indo-européenne ou de la famille bantoue, il n'y a pas de difficulté ;
tant qu'on n'a pas affaire à des langues séparées de la période
commune par un trop long intervalle de temps ou par des altérations
trop profondes, les choses sont même le plus souvent évidentes
du premier coup. D'anciennes langues indo-européennes
comme le gotique ou le slave ont une grammaire très différente
de l'ancienne grammaire indo-européenne ; mais il subsiste assez
de restes de cette grammaire, soit parmi les formes régulières,
soit surtout parmi les formes anomales pour que le caractère
indo-européen de la langue se voie sans exiger une démonstration.
Si transformé, si éloigné de l'ancien type indo-européen
que soit le « tokharien » récemment découvert en Asie centrale,
on l'a du premier coup reconnu pour indo-européen ; le nombre
des particularités grammaticales indo-européennes conservées y
est encore grand. Mais, si l'on est en présence de langues qui
n'ont presque pas de grammaire, si presque toute la grammaire
proprement dite tient en quelques règles de position relative des
mots, comme dans certaines langues d'Extrême-Orient ou du
Soudan, le procédé ne s'applique pas. Et alors la question des
parentés de langues est pratiquement insoluble, aussi longtemps
qu'on n'aura pas trouvé de critères qui permettent d'affirmer
que des langues de ce type sont issues les unes des autres et que
les ressemblances de vocabulaire qu'elles offrent ne sont pas dues
à des emprunts. Il ne résulte pas de là que le principe, applicable
ailleurs, devienne mauvais ici, mais seulement que certaines
97langues ne comportent pas, en l'état présent des connaissances,
une classification généalogique. Il appartient aux linguistes qui
s'occupent de ces langues d'aviser à tourner la difficulté. La
chose n'est pas impossible, pour peu qu'on sache rester fidèle à
l'esprit du principe plutôt qu'à sa lettre.

Si même une solution ne se laissait pas trouver, il n'y aurait
pas lieu de critiquer les linguistes à cause de cette impuissance :
il est remarquable qu'on puisse en certains cas faire la preuve de
la parenté de langues par des faits d'ordre purement linguistique ;
mais il n'est pas surprenant que cette preuve ne soit pas toujours
possible ; il est naturel qu'elle s'applique seulement aux cas où
les faits envisagés ne sont pas séparés du début de l'époque proprement
historique par un trop long espace de temps et où les
transformations n'ont pas été trop profondes. De par sa nature,
la classification généalogique des langues admet d'être incomplète.
Elle se complétera au fur et à mesure qu'on acquerra des
données sur l'histoire des langues.

C'est dire que le problème de l'unité d'origine des langues qui
préoccupe certains linguistes ne saurait se discuter actuellement.
Les problèmes qui peuvent être utilement posés à cet égard sont
ceux qui sont relatifs à la constitution exacte de familles qu'on
entrevoit, mais qu'on n'a pas étudiées avec précision. Les familles
qu'on a constituées jusqu'ici sont celles qui apparaissent aisément
ou celles qui renferment des langues de civilisation importantes.
Le travail qui reste à faire est plus décourageant, car il s'agit en
partie de langues où les relations de parenté sont malaisées à
établir, en partie de langues sauvages peu connues et que presque
personne n'a d'intérêt pratique à étudier. Il a été aisé d'établir la
parenté de langues dont on avait de bonnes grammaires et dont
la philologie était faite ; on est maintenant devant des langues
dont il faut faire la grammaire et dont la plupart, faute de textes
anciens, ne comportent aucune philologie. Il y a donc un grand
travail d'observation à faire. Si des résultats plus nombreux ne
sont pas acquis, cela tient avant tout au petit nombre ou à l'absence
de savants qualifiés capables de faire ce travail. Pour compléter
rapidement la classification généalogique des langues, il
98suffirait de former quelques équipes de linguistes. Un seul bon
travailleur peut suffire à poser une grammaire comparée là où
l'on a de bonnes descriptions ; c'est ainsi que M. Brandstetter
constitue actuellement la grammaire comparée des langues indonésiennes.

Il n'y a pas de raison de croire que certaines langues communes
d'où sortent les grandes familles établies ne sont pas, à leur tour,
des transformations d'une même langue plus ancienne. On peut
imaginer, par exemple, que l'indo-européen, le sémitique (qui
est apparenté au hamitique), le caucasique du Sud et le finno-ougrien
sortiraient d'une même langue plus ancienne ; il a déjà
été signalé des concordances entre l'indo-européen et le sémitique,
entre l'indo-européen et le finno-ougrien, entre le caucasique du
Sud et le sémitique. Mais beaucoup de ces concordances ne
concernent que le vocabulaire et ne sauraient passer pour probantes ;
celles qui concernent la grammaire sont peu nettes et
peu nombreuses. La preuve n'est pas faite ; elle ne pourrait du
reste être acquise que le jour où la grammaire comparée du sémitique
et du hamitique sera constituée, ainsi que celle du caucasique
du Sud dont il ne faut peut-être pas séparer les langues
caucasiques du Nord, lesquelles sont très variées ; il faudrait
tenir compte des langues d'Asie Mineure, du lycien qu'on ne
comprend guère, du hittite qu'on n'a pas encore déchiffré 13, ou
de langues plus lointaines comme l'élamite. Il se pose là de grands
problèmes, dont la solution n'est pas désespérée. Mais on a souvent
eu le tort, dans les derniers temps, de vouloir les résoudre
avant d'avoir fait les travaux préparatoires nécessaires. Tant que
la grammaire comparée du hamitique et celle du caucasique
seront à peine esquissées, tant que, par suite, la position exacte
du sémitique sera inconnue, il sera prématuré de vouloir relier le
sémitique à l'indo-européen.99

Toutefois les meilleurs linguistes feront œuvre vaine s'ils
s'attaquent directement à des langues trop différentes ; on pourra
peut-être rapprocher un jour les grammaires comparées de l'indo-européen,
du sémitique, du hamitique, du caucasique, du
finno-ougrien ; il y a là une hypothèse qu'on pourra essayer de
vérifier quand les travaux préparatoires suffisants seront faits, et
que, dès maintenant, plus d'un fait rend vraisemblable. Mais il
serait vain de vouloir comparer aujourd'hui le latin, l'hébreu et
le géorgien. Tout essai de ce genre est une faute évidente contre
la méthode.

La classification généalogique des langues est en fait, on le voit,
chose différente des classifications biologiques. Une classification
telle que la classification linnéenne consiste à rapprocher des êtres
qui ont des structures anatomiques analogues et où au moins
le commencement du développement de chaque individu depuis
la cellule initiale est comparable, donc des êtres qui, dans leur
développement individuel, offrent actuellement des caractères communs,
alors même que, à l'état adulte, leur aspect extérieur et les
fonctions remplies par certains de leurs organes diffèrent le plus.

Il est possible, et l'on admet en général, que les êtres qui
sont ainsi rangés dans une même classe sortent d'un même ancêtre
ou d'ancêtres exactement semblables ; mais cette hypothèse,
qui explique les ressemblances constatées, n'est pas le principe de
la classification, bien que les biologistes tendent de plus en plus
à tenir compte de la façon dont ont évolué les êtres qu'ils étudient
et qu'ils classent, et aussi à ne pas négliger les rapports entre les
diverses classes. Le jour où les biologistes arriveraient à suivre
exactement l'évolution qui a abouti à différencier les espèces,
leurs classifications deviendraient comparables aux classifications
linguistiques ; entre les unes et les autres, la différence essentielle
serait seulement celle du degré de rapidité de l'évolution, l'évolution
linguistique étant beaucoup plus rapide, l'évolution biologique
souvent si lente que les espèces semblent stables.

Pour le linguiste, seul le fait historique de la continuité entre
une langue ancienne et des langues postérieures entre en considération.
En l'état présent des choses, l'anglais et le russe sont
100deux langues de type absolument distinct, et c'est à peine si l'on
y peut discerner quelques éléments de vocabulaire semblables ;
cela n'empêche pas que ce soient deux langues indo-européennes ;
la preuve résulte de ce que l'anglais moderne continue le vieil
anglais, et le russe moderne, le vieux russe ; or, le rapprochement
du vieil anglais et du vieux russe est démontrable directement,
et surtout il est facile de prouver que le groupe germanique
dont l'anglais fait partie et le groupe slave dont le russe
est l'un des représentants sont tous deux des formes prises par
la langue indo-européenne commune. Tant que deux langues de
même famille subsistent, leur appartenance à cette famille ne
saurait subir un changement, quelles que soient les transformations
subies, et même si les altérations intervenues ne laissent
subsister aucune trace de la commune origine des deux idiomes.

La détermination de la famille à laquelle appartient une
langue est une donnée indispensable à fixer pour faire l'histoire
de cette langue. Mais, cette donnée une fois acquise, il reste à
déterminer le détail des changements intervenus et à reconnaître
les influences subies. Ces changements et ces influences sont
souvent pour beaucoup plus que la langue initiale dans le résultat
final. La notion de parenté de langues est chose précise ;
mais, justement parce qu'elle est définie d'une manière précise,
elle n'est que l'une des données avec lesquelles opère l'historien
du langage.

Comme la parenté de langues est rigoureusement déterminable
et que, au contraire, à part les emprunts de mots, les influences
qui déterminent les changements linguistiques ne se laissent ni
reconnaître d'une manière exacte, ni surtout établir d'une manière
certaine, la parenté tient, dans les théories des linguistes, une place
qui dépasse — et sans doute de beaucoup — son importance
réelle. Mais, en la définissant bien et en n'oubliant pas que la tradition
continue des parlers n'est ni le tout ni toujours le principal
de ce qui conditionne le développement des langues, on peut
fonder sur la théorie de la parenté la théorie historique des
langues.101

11. Scientia (Rivista di scienza), vol. XV, n° XXXV-3 (1914).

21. Scientia, vol. XII, n° XXIV-4 (1912), p. 72 et suiv.

31. Le présent article a paru en 1914 ; les textes hittites sont maintenant lus
et déchiffrés, surtout par M. Hrozný ; mais l'interprétation est encore très
hypothétique, et l'affirmation que le hittite serait indo-européen paraît bien
aventurée ; elle a été contestée par la plupart de ceux qui ont examiné les
documents.