Meillet, Antoine. Linguistique historique et linguistique générale. Tome II – T08

Introduction
à la classification des langues 1

La trop fameuse classification en langues isolantes, agglutinantes
et flexionnelles ne se laisse pas poursuivre exactement, et,
pour autant qu'elle se laisse formuler, elle n'a ni portée scientifique
ni utilité pratique.

La seule classification linguistique qui ait une valeur et une
utilité est la classification généalogique, fondée sur l'histoire des
langues. C'est celle qui fournira le plan du présent ouvrage.

Le principe en est connu : lorsqu'une langue est parlée sur un
domaine étendu et que les individus qui l'emploient viennent à
cesser d'avoir les relations régulières et continues qui maintenaient
l'unité de langue, les changements qui ont lieu dans les diverses
parties du domaine ne sont pas identiques ; et, au bout d'un
temps, variable suivant les cas, les différences entre les parlers
locaux qui continuent la langue d'abord commune deviennent
telles que les occupants des diverses régions cessent de se comprendre
aisément, entre eux. Dans la mesure où les habitants de
provinces différentes cessent de se comprendre, on peut dire que
la langue commune est remplacée par des langues nouvelles.

Ainsi le latin, qui était la langue commune de la partie occidentale
de l'Empire romain, s'est développé de manières différentes
dans les diverses parties de l'Italie, de la péninsule hispanique,
de la Gaule, etc., à partir du moment où la civilisation
antique s'est disloquée. Et, sans qu'ils se soient à aucun53

moment rendu compte du fait qu'ils ne parlaient plus latin, les
habitants des diverses régions se sont trouvés employer des
langues nettement distinctes les unes des autres — et toutes très
différentes du latin — au IXe siècle après J.-C. Les parlers
italiens, hispaniques, gallo-romans, rhéto-romans, roumains sont
tous du latin, mais du latin qui a évolué de manières diverses.

Les évolutions divergentes subies par le latin ont eu lieu à
date historique. Des évolutions divergentes du même type ont eu
lieu à des moments sur lesquels on n'a aucun témoignage historique.
Mais les faits linguistiques suffisent souvent à l'indiquer.
Par exemple, les concordances qu'on observe entre le sanskrit, la
langue de l'Avesta, le grec ancien, le latin ancien, le vieil irlandais,
le gotique, le vieux slave, l'ancien arménien, etc., ne
peuvent s'expliquer si ces diverses langues ne résultent pas
d'évolutions diverses d'une seule et même langue, dite indo-européenne.

De là résulte la définition des termes : famille de langues et
langues parentes.

Une famille de langues est l'ensemble des parlers plus ou moins
différenciés entre eux qui continuent une même langue commune.
Ainsi la famille romane ou néo-latine est l'ensemble des
langues qui sont des formes diversement évoluées du latin. La
famille indo-européenne est l'ensemble des langues qui sont des
formes diversement évoluées de l'indo-européen.

Des parlers parents, des langues parentes sont des parlers, des
langues qui font partie d'une famille ainsi définie.

Cette définition est purement historique. Elle n'implique entre
les langues considérées aucune concordance ni de type général
ni de détail. Il subsiste d'ordinaire des concordances, et souvent
de très considérables. Mais on n'en peut jamais prévoir l'étendue
ni le caractère particulier.

Des langues parentes peuvent différer entre elles au point que
la parenté ne soit plus reconnaissable à aucun trait. Par exemple,
entre le polonais et l'anglais actuels, les ressemblances sont très
petites et dans la structure d'ensemble et dans le détail. On sait
néanmoins que l'anglais et le polonais appartiennent à un même
54groupe : le groupe indo-européen ; mais c'est parce que l'on
peut établir, par des procédés indirects, que l'un et l'autre
résultent d'une série de transformations qui ont eu lieu de manière
continue entre l'indo-européen commun et l'anglais d'une part,
le polonais de l'autre.

A l'intérieur d'une même famille, il peut se constituer des
familles nouvelles. Une langue qui est une forme évoluée d'une
langue antérieure peut se différencier à son tour en langues
diverses. De même que l'indo-européen s'est différencié en
indo-iranien, grec, latin, germanique, etc., le latin s'est différencié
en italien, espagnol, portugais, provençal, français, etc. ; le germanique
s'est différencié en gotique, Scandinave, allemand,
anglais, etc.

Dès lors, il est impossible d'établir que deux langues ne sont
pas parentes. Il est aisé de montrer que le flamand n'a aucun
des caractères auxquels on reconnaît une langue romane. Mais le
flamand est une langue germanique, donc l'une des langues indo-européennes ;
il est donc indo-européen comme les langues
romanes, qui sont du latin évolué. La parenté n'est pas la parenté
proche des langues romanes ; c'est la parenté indo-européenne,
plus lointaine. Dès lors, le fait que le finno-ougrien et l'indo-européen
sont très différents ne prouve pas que les deux groupes
ne continuent pas un original commun, beaucoup plus éloigné
dans le passé.

Toute classification généalogique des langues exprime seulement
le fait historique d'une communauté linguistique ayant
existé à un moment du passé. On peut donc toujours imaginer
que, en montant plus haut dans le passé, on découvrirait une
communauté linguistique à laquelle se rattacheraient deux
langues ou deux groupes de langues qui ne se laissent pas expliquer
par les communautés linguistiques actuellement déterminées.

Le difficile est de faire la preuve.

Toutes choses égales d'ailleurs, il y a chance pour que deux
langues parentes divergent d'autant plus qu'elles sont séparées
depuis plus longtemps. Par suite, la preuve d'une parenté de
55langues est plus difficile à administrer au fur et à mesure que
la communauté supposée est plus loin de l'époque où sont
attestées les langues à considérer.

Il est facile de prouver que les langues romanes sont parentes
entre elles, parce que, entre la période où le latin a commencé
à se briser en parlers divers et les plus anciens textes des langues
romanes, il ne s'est écoulé que peu de siècles. Et, si l'on est
bien éclairé sur la parenté des langues indo-européennes entre
elles, c'est que l'on a, sur plusieurs de ces langues, des
données de plusieurs siècles antérieures à l'époque chrétienne, et,
pour presque toutes, des données antérieures au Xe siècle après
J.-C. Si l'on devait faire la théorie des langues indo-européennes
seulement avec les formes actuelles de ces langues, on en apercevrait
la parenté ; mais il serait impossible d'en construire une
grammaire comparée précise comme on le fait grâce aux anciens
monuments qu'on possède de diverses langues.

Or, pour la plus grande partie des langues du monde, les
données dont on dispose sont le plus souvent ou peu anciennes ou
seulement modernes. Ces données permettent de déterminer des
communautés qui remontent à un nombre restreint de siècles
dans le passé. Mais, là où il faudrait admettre des communautés
de beaucoup antérieures à la communauté indo-européenne ou à
la communauté sémitique, les changements intervenus entre
ces périodes, qu'on devrait supposer antérieures de plusieurs
millénaires à l'ère chrétienne, et l'époque actuelle, sont tellement
profonds que toute démonstration devient illusoire.

Du reste, la classification généalogique a d'autant moins de
valeur, soit pour permettre l'étude historique des langues, soit
pour en faciliter l'apprentissage, que les langues considérées
conservent moins de traits communs. Si, ne connaissant de l'anglais,
du français, du polonais et de l'arménien que les formes
actuelles, on devait faire l'histoire de ces langues à l'aide de la
seule comparaison, on n'irait évidemment pas loin ; et, de savoir
que ces quatre langues sont des formes diverses prises par un
même idiome, parlé il y a quatre ou cinq mille ans, n'aiderait
ni à les parler ni à en comprendre le développement. Intéressante
56pour l'historien, cette conclusion ne serait guère utile directement
au linguiste.

Si le fait que certaines langues sont des formes prises avec le
temps par une langue commune est une donnée précieuse pour
l'histoire, il n'en faut pas, même à ce point de vue, exagérer la
portée.

Dans toute langue, il y a lieu de considérer, à côté du fonds
transmis au cours des générations, les forces — pour la plupart
inconnues — qui ont déterminé les changements. Le français
est du latin transformé. Mais la transformation a été radicale :
par la structure générale comme par le détail, le français est très
différent du latin ; par suite, les forces d'où vient la transformation
entrent dans l'état actuel du français pour une part
qui ne se laisse ni mesurer ni même évaluer approximativement,
mais qui dépasse en importance la part de l'élément latin
ancien. Les linguistes insistent sur l'état de choses initial, en
l'espèce sur le latin, parce qu'ils le connaissent plus ou moins,
soit par des témoignages directs — c'est le cas du latin — , soit
par des procédés comparatifs ; ils ne parlent guère des forces de
transformation, parce que jusqu'ici on n'est pas arrivé à se
former d'idées précises à ce sujet. Mais il ne faut pas se laisser
abuser par l'imperfection actuelle des connaissances.

D'ailleurs, il y a une part de la langue — et souvent une très
large part — dont la classification généalogique ne tient pas
compte. Ce sont les emprunts. Qui voudrait expliquer l'ensemble
du vocabulaire français actuel par le développement du
« latin vulgaire » d'époque impériale, se trouverait devant un
reste énorme dont il ne pourrait rien faire : la plus grande partie
du vocabulaire français a été « emprunté » au latin des livres,
ancien ou médiéval, et à des langues diverses : allemand, arabe,
italien, espagnol, anglais, etc. Toutes les fois que, par suite
d'altérations internes de la langue ou du besoin d'exprimer des
notions nouvelles, il a fallu au français des mots nouveaux, ces
mots ont été pris systématiquement au latin écrit, et adaptés pour
la forme et pour le sens ; ainsi le latin écrit, ancien et médiéval,
entre dans la composition du vocabulaire français moderne pour
57autant ou pour plus que le « roman commun » (le latin vulgaire)
des romanistes. A une époque plus récente, le vocabulaire grec
a été largement mis à contribution. La structure des phrases a
aussi subi des influences étrangères, surtout celle du latin écrit.

L' « emprunt » est particulièrement visible là où il est fait à
une langue de type tout différent ; ainsi le persan actuel, qui
est une langue indo-européenne, doit à peu près tout son vocabulaire
des choses de l'esprit à l'arabe, qui est une langue sémitique.

La part de la langue qui se maintient de génération en
génération en se transformant progressivement est le système
grammatical. Sans doute la morphologie latine est loin de la morphologie
indo-européenne, et la morphologie française, loin
du système latin ; il y a là trois structures distinctes. Mais
beaucoup de particularités du système latin se retrouvent en
français, et beaucoup de particularités du système indo-européen
se retrouvent en latin. Et de plus, on voit comment le système
français est sorti du système latin, et le système latin du système
indo-européen. Il y a une continuité dans la morphologie, et
c'est cette continuité qui permet le classement. Le classement
généalogique est fondé sur la continuité de la morphologie.

On reconnaît la parenté à des détails comme la concordance de
il est, ils sont, en français, er ist, sie sind, en allemand, beaucoup
plus qu'à des ressemblances de structure générale. C'est donc
avec les formes « fortes » et surtout avec les formes anomales
des langues indo-européennes attestées qu'on parvient à retrouver
la norme de l'indo-européen, et par suite, à poser la grammaire
comparée de l'ensemble du groupe. Et en effet, du fait des
influences subies, la structure morphologique est sujette à changer
du tout au tout : le français ou l'anglais ont des structures
plus proches de celle du chinois que de celle de l'indo-européen,
il résulte de là que l'examen du type linguistique général ne
fournit pas le moyen d'établir un classement généalogique des
langues. On en peut tirer tout au plus une indication. C'est
58ainsi que, malgré la ressemblance de type général, on a cessé de
former une famille unissant le turco-mongol au finno-ougrien.

Le système phonique, beaucoup moins stable que le système
morphologique, a cependant aussi une certaine fixité et fournit
des indications utiles.

En revanche, le vocabulaire est sujet à des innovations
brusques et capricieuses. Il traduit des influences de civilisation,
plutôt que la continuité linguistique, exprimée par le classement
généalogique. Sans doute ; il se conserve en général un nombre
plus ou moins grand de vieux mots usuels, souvent des verbes
tels que ceux signifiant « boire » et « manger », « aller » et
« venir », etc., et des adjectifs, souvent aussi des substantifs
comme les noms de parenté, d'animaux familiers, etc. Mais ce
qui concerne la vie sociale, la vie intellectuelle, est sujet à l'emprunt.
Les termes de civilisation sont fournis en grande partie
par de grandes langues de culture qui servent à de vastes
domaines et qui souvent ne sont pas de la même famille que
les langues auxquelles elles fournissent des mots.

Ainsi la civilisation grecque, qui a fourni la base de la civilisation
occidentale moderne, a donné au latin beaucoup de mots,
et surtout le grec a servi de modèle aux lettrés qui ont constitué
la langue latine écrite. Directement ou indirectement, le
grec a été la source ou le modèle de tous les vocabulaires savants
qui se sont établis depuis le début de l'ère chrétienne sur tout
le bassin méditerranéen.

L'arabe est la source où s'alimentent tous les vocabulaires des
peuples de religion islamique.

L'Inde a exercé sur l'Asie centrale, l'Indo-Chine, la Malaisie
une forte action, surtout grâce à l'extension du bouddhisme.

Le persan a, depuis le Xe siècle, beaucoup agi en Asie centrale
et jusque dans l'Inde.

En Extrême-Orient, c'est le chinois qu'on voit fournir le
vocabulaire de civilisation à l'Annam, à la Corée, au Japon, par
exemple.

Le nombre de ces grandes langues de civilisation est petit et
l'influence de chacune a été immense.59

Les alphabets employés indiquent en général quelles sont les
influences de ce genre qui se sont exercées. L'extension des
alphabets cunéiformes, grec (et latin, dérivé du grec), araméen,
arabe, indien, chinois donne une première indication sur les
zones d'influence de chaque langue de civilisation.

En somme les trois principaux types de faits avec lesquels on
opère sont en premier lieu la continuité linguistique, qui se
manifeste surtout dans le système morphologique et sur laquelle
repose toute la classification généalogique — en second lieu,
les influences qui ont déterminé les changements (ces influences
sont presque toujours non déterminées jusqu'ici, il est vrai, et le
présent ouvrage n'en pourra presque pas faire état, mais l'importance
en est capitale) — en troisième lieu, l'action des langues de
civilisation dont relèvent en grande partie les faits relatifs au
vocabulaire.

Qu'il s'agisse de l'extension des langues communes, d'où
résultent les familles de langues définies, ou des grandes séries
d'emprunts, qui caractérisent le type d'influence de culture,
les deux faits dominants qu'on vient d'indiquer, à savoir la
langue commune initiale et la langue qui fournit les mots
empruntés, traduisent des faits de civilisation : la langue qui se
répand est, en général, celle du groupe qui apporte le principe
d'organisation sociale, et la langue ou les langues qui fournissent
les emprunts, sont celles par lesquelles s'exprime la culture.

Ces grands faits sont ceux qu'on observe dans les cas clairs,
ceux qui traduisent des influences de civilisation agissant avec
force et avec amplitude.

Mais il peut y avoir des situations plus complexes.

Toutes les familles de langues bien établies supposent un
même type de développement historique : extension d'une
langue commune sur un large domaine, puis différenciation de
cette langue, lorsque disparaissent les conditions qui avaient déterminé
l'unification. Cette extension suppose l'existence d'une
60nation possédant une civilisation propre, et ayant conscience de
sa force, de son originalité. Elle résulte du prestige qu'a eu cette
nation.

Pareil type de faits s'est souvent réalisé dans le passé, et on
le voit se réaliser encore aujourd'hui ; car l'extension des langues
communes est un trait frappant du monde actuel. Le français
commun par exemple remplace les anciens parlers locaux qui
s'éliminent. L'anglais s'étend sur le monde. La grande extension
des langues indo-européennes tient à ce que, parlées par une
nation douée du sens de l'organisation et de la domination, elles
se sont peu à peu substituées à un grand nombre d'autres langues,
comme on le voit en Italie pour le latin. L'extension des langues
sémitiques, de l'assyro-babylonien, de l'hébréo-phénicien, de
l'araméen, et depuis le VIIe siècle après J.-C, de l'arabe, est un
fait qu'on suit historiquement.

Mais il n'est pas évident que les choses se soient partout
passées de cette manière. Il peut s'être produit des mélanges de
populations plus troubles, en des conditions moins simples. Dès
lors, on ne saurait appliquer à toutes les langues les procédés de
comparaison qui sont de mise là où il y a eu extension d'une
langue commune, comme il est arrivé pour l'indo-européen, le
sémitique, le finno-ougrien, l'indonésien, le bantou par exemple.
On peut se demander par exemple si les langues américaines,
encore mal connues pour la plupart et peu étudiées au point de
vue comparatif, se prêteront jamais à l'établissement de grammaires
comparées précises et complètes ; les sondages faits jusqu'ici
promettent peu.

Dans les langues où le système morphologique ne comporte pas
de formations obtenues par des variations compliquées des mots,
comme celles d'Extrême-Orient ou certains idiomes soudanais,
on peut se représenter de véritables mélanges de langues. Au
contraire une langue comme le latin ne peut se mélanger à
aucune autre : on emploie ou on n'emploie pas la morphologie
latine ; si on l'emploie, on parle latin, quelque vocabulaire
qu'on y joigne ; si on ne l'emploie pas, on ne parle pas latin,
même quand le vocabulaire est purement latin. Mais il est concevable
61qu'une langue telle que l'annamite, où toute la grammaire
consiste dans la manière de grouper des mots invariables, puisse
se mêler à une autre. Par suite, dans les cas de ce genre, non
seulement il est presque impossible d'établir une classification
généalogique et de la démontrer, faute d'avoir des données
morphologiques par lesquelles seules la preuve se laisse administrer
avec rigueur ; mais il n'est même pas évident que le
principe de la classification généalogique s'applique. Ce doute
doit être signalé, bien que, en fait, partout où l'on a des données
suffisantes, les langues — quel que soit le degré de civilisation de
ceux qui les parlent — semblent se ramener de plus en plus à
un petit nombre d'origines communes, au fur et à mesure qu'elles
sont mieux étudiées.

Exprimant des faits historiques de types divers, la classification
généalogique des langues ne saurait être homogène. Le sens
du mot : parenté de langues, varie donc d'un groupe linguistique
à l'autre, d'une langue à l'autre, d'un parler à l'autre.
Essayer de faire une classification exacte et complète de toutes
les langues en familles rigoureusement définies, c'est montrer
déjà qu'on n'a pas compris le principe de la classification généalogique
des langues.

En beaucoup de cas, les données dont on dispose sont du reste
insuffisantes. Qu'il s'agisse d'Afrique, d'Amérique ou d'Australie,
il y a nombre de langues dont la morphologie est mal
décrite, ou même ne l'a jamais été. Pour situer ces langues, on
est alors réduit à constater des ressemblances de vocabulaire et
de type phonique, moins probantes par nature que ne sont les
détails grammaticaux définis avec lesquels on démontre la réalité
des familles indo-européenne, sémitique, finno-ougrienne,
bantou, etc.

Une certaine unité de procédés phonétiques indique déjà
parfois parenté. Ainsi les langues indo-européennes n'offrent
guère les consonnes laryngales, qui sont au contraire courantes en
sémitique. Il y a, dans les concordances de ce genre, sinon une
preuve solide, du moins une indication. Quand une indication
phonique est confirmée par des concordances nettes et systématiques
62de vocabulaire, portant sur des mots anciens peu sujets à
l'emprunt, on peut considérer la parenté comme probable.

Enfin les lacunes qui subsistent dans la classification généalogique
des langues tiennent en une large mesure à l'insuffisance
des descriptions et des études comparatives faites jusqu'ici ; on
n'en pourra mesurer la portée réelle que le jour où les recherches
auront été poussées beaucoup plus avant.

En effet, faute d'études complètes et approfondies, bien des
parentés de langues restent à établir, qu'on entrevoit seulement
aujourd'hui. De plus, beaucoup de langues sont mal décrites ;
pour une notable partie des langues africaines, américaines,
australiennes, on ne possède que des vocabulaires ; la grammaire
en est presque inconnue. Là même où l'on a des descriptions
relativement complètes, le travail de comparaison est à peine
amorcé le plus souvent.

Il n'entre pas dans le plan d'un manuel aussi bref que celui-ci
de discuter la question difficile et controversée des rapports
entre les grandes familles établies. Il a été produit des faits qui
tendent à établir une parenté entre le sémitique et l'indo-européen,
entre le finno-ougrien et l'indo-européen. Dans les deux
cas, les rapprochements portent bien plus sur le vocabulaire que
sur la morphologie proprement dite. L'hypothèse d'une parenté
lointaine de l'indo-européen, des anciennes langues asianiques
(lycien, carien, etc.), du caucasique, du finno-ougrien et du
chamito-sémitique n'a rien d'invraisemblable, et l'on conçoit la
possibilité d'une langue commune dont toutes ces langues
seraient des transformations diverses. Mais les traits de cette
langue commune sont si peu dessinés qu'il serait prématuré de
rien affirmer, et, par suite, d'en faire état ici. La démonstration
est rendue malaisée par le fait que la morphologie compliquée
de l'indo-européen, par exemple, semble résulter d'un développement
relativement récent, et que, par suite, on n'a guère
de chance d'en retrouver les éléments en sémitique ou en finno-ougrien.
63Or la parenté de langue perd son sens, on l'a vu, là où
ne se reconnaissent pas des continuités de formes grammaticales.

A plus forte raison, il convient de laisser en suspens la question
de l'unité d'origine du langage humain et, bien entendu,
par là même celle de l'origine du langage.

La parité des conditions anatomiques, physiologiques et psychiques
dans les divers types humains est telle que les traits
essentiels de structure sont sensiblement les mêmes partout :
tous les hommes se servent de procédés phoniques semblables
en gros, tous parlent par mots groupés de diverses manières. Le
détail varie ; le fond des procédés linguistiques est le même dans
toute l'humanité. Dès lors, il est malaisé de prouver que quelques
ressemblances de détail qui ne se ramènent pas à des systèmes
morphologiques définis par des faits particuliers, établissent une
parenté entre certaines langues. Ici, on ne fera état que des
parentés établies par une grammaire comparée au moins esquissée
dans ses grandes lignes ou, à défaut de témoignages précis sur
la grammaire, par des groupes cohérents de rapprochements frappants
de mots peu empruntables en général et par des ressemblances
du type phonétique.

Néanmoins, il apparaît dès maintenant que la plupart des
langues se rattachent à un petit nombre de familles définies ;
ainsi presque toutes les langues de l'Europe et une partie de
celles de l'Asie appartiennent au groupe indo-européen. Toutes
les langues du sud de l'Afrique, sauf le hottentot, appartiennent
au groupe bantou ; et l'on entrevoit que toutes les langues des
populations nègres seraient parentes entre elles. C'est dire que,
à des dates historiques ou proches de l'époque historique, un
nombre restreint de langues communes s'est étendu. Le fait
n'a rien de surprenant : les langues sont faites pour communiquer ;
elles rendent d'autant plus de services qu'elles permettent
de communiquer avec plus d'hommes. Les hommes ne cessent
donc de réagir contre l'émiettement linguistique, qui résulte des
événements historiques et de l'emploi des langues.

Du reste, les langues actuellement conservées et dont il subsiste
des documents écrits ne représentent pas tous les types qui ont
64pu exister. On connaît, par des textes plus ou moins étendus ou
par quelques témoignages, beaucoup de langues qui ont cessé de
se parler au cours de l'époque historique. En Italie, par exemple,
l'étrusque, le vénète, le messapien, le sicule, dont il subsiste des
inscriptions, ont disparu, ainsi que les parlers osques et ombriens
apparentés au latin. Toutes les anciennes langues de l'Asie antérieure
plus ou moins connues par des textes, babylonien, hittite,
carien, lydien, lycien, phrygien, ont disparu sans laisser de
survivances, et du syriaque il ne subsiste que quelques parlers
dispersés. De même qu'il y a des races d'hommes éteintes,
bien des familles de langues se sont évanouies, et leur disparition
a effacé des transitions qui seraient utiles pour établir les rapports
entre les langues conservées.

Les langues qu'on n'arrive pas à grouper peuvent être les débris
de groupes dont tous les autres représentants sont sortis de
l'usage, et dont rien n'est attesté, hormis une seule langue conservée
par hasard.

On sait combien la période historique de l'humanité est
courte par rapport aux périodes préhistoriques. La classification
généalogique fait ressortir quelques groupements qui résultent
d'événements historiques des derniers millénaires de l'humanité.
Elles ne permettent même pas d'entrevoir ce qui s'est passé
dans des millénaires bien antérieurs, au temps lointain où
l'humanité a constitué le langage, instrument essentiel de la vie
sociale et du développement industriel et intellectuel.

Si l'on est loin de pouvoir grouper toutes les langues communes,
et si surtout la grammaire comparée de groupes, même
les mieux connus, est imparfaite, si le groupe indo-européen est
le seul où le travail soit très avancé, si hors du sémitique, du
finno-ougrien, de l'indonésien et du bantou, presque tout le
travail comparatif reste à faire, il va de soi que la question de
l'unité d'origine, sinon du langage humain, du moins des
langues actuellement connues, ne peut être abordée d'une
manière utile.65

La terminologie linguistique est peu fixée et peu précise : il
y a lieu de définir les termes de langue (idiome), dialecte, parler,
patois, langue spéciale, argot.

Le mot langue, au sens large, est le plus général : il désigne
tout un ensemble de moyens linguistiques employés par un groupe
d'hommes, quelle que soit l'étendue de ce groupe et quelle qu'en
soit la valeur au point de vue de la civilisation. Il faut compter
autant de langues (on dit aussi idiomes) qu'il y a d'ensembles de
ce genre, assez différents pour que les divers sujets parlants qui
les emploient ne se comprennent pas sans apprentissage.

Cette limite d'intelligibilité est absolue en beaucoup de cas ;
un sujet parlant chinois, arabe ou anglais est inintelligible pour
un sujet connaissant seulement le français. Mais un sujet employant
la manière de parler en usage dans un village picard est
à demi intelligible pour un Parisien. Entre l'inintelligibilité
absolue et l'intelligibilité absolue, il y a tous les degrés possibles.
Dans un groupe étendu, tel qu'est celui du groupe employant
des parlers locaux du type français, les gens de localités voisines
s'entendent d'une manière plus ou moins complète, alors
que des sujets de régions éloignées ne s'entendent nullement ;
ainsi un sujet parlant normand n'entend pas un sujet employant
un parler local franc-comtois ou wallon.

On entend par parler l'ensemble des moyens linguistiques
employés par un groupe local à l'intérieur d'un groupe occupant
une aire étendue. Il y a les parlers français dans la France septentrionale,
les parlers provençaux, gascons, etc. dans la France méridionale,
les parlers italiens en Italie, etc. Les parlers locaux
sont souvent nommés patois.

Dans la mesure où le mot langue s'oppose au mot parler, il
désigne un ensemble de procédés définis, et dont on a conscience,
en somme. Ainsi, chacun des parlers français est un ensemble
d'usages locaux, qui varient sensiblement suivant les individus ;
ces usages oscillent autour d'une moyenne, et ils offrent en gros
une régularité, suivant des règles d'usage qui sont souvent très
fixes ; mais ces règles ne sont codifiées nulle part. Au contraire,
le français est une langue commune qui a des règles rigoureusement
66fixées, une tradition littéraire. Le français s'oppose ainsi
aux parlers français. Ainsi entendu, le mot langue a un sens très
élastique.

La. pratique comporte un flottement suivant les classes sociales,
suivant les conditions d'emploi (langue parlée et langue écrite), etc.

A l'intérieur d'un groupe linguistique étendu, on constate, en
général, que certains parlers offrent des traits communs et que
les sujets parlants de certaines régions ont le sentiment d'appartenir
à un même sous-groupe : en pareil cas, on dit que ces
parlers font partie d'un même dialecte. On peut ainsi grouper
les parlers français : parlers français proprement dits (Ile-de-France),
picards, wallons, normands, champenois, lorrains,
bourguignons, franc-comtois, etc. Cette notion est fuyante. On
ne peut le plus souvent assigner de limite précise au dialecte,
parce que chacune des particularités par lesquelles se caractérisent
les dialectes, a en général une limite propre, différente de celle
de toute autre particularité. Un dialecte se reconnaît à ce que
les limites d'un certain nombre de particularités, sans concorder
exactement, sont proches les unes des autres, si bien que ce
groupe de parlers constituant un dialecte offre des traits communs.

Parmi les sujets employant une même langue ou un même
parler, il existe souvent — en dehors des différences locales — des
groupements d'individus qui offrent certaines particularités linguistiques :
les gens qui exercent une même profession, qui font
parties de mêmes groupements peuvent constituer des langues spéciales.
D'ordinaire ces langues ne se distinguent pas de la langue
générale par la prononciation ou par la morphologie. Les particularités
portent sur le vocabulaire presque uniquement.

Les vocabulaires de petits groupes, doublant plus ou moins
largement le vocabulaire de la langue commune, sont souvent
nommés argots ; ce terme s'emploie surtout pour les parlers
de malfaiteurs ou de gens suspects ; mais on en étend souvent
aussi le sens ; et l'on parle de l'argot de la caserne, de telle ou
telle école, etc.

En outre, il y a langue spéciale là où une profession, un groupement
67particulier exigent l'emploi de termes techniques ; c'est
ce qui arrive dans les divers métiers, dans les sports, etc.

Enfin, il faudrait tenir compte des formes altérées que
prennent des langues employées d'une manière imparfaite par
des gens qui ne cherchent pas à les parler d'une manière normale.
Ainsi les esclaves nègres des colonies n'ont pas cherché à parler
normalement le français ou l'espagnol de leur maîtres : les
parlers « créoles » usités — espagnols ou français — sont ainsi
de l'espagnol ou du français, privés de presque toute leur
grammaire, affaiblis dans leur prononciation, réduits à un petit
vocabulaire. En Extrême-Orient, des gens de parlers divers
se servent, notamment dans leurs relations avec les Européens,
d'un anglais dégénéré qu'on appelle le pidgin-english. Dans le
bassin de la Méditerranée, il y a des langues, ainsi réduites,
qu'on nomme des sabirs.

Les langues de cette sorte ont un minimum de grammaire,
et elles sont sujettes à toutes sortes de mélanges. Si elles venaient
à se fixer dans l'usage, elles auraient une place à part dans la
classification généalogique : fondée sur l'histoire, cette classification
doit présenter les rapports de manières diverses, là où les
rapports sont divers.

Il est naturellement impossible de faire entrer dans la classification
les langues artificielles, telles que le volapük, l'espéranto,
l'ido. Ces langues — dont aucune n'est vraiment entrée
dans l'usage — n'ont du reste obtenu de succès que dans la mesure
où elles sont une moyenne entre des langues parlées par ceux à
qui elles sont destinées. Le vocabulaire de celles des langues qui
semblent susceptibles de servir de base à un développement réel,
l'espéranto et l'ido, est fait systématiquement avec des termes
communs au plus grand nombre possible des grandes langues
européennes ; il en résulte que, en fait, leur vocabulaire est surtout
latin et que ces langues artificielles sont proches des langues
romanes. Ainsi on revient toujours à la classification généalogique.68

On verra, par les exposés qui suivent, combien la classification
est encore imparfaite, et pourquoi elle est destinée à le
demeurer. Pour faire une bonne classification généalogique, il
faudrait pouvoir suivre l'histoire linguistique de chaque domaine,
en marquant toutes les influences subies, depuis le moment où
le langage s'est constitué. Or, même dans les cas les meilleurs, on
entrevoit à peine quelques moments récents de cette histoire.
Ainsi, pour la France, on sait que le gaulois s'est propagé par
l'effet de la conquête celtique, qui date du premier millénaire
avant l'ère chrétienne, que le latin s'y est introduit durant les
premiers siècles de l'ère chrétienne. Mais on ne sait de quels
idiomes le gaulois a pris la place, ni quelles langues autres que
le gaulois subsistaient lors de la conquête romaine. Quant aux
langues parlées avant la conquête gauloise, on en ignore tout,
et le fait que beaucoup de noms de lieu de la Gaule ne se laissent
pas interpréter par le celtique et ne sont sans doute pas celtiques,
est le seul témoignage linguistique attestant l'existence en Gaule
de parlers antérieurs au gaulois.

La grammaire comparée des langues indo-européennes fournit
à l'ensemble de la linguistique historique un modèle à imiter.
En dépit de lacunes immenses et d'insuffisances visibles, ce qui a
été obtenu sur ce domaine demeurera sans doute un idéal inaccessible
dans la plupart des autres cas. Mais il reste beaucoup à
trouver partout. Dans le présent livre il y a donc un programme
de recherches plus qu'une somme de résultats. Le travail qui
reste à faire est immense, et il ne pourrait être fait que si des ressources
considérables sont mises aux mains des linguistes.69

1. Ces pages forment l'introduction du volume sur Les Langues du monde,
Paris, 1924.