En linguistique comparative, on estime généralement qu’il existe une corrélation très nette entre la durée écoulée depuis l’époque de séparation des langues et le degré d’évolution de ces mêmes langues par rapport à l’état originel. Le temps est le cadre dans lequel se déroule le changement : plus il s’écoule, plus il y a de possibilités de changement, et au fur et à mesure qu’on s’éloigne dans le temps, les langues ont tendance à perdre leurs caractères communs.
‘“il y a chance pour que deux langues parentes divergent d’autant plus qu’elles sont séparées depuis plus longtemps”’ (Meillet 1938a, 55).
Ainsi, dans la reconstruction de l’indo-européen, il est plus facile d’utiliser les langues anciennes qui présentent plus de caractères communs que les langues modernes (Meillet 1921, 93-94). M. Swadesh a établi la méthode de la glottochronologie directement sur ces bases, en postulant de plus que l’évolution linguistique était régulière dans le temps et dans les différentes langues. La conclusion logique de la corrélation établie entre temps et divergence linguistique, consiste à poser une limite à la méthode comparative : après un certain laps de temps, le renouvellement des langues est si important que les traces d’une parenté originelle ont disparu16, ou du moins sont conservées en nombre trop peu important pour pouvoir démontrer une parenté entre langues.
‘“Selon les experts, le changement linguistique est si rapide qu’après environ 6 000 ans toute trace de relation antérieure a été effacée par l’érosion phonétique et sémantique régulière” (Ruhlen 1994, 76).17 ’Cette conclusion avait été exposée clairement dans la première moitié du siècle par A. Meillet, pour qui il apparaissait que la méthode qu’il utilisait avec succès pour l’indo-européen ne pourrait s’appliquer au-delà, par exemple pour relier l’indo-européen à d’autres groupes linguistiques. Au-delà d’un certain temps écoulé, la parenté historique n’aurait pas laissé de traces visibles dans les langues18 : la définition de langues par l’apparentement génétique devient alors ‘“purement historique ; elle n’implique aucun caractère commun aux diverses langues, mais seulement le fait que, à un moment du passé, ces langues ont été une seule et même langue.”’ (Meillet 1937, 35-36.)
Cette position est encore celle adoptée par la plus grande partie des comparatistes à l’heure actuelle, qui s’opposent aux regroupements effectués par certains linguistes russes et américains entre plusieurs grands groupes linguistiques, dont l’indo-européen, l’altaïque, l’ouralien, etc. (regroupés, avec d’autres familles, dans le nostratique d’Illich-Svitych et l’eurasiatique de Greenberg), ainsi qu’à la tentative de certains qui, passant par-dessus la classification, tentent d’établir la preuve de la parenté de toutes les langues du monde, dans le cadre de leur monogenèse19. Ces linguistes, dont les méthodes sont sévèrement critiquées, apportent cependant des éclairages intéressants sur le phénomène de l’évolution et de la rétention linguistiques, et en particulier lexicales. En comparatisme “classique”, on estime que le lexique est la partie de la langue la plus instable, qui peut être soumis à un renouvellement rapide dû aux nombreuses contraintes qui pèsent sur lui (phonétiques (substance phonétique trop faible), extra-linguistiques (apparition, disparition et transformation des référents, tabou, affectivité, ...), etc.). Plus on s’éloigne de la période commune et plus des facteurs de divergence lexicale ont pu jouer. Au contraire, un autre phénomène peut faire converger les langues : il s’agit de l’emprunt, par lequel une communauté de vocabulaire peut toujours s’expliquer.
‘“la parenté n’implique aucune ressemblance actuelle des langues considérées [...] ; et inversement il y a beaucoup de ressemblances, soit de structure générale, soit de vocabulaire, qui n’impliquent pas parenté” (Meillet 1921, 92). ’A. Meillet était très suspicieux d’un vocabulaire indo-européen commun : selon lui (1937, 378 suiv.), une concordance de vocabulaire peut s’expliquer soit parce que les mots existaient déjà en indo-européen et ont été conservés par les différentes langues, soit par un emprunt postérieur à la période commune. Dans beaucoup de cas, il est impossible de trancher entre les deux solutions. A part certains mots grammaticaux, on n’est jamais sûr qu’un mot relève de l’identité originelle :
‘“Ce qui pour le linguiste d’aujourd’hui représente le vocabulaire indo-européen n’est qu’un petit noyau de termes généraux [...] impropre à donner une idée de ce qu’était en réalité le lexique d’un parler indo-européen. Du reste le vocabulaire de chacune des langues indo-européennes diffère profondément de celui d’une autre langue quelconque de la famille, et ce n’est qu’une minorité des mots de chaque idiome qui a une bonne étymologie indo-européenne” (Meillet 1937, 383).’La lexicostatistique a insisté sur le fait que s’il existe effectivement une grande partie du vocabulaire où le renouvellement peut être rapide20, une autre portion est d’une part plus stable (c’est-à-dire moins sensible au renouvellement21), et d’autre part peu sujette à l’emprunt. Elle a défini ce dernier comme le vocabulaire de base, qui comprend des numéraux, des pronoms, des termes désignant des parties du corps, des objets naturels (animaux, plantes, ...), etc. (Lehmann 1962, 108 et liste p. 112-113). Récemment, A. Dolgopolsky22 a établi une liste de termes qui sont les plus stables dans les langues du monde. Ce sont (dans l’ordre de stabilité) ceux qui désignent les notions : je/moi (marque de première personne), deux, tu/te/toi/vous (marque de deuxième personne), qui/quoi, langue, nom, oeil, coeur, dent, négation (ne/non), ongle, pou, larme, eau, mort23. Les termes pour je, tu/vous, langue, oeil, non, pou, larme, eau, contrôlés dans deux cent langues d’Europe, d’Asie et d’Afrique, n’ont pas de cas recensé d’emprunt.
La comparaison à longue distance suggère donc que des éléments peuvent se maintenir dans les langues des milliers d’années après la période commune. La limite assignée par les comparatistes au pouvoir de la reconstruction (celle-ci ne pourrait remonter au-delà de 6 000 ans, c’est-à-dire au-delà des résultats obtenus pour l’indo-européen), pourrait en fait être franchie :
‘“De nombreux autres exemples pourraient être cités (en indo-européen ou dans n’importe quelle autre famille de langues) pour montrer que l’affirmation selon laquelle tout a été transformé au point de ne plus être reconnaissable après 6 000 ans est tout bonnement fausse” (Ruhlen 1994, 77).24 ’Ces recherches insistent également sur des différences de traitement des éléments lors de l’évolution, certains étant plus sensibles que d’autres au changement. On peut donc adhérer à la considération générale selon laquelle le degré de rétention par rapport à la langue-mère est corrélé à la distance dans le temps qui sépare les langues considérées de la période commune. Plus le temps écoulé depuis la séparation des langues est important, plus cette durée a permis à des changements par rapport au stade initial de se réaliser. Cependant, ce principe général doit être réajusté en fonction d’autres critères : comme l’avait bien vu Meillet (1925, 45),
‘“Le temps n’est donc que l’une des conditions dont dépend l’importance des changements. Ni un bon état de conservation de l’usage ancien ne prouve que le temps écoulé depuis la rupture de la communauté initiale soit bref, ni un renouvellement étendu des formes ne suppose un long intervalle de temps. [...]. Le degré de nouveauté d’une langue par rapport à la « langue commune » n’est pas reconnaissable par la date”. ’Certains critères sont de nature linguistique : la lexicostatistique et à sa suite la comparaison à longue distance ont mis en évidence la différence de traitement selon le secteur du lexique concerné. Mais d’autres relèvent également de facteurs externes. On peut ici rappeler que certaines langues, au sein d’un même sous-groupe linguistique dont toutes les langues sont séparées de la période commune depuis la même époque, apparaissent comme bien plus innovatrices que d’autres (c’est le cas, dans les langues romanes, du français par rapport à l’italien ou à l’occitan, par ex.). Certaines recherches ont été faites dans ce sens, et il faut citer ici les propositions de la stratigraphie linguistique (détaillées en 1.2.2). L’influence d’une langue sur une autre est un facteur qui peut précipiter l’évolution linguistique et entraîner une langue à diverger de son type initial25. Notamment, dans le cas de langues qui sont en train de mourir car remplacées par une autre langue, il est très fréquent qu’elles abandonnent leur vocabulaire hérité par des emprunts massifs à la langue qui est en train de les supplanter (cf. par ex. Bloch 1921). Il faut également prendre en compte, lors de la dialectalisation d’une langue, la répartition géographique de ses dialectes. Ainsi, dans un sous-groupe étroitement apparenté comme la famille romane, dont la date de divergence n’est pas très ancienne, et qui d’autre part, à l’exception du roumain, est située dans une aire géographique relativement compacte, les contacts entre les langues ont été ininterrompus. Ces contacts peuvent bien sûr entraîner des emprunts, mais également favoriser la conservation d’éléments communs que l’on privilégie par rapport à des éléments propres à chaque groupe. Ce facteur peut contribuer à ce que ‘“Des langues qui représentent le développement continu d’un même type initial ont d’ordinaire une communauté de vocabulaire”’ (Meillet 1938c, 44). La famille romane a conservé une unité évidente en même temps qu’on y trouve une diversité dans l’unité (cf. 1.3).
Enfin, un autre facteur, me semble-t-il, joue également un rôle dans l’évolution de la langue : il s’agit des conditions socio-linguistiques, des fonctions que remplissent la langue. La langue d’une société traditionnelle, composée d’unités de peu de locuteurs centrés autour de quelques activités, offre moins de prises au changement qu’une grande langue de civilisation servant à de multiples usages, parlée par des millions de locuteurs et au contact de nombreuses autres langues (cf. 1.3).
“A la longue cependant, des langues parentes finissent par différer tant que leur communauté d’origine devient impossible à reconnaître” (Meillet 1921, 93).
“According to the experts, linguistic change is so rapid that after around 6, 000 years all traces of earlier relationships have been obliterated by constant phonetic and semantic erosion” (Ruhlen 1994, 76).
Déjà, la connaissance du français, du bulgare et de l’arménien modernes ne rendrait pas facile l’établissement d’une parenté entre ces langues, et ne permettrait pas d’en établir la grammaire comparée (Meillet 1921, 93).
Ainsi, en 1994, J. Bengtson et M. Ruhlen ont répertorié 27 mots qu’ils retrouvent dans tous les groupes linguistiques du monde (ce qu’ils appellent des étymologies globales), par ex. le nom du doigt, TIK, qu’ils retrouvent dans treize familles de langues (Ruhlen 1994, 115-119). “there are numerous additional roots which, while not so widespread, nonetheless provide crucial evidence that all the world’s language families, and hence all the world’s languages, derive from a common source” (Ruhlen 1994, 105). [“Il y a de nombreuses autres racines qui, bien que moins répandues, démontrent néanmoins de façon décisive que toutes les familles de langues du monde, et par là toutes les langues du monde, remontent à une source commune”.]
Par ex. le nom indo-européen du roi, *reg-, n’a été conservé qu’en skr. raj-, rajan-, et dans les groupes occidentaux : lat. rex, gaul. rix (Buck 1949 § 19. 32 ; Meillet 1937, 392). Le nom indo-européen de l’ours, *rko-, s’est maintenu uniquement en gr. arktos, lat. ursus, irl. art, skr. rksa-, tandis qu’il a été remplacé, par euphémisme (?), dans les autres groupes : en germ. il est désigné par un mot signifiant “le brun” (ex. ang. bear), en slave comme le “mangeur de miel” (ChSl. medvedi ), en lithuanien lokys, letton lacis = “le poilu” (Buck 1949 § 3. 73 ; Meillet 1937, 394).
Le même phénomène peut se laisser observer en phonétique, où l’on trouve des termes qui échappent à l’évolution phonétique : c’est le cas connu du nom roumain du neveu, nepot, qui continue presque sans changement l’indo-européen *nepot- (Buck 1949 § 2. 48, 2. 49 n° 1).
Dolgopolsky, Aaron (1986), “A probabilistic hypothesis concerning the oldest relationships among the language families in northern Eurasia”, in V. Shevoroshkin - T. L. Markey, Typology, Relationship and Time, Ann Arbor, Karoma Press.
Cf. aussi Ruhlen (1994, 119).
“Numerous other examples could be cited — from Indo-European or any other language family — to show that this notion that everything changes beyond recognition after 6, 000 years is simply false” (Ruhlen 1994, 77).
W. von Wartburg explique ainsi la fragmentation linguistique de la France par l’influence du superstrat germanique : “l’influence germanique a contribué grandement à faire du français la langue la plus germanisée des langues romanes.” (Camproux 1979, 59).