Les langues, comme les êtres vivants, évoluent. Des langues qui descendent d’un même ancêtre (appelé « proto-langue ») font partie de la même famille. Une famille de langues peut être divisée en plusieurs sous-groupes : par exemple, le polonais et le slovaque sont tous les deux des langues slaves occidentales, une subdivision des langues slaves, qui font elles-mêmes partie de la grande famille des langues indo-européennes.

La linguistique comparée, comme son nom l’indique, est une branche de la linguistique qui compare les langues pour déterminer leurs liens de parenté. Cela est possible en comparant leur phonologie, leur grammaire et leur vocabulaire, même dans les cas où il n’existe pas de traces écrites de leurs ancêtres.

Plus les langues sont éloignées, plus il peut être difficile de déterminer si elles ont un lien de parenté. Par exemple, aucun linguiste ne doute que l’espagnol et l’italien appartiennent à la même famille, mais l’existence des langues altaïques (qui incluraient entre autres le turc et le mongol) est controversée et n’est pas acceptée par tous les linguistes. Il est, à l’heure actuelle, impossible de savoir si toutes les langues descendent d’un ancêtre commun. Si une langue humaine originelle a existé, celle-ci n’est plus parlée depuis des dizaines de milliers d’années, sinon plus. Cela rend les comparaisons très difficiles, voire impossibles.

Carte des principales familles de langues du monde

Source: Wikimedia Commons

Liste de familles de langues

Les linguistes ont identifié plus d’une centaine de familles de langues primaires (c’est-à-dire que les éventuels liens de parenté entre ces familles n’ont pas pu être déterminés). Certaines n’incluent qu’une poignée de langues, d’autres plus d’un millier. Voici quelques unes des principales familles de langues du monde.

Famille de langues Zone Langues
Indo-européenne De l’Europe à l’Inde, de nos jours tous les continents Plus de 400 langues parlées par presque 3 milliards de personnes. Elles comprennent les langues romanes (espagnol, italien, français…), germaniques (anglais, allemand, suédois…), baltes, slaves (russe, polonais…), indo-aryennes (persan, hindi, kurde, bengali et beaucoup de langues parlées de la Turquie au nord de l’Inde) ainsi que quelques autres langues telles que le grec et l’arménien.
Sino-tibétaine Asie Langues chinoises, tibétain et birman
Niger-Congo Afrique subsaharienne Swahili, yoruba, shona, zoulou
Afro-asiatique Moyen-Orient, Afrique du Nord Langues sémitiques (arabe, hébreu…), somali
Austronésienne Asie du Sud-Est, Taïwan, Pacifique, Madagascar Plus de 1000 langues, dont l’indonésien, le filipino, le malgache, l’hawaïen, le fidjien…
Ouralienne Europe centrale, de l’Est et du Nord, Asie du Nord Hongrois, finnois, estonien, langues sames (ou lapones), quelques langues de Russie (oudmourte, mari, komi…)
Altaïque (famille controversée) De la Turquie à la Sibérie Langues turques (turc, kazakh…), langues mongoles (mongol…), langues toungouses (mandchou…) ; certains y incluent même le japonais et le coréen.
Dravidienne Sud de l’Inde Tamoul, malayalam, kannada, télougou
Taï-kadaï Asie du Sud-Est Thaï, lao
Austroasiatique Asie du Sud-Est Vietnamien, khmer
Na-dené Amérique du Nord Tlingit, navajo
Tupi Amérique du Sud Guarani
Caucasienne (plusieurs familles) Caucase Trois familles. La langue caucasienne la plus parlée est le géorgien.

Cas particuliers

Isolats

Les isolats sont des langues « orphelines », c’est-à-dire que leur appartenance à une famille de langue connue n’a pas pu être prouvée. L’exemple le plus connu est le basque, parlé en Espagne et en France. Il est très différent des langues voisines, qui sont indo-européennes. Des linguistes ont comparé le basque à d’autres langues parlées en Europe, dans le Caucase et même en Amérique, mais aucun lien de parenté n’a pu être démontré.

Le coréen est un autre isolat célèbre, bien que certains linguistes aient proposé un lien avec les langues altaïques ou le japonais. Le japonais est lui-même souvent considéré comme un isolat, mais il appartient en fait à la petite famille des langues japoniques, qui inclut quelques langues proches telles que l’okinawaïen.

Pidgins et créoles

Un pidgin est un système de communication simplifié qui se développe entre deux groupes ou plus qui n’ont pas de langue en commun. Il ne descend pas directement d’une seule langue, mais peut emprunter des caractéristiques à plusieurs langues. Quand des enfants commencent à parler un pidgin en tant langue maternelle, celui-ci devient une langue complète et stable appelée créole.

La plupart des pidgins et des créoles parlés aujourd’hui sont les fruits de la colonisation et sont basés sur l’anglais, le français ou le portugais. L’un des créoles les plus parlés est le tok pisin, une langue officielle de Papouasie-Nouvelle-Guinée. Il est basé sur l’anglais, mais sa grammaire est différente et son vocabulaire comporte des mots empruntés à l’allemand, au malais, au portugais et à plusieurs langues indigènes.