La typologie linguistique étudie et classe les langues selon différents critères. Il est possible de regrouper les langues en fonction de la manière dont elles font usage des sons, les types de morphologie qu’elles possèdent ou ne possèdent pas et l’ordre dans lequel les mots sont organisés dans les phrases. Certaines caractéristiques peuvent se retrouver dans le monde entier, dans des langues sans lien entre elles. Le fait que deux langues partagent une caractéristique particulière ne veut pas dire qu’elles sont apparentées.

Ordre des mots basique

L’un des critères les plus courants pour classer les langues est l’ordre typique du sujet (S), du verbe (V) et de l’objet (O) dans des phrases telles que « Le chat mange la souris » :

SVO (« Le chat mange la souris »),

SOV (« Le chat la souris mange »),

VSO (« Mange le chat la souris »),

OSV (« La souris le chat mange »),

OVS (« La souris mange le chat »),

VOS (« Mange la souris le chat »).

Le français et l’anglais sont des langues SVO, parce que tous les autres ordres sont incorrects ou changent le sens de la phrase (« La souris mange le chat » a un sens très différent). Dans certaines langues, par exemple en russe, toutes ces phrases sont correctes, bien qu’un ordre particulier puisse être beaucoup plus fréquent (en l’occurrence SVO). Dans certaines langues, l’ordre peut dépendre de différents paramètres. Le français est généralement SVO, mais SOV quand l’objet est un pronom (« Il mange la souris », mais « il la mange »).

Les ordres les plus courants sont SVO (on le retrouve en français, anglais, indonésien, chinois, espagnol et des milliers d’autres langues) et SOV (utilisé entre autres en japonais, persan, hindi et turc). VSO est moins fréquent (c’est l’ordre utilisé en arabe standard et en irlandais), et les trois ordres qui placent l’objet avant le sujet sont utilisés par moins de 5 % des langues du monde. Pour l’anecdote, Yoda parle en OSV (Fort grâce à la Force tu es, mais quand 900 ans tu auras, moins en forme tu seras).

Tons et accent tonique

Certaines langues utilisent la hauteur de la voix pour distinguer les mots. L’un des exemples les plus connus est le mandarin, qui a quatre tons. Par exemple, (avec un ton haut) veut dire « pensée », (avec un ton descendant) veut dire « quatre » et (avec un ton descendant puis montant) « mort ». Les langues à tons sont répandues en Asie orientale (autres langues chinoises, birman, thaï et vietnamien, entre autres), mais on les trouve aussi en Afrique (yoruba) et en Amérique (navajo).

Les langues qui n’ont pas de tons ont souvent un accent tonique (une syllabe prononcée plus fort que les autres). Dans certaines langues, l’accent tonique frappe toujours la même syllabe (la première syllabe des mots en hongrois, la dernière en français), mais dans d’autres langues, l’accent tonique est important parce qu’il permet de distinguer les mots. L’anglais et le russe sont de telles langues : en anglais, “increase” veut dire « augmentation » alors que “increase” signifie « augmenter », et en russe, “muka” veut dire « farine » alors que “muka” veut dire « tourment ».

Langues isolantes et synthétiques

On peut aussi classer les langues selon la manière dont elles indiquent les fonctions grammaticales. Dans les langues isolantes telles que le chinois, les mots sont généralement constitués d’un seule morphème (une unité linguistique avec un sens), alors que dans les langues synthétiques, ils peuvent être composés de plusieurs morphèmes. L’anglais est légèrement synthétique (il a des flexions telles que le suffixe du pluriel dans books), le français un peu plus (il indique le pluriel comme l’anglais, mais aussi le genre et il a également de nombreuses terminaisons pour les verbes), et d’autres langues comme le latin ont un grand nombre de flexions. Certaines langues comme l’inuktitut (parlé par les Inuits au Canada) sont parfois appelées polysynthétiques parce qu’elles utilisent un très grand nombre d’affixes, et un seul mot dans ces langues peut correspondre à une phrase entière dans d’autres langues.

Les langues synthétiques peuvent être divisées en langues flexionnelles et agglutinantes. Dans les langues agglutinantes, chaque morphème a généralement une seule fonction et les mots peuvent être composés de beaucoup de morphèmes. Le turc est un bon exemple de langue agglutinante. Le mot turc evlerimde, qui veut dire « dans mes maisons », est constitué des morphèmes suivants : ev (maison), -ler (pluriel), -im (mon) et -de (dans). Dans les langues flexionnelles, les affixes peuvent avoir plusieurs fonctions. Par exemple, dans le mot espagnol habló (« il parla »), indique à la fois le passé simple et la troisième personne du singulier.

Les frontières entre ces catégories ne sont cependant pas tout à fait nettes, et il est rare qu’une langue rentre parfaitement dans une seule catégorie.