Sémantique, lexicologie
« Le sens derrière les mots »
« Le sens derrière les mots »
La sémantique est la théorie du sens. C’est une discipline variée qui englobe plusieurs niveaux et conceptions du sens : lexicaux, formels, structurels et fonctionnels.
Elle fait aussi l’objet de débats animés, parce que la signification est plus arbitraire ou, pour utiliser une expression plus raffinée, plus conventionnalisée qu’on (= Platon) ne l’imagine. Peu de mots (cris d’animaux sur Lingvopedia) ont un sens direct et « naturel », et même le langage des animaux est symbolique (les abeilles communiquent en dansant et les baleines ont des noms individuels).
Les termes pour désigner les couleurs sont un bon exemple. Bien qu’ils aient un système visuel biologiquement identique, les humains ne divisent pas tous de la même manière le spectre des couleurs en couleurs distinctes qui portent des noms. Le nombre de mots de base pour désigner les couleurs varie de 2 à 11 ou 12 selon les langues, le rouge étant la première couleur ajoutée à la simple distinction entre le noir et le blanc, suivie par un ou plusieurs termes pour les tons bleu-vert (Berlin & Kay). Mais personne n’est d’accord sur les limites précises. En gallois, par exemple, le mot glass recouvre une grande partie de ce que le français et l’anglais qualifient de bleu et vert, tandis que le russe subdivise le bleu en bleu foncé sinij et bleu clair goluboj. Et la logique descriptive des idiomes est encore pire : un œil au beurre noir sera qualifié d’« œil noir » (black eye) après une bagarre dans un match de football anglais, alors que ce sera un « œil bleu » (blaues Auge) après la revanche en Allemagne. Dans ce cas, quelle couleur est le diagnostic correct ? Il faut simplement accepter que, comme le dirait Wittgenstein, le sens correspond à l’usage dans le système (conventionnalisé) d’une langue. Les linguistes ont donc retrouvé une certaine tranquillité d’esprit grâce à la distinction de Saussure entre signifiant et signifié : le signe est indépendant de sa signification. (Voir aussi Langage et pensée.)
Comme les mots sont des petites unités de langage distinctes et facilement reconnaissables, beaucoup d’efforts ont été faits pour les définir voire, si possible, d’« imposer » leur sens de manière étymologique (Isidore de Séville). Des quantités énormes de dictionnaires, d’encyclopédies et de méthodes de classification en sont témoins. Un point de départ naïf consiste à assigner à chaque mot un référent dans le monde réel (non linguistique), mais cela ne marche que pour les noms propres et les taxons biologiques, ou, à un niveau plus abstrait, les mots déictiques tels que je, tu, elle, ici, là, maintenant, hier. Cependant, la plupart des mots ne correspondent pas à des choses où à des points de l’espace-temps, mais à des concepts. Et comme les concepts n’existent que dans les esprits, il arrive facilement que deux personnes comprennent le même mot de manière légèrement différente.
L’approche paradigmatique est une approche plutôt neutre au problème de la classification. Elle fonctionne indépendamment des référents, des définitions, de l’étymologie et des observations, simplement en testant les mots qui peuvent se substituer les uns aux autres dans le même contexte. Par exemple, le contexte « Elle s’est assise sur un(e)… » va aider à déterminer que chaise, canapé, tabouret, fauteuil, banc sont des choses similaires (« meubles pour s’asseoir »). Il peut être bien plus facile d’expliquer ce qu’est une chaise en constatant son utilité (s’asseoir dessus) plutôt qu’en la définissant précisément (combien de pieds, s’il y en a ?). Néanmoins, chaque culture aura une idée différente de l’« objet typique pour s’asseoir », que ce soit une chaise ou un tatami, et les autres types de sièges seront définis par la manière dont ils diffèrent d’une chaise « normale ». Pourquoi ? Des expériences psychologiques suggèrent que les gens structurent leur conception sémantique du monde en regroupant les concepts autour de « prototypes sémantiques ». Si vous demandez à quelqu’un de citer un outil, ce sera un marteau dans la grande majorité des cas, un instrument de musique sera un violon, un nombre sera 7… mais ce n’est pas de la télépathie ou de la magie noire, ce n’est que de l’efficacité sémantique, parce qu’il est plus facile de distinguer que de définir. Les enfants commencent avec des prototypes comme « chien » et « pomme », et découvrent ce que sont les animaux et les fruits en apprenant, à l’usage, si un concept X est plus proche de « chien » ou de « pomme ». C’est la raison pour laquelle de nombreux enfants croient pendant un certain temps que les chats sont des chiens (mignons et poilus) et que les tomates sont des pommes (rondes et rouges).
La sémantique formelle s’efforce de réduire les énoncés à des propositions concernant des situations au moyen de valeurs de vérité définissables, de quantifications, etc. Dans l’idéal, ces propositions doivent pouvoir être interprétées selon un raisonnement logique et mathématique. (Tous les politiciens mentent & tous les menteurs fraudent les impôts → si quelqu’un paie ses impôts, ce n’est pas un politicien.)
Une autre approche un peu moins formelle consiste à mesurer le sens, par exemple en triant les mammifères selon des critères mesurables tels que « taille » et « férocité ». Les lions et les tigres seront placés dans un coin du diagramme, les éléphants et les girafe dans un autres, le chats et les furets dans un troisième, et les souris et les lemmings dans le dernier. À un niveau plus systématique, les mots peuvent être décrits sous la formes d’ensembles binaires de traits sémantiques « atomiques ». Par exemple, on peut décrire les véhicules comme +mobiles, -vivants, tandis que les animaux sont +mobiles, +vivants et les plantes -mobiles, +vivantes.
Le structuralisme a fortement influencé la sémantique moderne. Il considère les langues comme des réseaux de relations systématiques. En partant du principe de compositionnalité, les linguistes essaient de faire correspondre les relations sémantiques à des relations syntaxiques entre les sens des mots. Les langues romanes, dont le français, exploitent la position des adjectifs dans un but sémantique : « grand » a un sens différent dans un homme grand et dans un grand homme. L’ordre des mots joue aussi un rôle sémantique dans d’autres langues : par exemple, en anglais, la différence entre paint a red house (« peindre une maison rouge ») et paint a house red (« peindre une maison en rouge ») peut être déduite de l’ordre des mots : red fait partie d’un groupe nominal (red house) dans la première phrase, mais d’une partie indépendante de la proposition (paint - house - red) dans la deuxième. Sémantiquement, cela revient à savoir si la maison est déjà rouge avant d’être peinte ou seulement après.
Toutes les sciences descriptives commencent par classer, et la sémantique ne fait pas exception. Il existe plusieurs systèmes de classification sémantique, dont les thésaurus et les index thématiques des bibliothèques. Les ressources linguistiques modernes telles que WordNet et les ontologies distinguent différentes relations, notamment
Mais comme les langues ne sont pas des animaux, les ontologies linguistiques ne peuvent pas être identiques aux ontologies biologiques, et elles peuvent même varier en fonction des langues. Par exemple, les dauphins, d’un point de vue biologique, sont des mammifères, mais dans beaucoup de langues, ce sont des poissons, et les pommes de terre françaises sont des légumes alors que les Kartoffeln/kartofler allemandes et danoises n’en sont pas.
Les champs lexicaux sont un concept de tri sémantique utile pour la pédagogie, consistant à lister les mots en rapport avec, par exemple, le corps, le golf ou les chevaux. Parfois, un champ lexical correspond à une classification du type « X est un Y » (par exemple les professions). Mais souvent, les éléments d’un champ lexical ne sont pas limités par l’hyponymie ou la catégorie du mot. Le champ lexical du cheval ne contient donc pas seulement les purs-sangs, les étalons, les juments et les trakehners, mais aussi des outils (comme les selles), des parties du corps (sabots) et des actions (élever, galoper, hennir).
Traditionnellement, les deux ontologies, WordNet et les champs lexicaux étaient construits à la main, les linguistes ne se fiant qu’à l’introspection et à leur connaissance du monde. Cette méthode plutôt subjective a été améliorée, voire remplacée, par des ressources générées par ordinateur en s’appuyant sur des collections de texte immenses (notamment Internet), l’analyse grammaticale automatique et les statistiques. Par exemple, il existe des champs lexicaux générés automatiquement, sous la forme de réseaux de cooccurrences (Leipzig Wortschatz), et des dictionnaires de relations (DeepDict, Sketch Engine). Ils extraient automatiquement, par exemple, ce qu’un cheval (a) peut être [sauvage, sombre, en bois, de Troie], (b) peut faire [hennir, galoper, trotter] ou (c) ce qu’on peut lui faire [attacher, brosser], simplement en analysant des phrases dans lesquelles le mot cheval a la fonction syntaxique de noyau de groupe nominal, de subjet ou d’objet.
La plupart des systèmes de classification décrits ci-dessus se conforment à l’affirmation que J. R. Firth a faite en 1957, selon laquelle « on reconnaît un mot à ceux qui lui tiennent compagnie ». En d’autres termes, la sémantique est une question d’emploi des mots et de système linguistique. Des mots adjacents s’associent sous forme de collocations. Certaines collocations sont figées à 100 % et peuvent être considérées comme une seule unité sémantique (pomme de terre, avoir lieu), tandis que d’autres sont composées mais pas figées (haute montagne, haute température, haute mer, haute trahison).
Mais les associations de mots ne se limitent pas aux collocations. Les verbes en particulier ont des emplacements sémantiques pour leurs arguments syntaxiques. Par exemple, caresser dispose d’un emplacement de sujet pour un agent (humain) et d’un emplacement d’objet pour une entité « animée » (personne, animal ou partie du corps). On peut dire que dans la phrase « Pierre caresse Jeanne », Pierre joue le rôle sémantique d’AGENT et Jeanne, étant animée, le rôle de PATIENT.
Un moyen élégant d’expliquer les métaphores consiste à les considérer comme des incompatibilités entre les emplacements et les mots qui les occupent, ces derniers forçant généralement une interprétation métaphorique des emplacements. Par exemple, il y a un transfert théorique de caractère animé à des concepts inanimés quand un poète parle d’un vent d’été chaud qui caresse sa peau nue (vent = AGENT), ou les doigts d’un musicien qui caressent les courbes de sa guitare (guitare = PATIENT).
Bien sûr, une vision fonctionnelle de la sémantique ne doit pas interagir seulement avec la syntaxe, mais aussi avec la pragmatique et la linguistique sociale. Ainsi, le sens pragmatique (entre crochets) des exemples ci-dessous n’est pas exprimé explicitement et ne peut être déduit que du contexte pragmatique :
Je serai dans l’entrée [= à t’attendre, alors ne traîne pas]
Est-ce que tu as arrêté de tromper ta copine ? [= tu l’as trompée]
La manipulation du sens pragmatique est à la fois un art et une arme linguistique puissante. Le pauvre homme du dernier exemple, qu’il réponde oui ou non, aura des problèmes. L’humour, en particulier l’ironie, est souvent réalisé en projetant d’abord une interprétation, puis en changeant le sens d’une affirmation en modifiant son contexte, ce qui rend négatif un énoncé positif :
Le Brésil est le pays de l’avenir [et le restera toujours]
Qu’est-ce que tu penses de la démocratie au Zimbabwe ? [Je pense que ce serait une bonne idée]
L’Afrique a été décolonisée démocratiquement : une personne, un vote [- une seule fois]
Enfin, la sélection de formes linguistiques particulières peut être imposée par des contraintes sociales. Le japonais, par exemple, dispose de plusiers manières de dire « je », par exemple watashi (formel), washi (familier et masculin) et atashi (mignon et féminin). Une complication socio-linguistique récente en français est due à l’abolition dans les documents officiels du terme « mademoiselle » servant à désigner les femmes célibataires, ce qui ne laisse que « monsieur » et « madame ». Et bien sûr, comme il s’agit de la France, de nombreuses femmes n’ont pas apprécié d’être reléguées à ce qu’elles perçoivent comme un ensemble de traits sémantiques +vieille, -attirante.