Langue française (1969) Martin, TLF

De Histoire de l'IST

Le trésor de la langue française et la méthode lexicographique


 
 

Titre
Le trésor de la langue française et la méthode lexicographique
Auteur
Robert Martin
Dans
Langue française, n°2, 1969
Disponible en ligne 
sur le site Persée

Cette page contient une réédition numérique d'un article publié en 1969 et concernant la création du dictionnaire Trésor de la langue française.


Le Gamma 60 et ses dérouleurs de bandes

Avant propos de la rédaction

Dans cet article, Robert Martin présente le CRTLF (Centre de recherche pour un Trésor de la langue française). Ce laboratoire du CNRS a porté la réalisation de ce dictionnaire dont le premier tome a été publié en 1871, soit 2 ans après cet article.

En 1987, Jacques Dendien a démarré la réalisation d'une version en ligne, le TLFi. Il précisait :

« informatiser un dictionnaire ne consiste pas à écrire des logiciels plus ou moins géniaux, mais consiste beaucoup plus prosaïquement à le transformer en document structuré » [NDLR 1]

Depuis 2000, sur l'impulsion de Jean-Marie Pierrel, ce dictionnaire a été mis à la disposition du public dans le cadre du CNRTL. Quelques articles sont réédités sur ce wiki (voir par exemple Corpus).

Concernant la réédition

Pour une meilleure lisibilité de l'article, les notes ont été regroupées. Leur numérotation dans l'article est donc différentes de celles de l'original. La référence exacte est matérialisée dans la zone des notes par une indication entre crochets.

Iconographie complémentaire

La photographie de droite montre l'ordinateur Gamma 60 dans le bâtiment des ordinateurs sur le campus de la faculté de lettres de Nancy.

logo travaux article en cours d'importation

Le trésor de la langue française et la méthode lexicographique

44

Créé en décembre 1960, implanté à Nancy [1], dirigé par M. Paul Imbs et placé sous le contrôle d'un Comité de direction [2] dont les avis portent sur les orientations scientifiques les plus générales, le Centre de recherche pour un Trésor de la langue française (T.L.F.) est conçu à la fois comme un laboratoire de documentation lexicologique complétant l'Inventaire général de la langue française (I.G.L.F.) [3] et le Centre d'études du vocabulaire français [4], et comme un organisme de recherche dont la mission essentielle est de préparer et de rédiger un dictionnaire historique de la langue française. Dans cette présentation sommaire, nous voudrions décrire la documentation qui s'élabore à Nancy et montrer l'originalité que recherche le T.L.F. dans la méthode lexicographique qu'il met en œuvre.

I - Le T.L.F., laboratoire de documentation lexicologique

L'élaboration d'un dictionnaire — que l'on prévoit volumineux — exige une documentation abondante, soigneusement classée et d'une conception rigoureuse : celle du T.L.F. a le mérite incontesté de l'étendue et de la diversité. D'ordre à la fois bibliographique et lexicologique, elle doit servir non seulement aux rédacteurs du T.L.F., mais aussi à tous les chercheurs :

a) La documentation bibliographique

Le Service de documentation bibliographique du Centre a pour mission de constituer un vaste fichier de documentation linguistique —
45
fichier alphabétique d'auteurs et fichier systématique par matières dont les principales divisions correspondent aux centres d'intérêts du laboratoire (phonétique, orthographe, morphologie, grammaire, sémantique, stylistique, etymologie, histoire du vocabulaire français...). Il comporte actuellement quelque 50 000 titres de thèses, d'ouvrages, de communications, d'articles de revues, de contributions à des mélanges, de comptes rendus, etc., parmi lesquels il est fait un sort tout particulier aux études de mots. Environ 16 000 vocables français y font déjà l'objet de références bibliographiques. L'essentiel de cette vaste information, en particulier les études les plus récentes ou les plus importantes sur tel mot ou sur tel champ sémique particulier, apparaîtra dans les rubriques bibliographiques du dictionnaire qui se prépare. Mais ce fichier, complété dans le cadre de la documentation courante par le dépouillement régulier, suivant leur ordre d'arrivée, des revues spécialisées reçues ou traitées au laboratoire (une centaine) et, dans le cadre de la documentation rétrospective, par le dépouillement des grandes bibliographies linguistiques et des bibliographies les plus importantes de thèses, d'ouvrages ou d'études, est ouvert à tout chercheur qui souhaite le consulter [5]. Il est complété par une documentation plus générale sur les linguistes, les sociétés savantes, les congrès, les collections, les mélanges, les périodiques, par un répertoire de sigles et un fichier de vocabulaire documentologique. Les thèses soutenues ou en préparation y figurent également dans la mesure où une publication les signale. Les fiches sont établies selon les normes de l'AFNOR, complétées par les règles bibliographiques qui s'élaborent au fur et à mesure que les cas, plus divers qu'on ne le soupçonne, se présentent à la sagacité du bibliographe. C'est là, on s'en doute, un travail de longue haleine et qui exige un personnel qualifié.

Le Service de documentation du T.L.F. rédige un Bulletin analytique de linguistique française, dont le but est d'informer les rédacteurs du Centre, mais qui, diffusé actuellement à quelque 200 et bientôt à 350 exemplaires, devrait, dans un avenir proche, s'intégrer au Bulletin signalétique que publie le C.N.R.S.. : la référence bibliographique y est suivie d'une brève analyse. Une étude en cours vise à donner à ces analyses une forme suffisamment impersonnelle et rigoureuse pour en permettre éventuellement le traitement mécanisé[NDLR 2]. Des index par tomes rassemblent les références dans un ordre alphabétique et systématique.

Il faut ajouter que la Bibliothèque du Centre s'enrichit tous les ans de quelque 500 titres et qu'elle est abonnée aux principales revues de linguistique générale, romane et française.

b) La documentation lexicologique

La documentation lexicologique du T.L.F. est constituée essentiellement par le traitement automatique des textes au moyen d'un ensemble
46
électronique Bull-Gamma 60. Mais le Centre se donne aussi pour tâche de recueillir divers fonds lexicologiques, de les inventorier, de les classer, de les exploiter pour son dictionnaire. Un double de l'I.G.L.F. est déposé à Nancy : géré électroniquement de manière à obtenir pour un même vocable l'ensemble des fiches disponibles, il complète utilement le classement de l'I.G.L.F. parisien qui, de son côté, se présente par auteurs et par œuvres. Le double de l'I.G.L.F. comporte à la fois des fiches électrographiées (environ un million) que M. Roques a fait établir durant la guerre pour les mettre en sûreté dans sa propriété de Sully-sur-Loire, et des fiches photographiées (environ 4 millions) réalisées pour le T.L.F. par les soins du Service photographique du C.N.R.S. On connaît l'intérêt considérable de ce fonds : sans doute, les dépouillements pratiqués selon une méthode « impressionniste » sont-ils loin de fournir toujours du vocabulaire d'un auteur une image parfaitement objective. Mais, soigneusement revues (quelquefois par M. Roques lui-même), ces fiches ont le mérite de la précision philologique; certaines sont dues à d'éminents spécialistes (ainsi le dépouillement de Froissart confié à L. Foulet), d'autres à des collaborateurs de l'écrivain lui-même (ainsi le dépouillement de Barrés, assuré par la secrétaire personnelle de l'auteur), d'autres enfin — pour les textes scientifiques — à des médecins, des ingénieurs ou des techniciens. De manière générale, l'attention accordée aux techniques et aux langues marginales, en particulier aux argots (dont le fichier a été, en grande partie, établi par M. G. Esnault) et le souci de consigner les vocables dans leurs emplois les plus rares en font un instrument de travail d'une exceptionnelle richesse.

La documentation propre au T.L.F. est rassemblée par l'ensemble électronique Gamma 60. Certes, pour les champs lexicologiques les plus riches et les plus anciens de la langue, — l'habitat, les liens de parenté, le vocabulaire du temps, le vocabulaire grammatical... — les photocopies des articles de dictionnaires importants, constituées en dossiers de mots, forment un ensemble d'une consultation aisée qui facilite la tâche du rédacteur. On y ajoutera les fichiers spécialisés établis par les différentes unités de recherche. Mais l'apport le plus important du T.L.F. est dans sa documentation automatique : on y distinguera les documents imprimés des fichiers-machine qui se prêtent aux recherches les plus diversifiées. Parmi les premiers, les feuilles-concordances et les fiches-texte jouent le rôle le plus important.

On appelle au T.L.F. feuilles-concordances [6] des états qui présentent, classées dans l'ordre chronologique, des concordances de trois lignes dont la seconde, imprimée sur le volet gauche de la feuille, contient obligatoirement le mot vedette. Chaque concordance est précédée de la référence de l'ouvrage et de la sous-référence de l'exemple (livre, chapitre,
47
acte, scène, numéro de page, etc.). Un numéro d'exemple renvoie à la fiche-texte correspondante.

On appelle fiche-texte un ensemble de 18 lignes dont les 8 lignes du milieu constituent le texte propre, celles du haut n'étant que le rappel des dernières lignes de la fiche précédente et celles du bas anticipant sur la fiche suivante. Une lecture continue de fiche à fiche des 8 lignes intermédiaires restitue donc le texte intégral.

L'ordinateur a déjà traité un corpus d'environ 90 millions d'occurrences dont 47 millions représentent le dépouillement intégral de 586 ouvrages littéraires du XXe siècle; il atteint actuellement un rythme de traitement d'environ 100 000 occurrences en sept heures. Les feuilles-concordances obtenues, reliées mot par mot dans l'ordre chronologique, constituent la documentation de base du rédacteur, qui décide si tel ou tel exemple mérite un examen plus attentif et demande, le cas échéant, la fiche-texte correspondante.

Il va de soi qu'une telle documentation présente par le caractère exhaustif [7] des dépouillements et la possibilité qu'elle offre de recourir à un contexte étendu, un attrait indéniable indépendamment de l'entreprise lexicographique du T.L.F. : un atelier de photographie actuellement à l'étude devrait permettre, dans un délai rapproché, de la reproduire sur microfiches [8] afin d'en faciliter la diffusion extérieure.

Mais c'est principalement dans les fichiers-machine du T.L.F. que les chercheurs extérieurs au laboratoire pourraient trouver un auxiliaire appréciable de travail : tous les textes dépouillés sont en effet stockés, sous une forme condensée, sur des rubans magnétiques, et forment un fichier-répertoire qui, attribuant aux mots classés par ordre alphabétique les numéros d'ordre qu'ils occupent dans le texte, les fait suivre aussi de tous les codes déjà intervenus dans la constitution des feuilles- concordances et des fiches-texte (codes grammaticaux, codes de regroupement des formes fléchies [9], codes d'homographie, etc.). Consignant ainsi l'essentiel des traitements déjà réalisés, le fichier-répertoire — il faut le souligner avec énergie — est conçu de telle sorte qu'il permet, indépendamment des besoins propres du T.L.F., toute recherche séquentielle praticable en documentation automatique. Que l'on veuille connaître dans telle œuvre, chez tel auteur, à telle époque, voire sur l'ensemble du corpus, les séquences

substantif + adjectif

pour les opposer aux séquences

adjectif + substantif,

que l'on s'intéresse au syntagme nominal

substantif + de + substantif
ou que, parmi les innombrables questions possibles de morphologie, on retienne celle des formes verbales déficientes ou
48
défectives, la machine est capable, moyennant un programme spécifique, de répondre à toutes ces demandes comme à n'importe quelle autre pour peu qu'elle repose sur des critères formels. Il est vrai que le temps d'accès, lorsque le support est le ruban magnétique, n'est pas, sur Gamma 60, particulièrement favorable, et le souci de la rentabilité conduit obligatoirement à regrouper autant que possible les questions posées. Mais il est certain que toutes les précautions sont prises pour que la documentation rassemblée en vue du dictionnaire T.L.F. puisse servir à n'importe quelle recherche syntaxique, lexicologique ou stylistique de type séquentiel. Le remplacement du Gamma 60 par un matériel plus maniable devrait faciliter de telles recherches aléatoires[NDLR 3].

Le T.L.F. lui-même utilise son fichier-répertoire pour toutes sortes de traitements complémentaires, par exemple en vue de publier (début 1969) un état statistique qui donnera pour chaque vocable la fréquence absolue dans le corpus du XXe siècle et dans celui du XIXe siècle, le rang et la fréquence relative par siècle, par demi-siècle et par « forme d'expression »[10]. Ce recueil documentaire portera sur le dépouillement de plus de 80 millions d'occurrences et présentera en outre un relevé des hapax ainsi qu'un dictionnaire des formes homographes du français.

Telle est, sommairement décrite, la documentation du T.L.F. : son étendue et la forme qu'elle revêt devrait lui garantir quelque place dans les recherches de linguistique française.

II. — Le T.L.F., dictionnaire historique de la langue française.

Cette documentation sert en premier chef à la rédaction d'un dictionnaire historique du français, d'un Trésor de la langue française.

Certes, on est en droit de se demander avec G. Matoré (voir Biblio, 1968) si l'idée même d'un trésor « n'appartient pas à un stade dépassé de la science ». Cette idée va en effet de pair en lexicographie avec celle d'exhaustivité à la fois dans le nombre de vocables à retenir et dans les aspects divers de leur description : or, un tel projet, forcément à long terme, risque de s'adapter mal à la progression de la science et d'être largement dépassé au moment même où il voit le jour; d'autre part, on ne parlera de « trésor » que si les vocables sont étudiés à la fois dans leur histoire et dans le fonctionnement synchronique qui, à différentes époques, les situe dans une structure organisée : or, le problème des rapports entre synchronie et histoire se pose en lexicographie avec une acuité si redoutable que les plus pessimistes estiment illusoire toute entreprise de lexicographie historique.

49

Le T.L.F. pallie ces difficultés par des options forcément discutables mais sérieusement réfléchies :

a) Reculant devant le gigantisme, il limite délibérément ses ambitions. Certes, l'idéal d'une description intégrale du mot n'est pas abandonné, et les articles du T.L.F. comprendront des indications bibliographiques, une analyse phonétique, phonologique et grammaticale, une étude du contenu sémantique et des réseaux lexicologiques, une brève caractérisation stylistique, un aperçu étymologique et historique : chaque mot sera l'objet d'une courte monographie. Mais la priorité accordée aux exemples, le souci de fournir avant toute chose une documentation soigneusement classée grâce à une « reconstruction sémantique » aux principes cohérents et simples, le rejet dans les « trésors » spéciaux — à confectionner ultérieurement — de tous les vocables que leur technicité met à l'écart de la langue courante maniée par l'homme cultivé et surtout la décision de rédiger le T.L.F. par tranches chronologiques en commençant par la période la plus récente (1789-1964) permettent d'augurer plus favorablement d'une entreprise dont les responsables connaissent les embûches.
b) La rédaction par tranches chronologiques apporte également au problème épineux de l'histoire une solution acceptable. Le principe saussurien de l'explication synchronique s'applique avec rigueur dès lors que l'on choisit une période étroite de référence [11] et que l'on s'en tient à cette découpe dans l'analyse du contenu et du fonctionnement linguistiques. Dès lors le plan de l'article et son organisation propre reflètent autant que possible le profil en langue du vocable étudié et relèvent sans ambiguïté d'une conception synchronique.

Le point de vue historique ne s'en trouve pas sacrifié, bien au contraire. L'histoire réapparaît sous trois visages dans ce « trésor » de la langue moderne :

— Dès que la période étudiée présente une certaine étendue (et comment en serait-il autrement dans un dictionnaire d'exemples?), elle est forcément le lieu de variations historiques. Ainsi l'historien sait que la langue desXIXe et XXe siècles n'est pas une véritable synchronie et que depuis 1789 le profil de tel mot a pu changer, son contenu s'altérer, son usage varier : des remarques historiques, imprimées dans un corps plus discret, en décriront les fluctuations, les recherches, les tâtonnements, mais sans influer d'aucune manière sur le découpage des sens et sur la structure même de l'article délibérément synchronique ;
— Le rôle de l'historien ne s'arrête pas là. Sans donner dans la plus regrettable des confusions qui laisserait ignorer la différence capitale entre l'explication synchronique, dont le propre est de référer le fait particulier à ce plan de grande généralité qu'est la langue par opposition au discours, et l'explication diachronique qui consiste à dégager des filiations d'un autre ordre, il a cependant conscience que le fonctionnement de la langue à un
50
certain moment de son histoire ne peut être sans rapport avec l'évolution historique elle-même, puisqu'elle en est le résultat. Certes, on conçoit que la marche d'un mécanisme puisse être étudiée en soi, indépendamment de son plan de montage. Mais il n'est pas indifférent de connaître ce plan. L'histoire prépare le fonctionnement synchronique, il existe toujours entre l'une et l'autre quelque rapport secret : on aurait tort de se priver d'un secours qui peut fort bien mener à une conception plus juste du fait synchronique. Une étude sur le mot rien (voir Biblio, R. Martin) nous a montré l'analogie frappante entre le dynamisme historique et le fonctionnement en synchronie moderne. Toute porte à croire qu'une telle corrélation n'a rien d'exceptionnel. Ainsi, dans le T.L.F. moderne, on donnera pour chaque vocable un résumé étymologique et historique, non seulement dans un souci d'utilité pratique, mais aussi pour ne pas renoncer, en dépit de la perspective synchronique dans laquelle on entend se placer, à l'apport éclairant de l'histoire [12]. L'hypothèse d'un certain parallélisme entre synchronie et diachronie ne trahit pas la vocation primitive du T.L.F. qui est de rédiger un dictionnaire historique.
— Mais il y a plus : pour quiconque a étudié en détail un vocable français, il ne fait aucun doute que certains emplois, il est vrai marginaux, échappent à l'explication synchronique; un état de langue, aussi cohérent soit-il, conserve toujours en lui les traces irréductibles de synchronies dépassées. Une langue de culture reflète en elle la richesse de son passé, et c'est la trahir que d'en ignorer la profondeur historique. Parler d'archaïsme (comme d'ailleurs de néologisme), c'est se référer à un état de langue qui n'est pas l'état actuel. Lorsque Gide prend ne... pas que au sens de ne... que, il s'autorise de l'usage classique où l'exceptif que inversait une négation achevée; et lorsque Balzac emploie du moment où, il s'en tient à une forme déjà désuète de son temps où le morphème que avait accaparé dès longtemps dans le domaine des relations logiques le rôle privilégié d'indice conjonctionnel. Et les tournures figées, même les plus courantes, les groupes lexicalisés, même les plus répandus, ne s'expliquent pas en synchronie; pour peu que l'on ait le souci de dépasser le stade primitif de la description, force est bien de s'en rapporter à l'histoire. Comment rendre compte du morphème quel dans l'expression tel quel, si ce n'est en rappelant un emploi de relatif aujourd'hui oublié? On dira sans doute que cette locution ne doit pas être disséquée. Peut-être. Mais l'élément tel ne s'y écarte pas de son usage le plus régulier, et la substitution de que à quel dans la langue populaire montre bien que cette tournure n'a rien d'irréductible.

On voit en tout cas l'importance décisive de l'histoire dans le T.L.F.

51

Certes, on ne perd jamais de vue que l'explication historique est radicalement différente de l'explication synchronique, que tout doit être mis en œuvre pour sauvegarder une opposition aussi fondamentale. Mais de là à condamner le recours à l'histoire sous prétexte de rigueur méthodologique, il y a loin, et l'on s'y refuse au T.L.F.

Cela ne suffit pas, évidemment, pour garantir l'intérêt de l'œuvre entreprise. Mais on nous pardonnera d'espérer que le T.L.F. contribuera quelque peu à la connaissance du français, voire à la méthodologie de son étude.

On est en droit par exemple de penser, si l'on en juge par les articles déjà rédigés, que le T.L.F. permettra d'apprécier avec quelque justesse la vitalité du vocable dans ses différentes acceptions. Le rédacteur a l'avantage inestimable de disposer pour chaque mot d'une documentation obtenue par le dépouillement d'un nombre considérable de textes, au choix, à la préédition et à la datation desquels on a apporté un grand soin et qui offrent ainsi de sérieuses garanties philologiques [13].

Il semble bien aussi que l'attention accordée aux relations paradigmatiques et syntagmatiques soit de nature à donner du lexique français une vue plus objective. L'on attend beaucoup au T.L.F. d'un traitement mécanisé dit « étude des groupes binaires » : un mot quel qu'il soit entretient avec son entourage syntagmatique des relations complexes. Les mots s'appellent les uns les autres selon des affinités qu'un dictionnaire moderne doit enregistrer. On appellera groupe binaire (G.B.) l'association séquentielle, attestée avec une certaine fréquence, de deux mots appelés « sémantiques » [14]. Ainsi, dans la phrase « ce garçon a une faim de loup », les associations :

  • garçon a /
  • avoir faim /
  • faim (de) loup/,

pour peu qu'elles dépassent le seuil de fréquence retenu, seront considérées comme des groupes binaires. Tout le problème consiste à déterminer le seuil de sélection. L'expérience montrant que, sur un corpus de 6 à 7 millions d'occurrences, l'énorme majorité des G.B. de fréquence égale ou supérieure à 6 s'explique par une motivation sémantique et non par la rencontre plus ou moins fortuite de vocables que ne lie aucune affinité lexicale, cette donnée empirique permet, par le calcul de la probabilité à priori [15], de déterminer le seuil au-delà duquel le hasard ne. suffit pas pour expliquer le voisinage des unités lexicales. Ainsi la machine sélectionnera les groupes

52

sémantiques véritables et déterminera des corrélations lexicales. Opérée sur un corpus de grande étendue, la recherche des G.B. conduit à un inventaire des comptabilités sémantiques et permet d'apprécier le degré de cohésion des associations lexicales. Ainsi les articles du T.L.F. donneront par exemple les sujets et compléments avec lesquels tel verbe se construit le plus volontiers, les adjectifs et les compléments déterminatifs qu'appelle fréquemment tel substantif ou encore les substantifs auxquels se rapporte de préférence tel adjectif. Au demeurant, on restituera, pour chaque G. В., les deux mots qui le précèdent et les trois mots qui le suivent de manière à élargir éventuellement la recherche aux groupes lexicalisés de plus de deux vocables. L'étude systématique des distributions offre en lexicographie une perspective qui peut être intéressante : elle permet de redonner aux mots leur véritable visage en les évoquant dans les structures syntag- matiques où ils apparaissent le plus souvent. Le traitement se fait d'ailleurs par décennies, en commençant par les plus récentes, et l'on a soin de relever les attestations de groupes binaires, même rejetées par le test statistique, pour peu que, dans une tranche précédemment traitée, elles aient été conformes au critère de sélection : ainsi il devient possible d'écrire l'histoire détaillée de la lexicalisation en français et des corrélations significatives.

La méthode lexicographique du T.L.F. se voudrait suffisamment rigoureuse pour être praticable par un grand nombre de rédacteurs. Elle diffère légèrement, par la nature même des choses, selon qu'elle porte sur des mots « sémantiques » ou sur des mots « grammaticaux ». Appliquée à l'étude des mots sémantiques, elle consiste en une certaine technique de découpage des sens et en un certain nombre de principes propres à guider dans le choix des exemples et dans la formulation des définitions.

Le découpage des sens se fonde sur la découverte empirique des sèmes. A partir des définitions recueillies dans les principaux dictionnaires, le rédacteur dégage ces éléments sémiques minimaux et procède à une « reconstruction sémantique » par laquelle il distingue les sens (cas de la polysémie) et, à l'intérieur d'eux, les effets de sens ou les emplois particuliers. Ainsi, dans un mot comme plateau, le complexe sémique (sémème) « objet 4- plat + horizontal -f- d'une certaine épaisseur » constitue l'un des sens sous lequel on rangera par exemple l'effet de sens que livre ce mot dans le syntagme plateau de la balance. Ou encore dans le mot refuge, la signification unique est due au sème classificateur lieu spécifié par l'idée d'une recherche de protection matérielle ou morale; des effets de sens comme « personne auprès de laquelle on trouve la sûreté » (au demeurant vieilli et littéraire) ou encore comme « lieu où le gibier se met à l'abri quand il est poursuivi » se rattachent, comme des exploitations particulières, à la signification fondamentale. Cette méthode d'analyse empirique conduit à des résultats que doivent étayer les techniques plus formelles de l'analyse distributionnelle, syntaxique et dérivationnelle. L'étude des distributions au moyen des G.B. permet de cerner avec plus

53

de précision les sens et effets de sens typiques du vocable. Ainsi, les G.B. acte de liberté, acte de violence, acte de soumission..., voire le syntagme faire acte de présence, s'opposent à des combinaisons comme acte de naissance, acte notarié ou encore au syntagme acte d'une tragédie et correspondent, parmi d'autres, à autant de sens du mot acte. L'environnement syntaxique peut, de son côté, manifester une polysémie : ainsi le verbe résider présente deux sens différents selon qu'il se construit avec la préposition à ou la préposition dans, d'autant plus que, dans le premier cas, il appelle un sujet de l'animé et dans le second un sujet de l'inanimé. Cette analyse se confirme par le jeu des dérivations [16], le mot résidence correspondant uniquement au sens 1 :

résider sens 1 résider à, en sujet de l'animé résidence
sens 2 résider dans sujet de l'inanimé pas de dérivation substantive

On voit donc que l'alliance de l'analyse formelle et de l'étude sémique conduit à un découpage qui n'est pas seulement intuitif.

L'art de la définition « logique » (voir R. L. Wagner, 1967, pp. 135- 139) consiste en premier chef à choisir en toute connaissance de cause le terme générique ou terme définissant qui fournit le genre prochain et que spécifient les traits distinctifs propres à opposer le vocable à ses concurrents du même champ sémique. La hiérarchie des termes définissants est établie à l'intérieur de chaque ensemble sémantique (voir P. Imbs, 1960, pp. 9-16). A la définition ainsi obtenue, aussi abstraite que possible, font équilibre les exemples dont l'intérêt est dans la « richesse particularisante », dans la « singularité de leur information » (voir P. Imbs, 1965, p. 475). Parmi les bons exemples, on fera donc un sort non seulement aux contextes qui mettent en concurrence des mots de sens voisin, à ceux qui empruntent la forme d'une définition ou à ceux qui illustrent un emploi rare, mais, plus généralement, à tous ceux dont la particularité fait contraste avec le caractère général d'une définition qui situe le mot en langue, c'est-à-dire dans sa virtualité, et qui tend par là même vers un maximum d'extension. Les exemples compensent l'abstraction de la définition par la richesse de leur information : c'est en eux que se retrouve, refusée par ailleurs dans un dictionnaire de langue, la visée descriptive et encyclopédique.

L'étude des mots grammaticaux et des éléments formateurs du
54
lexique (préfixes et suffixes) est menée selon des règles quelque peu différentes. Là, les monèmes, supports de catégories bien plus que de sèmes, sont directement appréhendés au moyen de l'analyse formelle. La première tâche du rédacteur grammairien consiste à dégager les types syntaxiques dans lesquels fonctionne le vocable étudié. Ainsi, le morphème quand, versé dans la, catégorie des adverbes interrogatifs, se combine avec tel ou tel tiroir grammatical pour livrer tel ou tel effet de sens; versé dans la catégorie des conjonctions de temps, il présente une distribution semblable mais glisse imperceptiblement vers des emplois logiques (causalité, supposition, concession...). Une fois établi l'inventaire complet des situations syntaxiques, on en vient à formuler une hypothèse sur le contenu en langue du vocable étudié. Pour le mot quand par exemple, elle pourrait être que ce morphème de temps suggère un espace en soi virtuel, mais qui tend à se restreindre à un espace minimum, c'est-à-dire à s'actualiser de manière à situer dans le temps le procès qui s'y inscrit [17]; tantôt, dans l'emploi adverbial, l'espace verbal de quand est l'objet d'une interrogation et ne s'actualise que dans la réponse qui y est donnée, tantôt, dans l'emploi conjonctionnel, cet espace est fourni par le procès subordonné qui coïncide, du moins partiellement, avec l'espace du procès principal. La valeur d'une hypothèse se mesure à sa simplicité, à sa compatibilité avec les hypothèses formulées à propos d'autres morphèmes et à sa vertu explicative. Il va de soi qu'une hypothèse n'est jamais la seule possible. Ce qu'on lui demande, c'est de fournir l'idée directrice de l'article lexicographique, un principe d'organisation cohérente. Tout la remet en cause : l'infinie diversité des exemples, la confrontation avec les autres morphèmes, en particulier avec les concurrents immédiats (quand /lorsque), l'analyse, même par-delà les parties du discours, des corrélations significatives (par exemple la corrélation entre à de sens temporel et quand, entre à de sens local et où, entre à introduisant, dans le syntagme verbal, un complément de l'inanimé ou un complément de lieu et le morphème y, etc.). Du moins voudrait-on sauvegarder par une telle hypothèse l'originalité véritable du dictionnaire dans l'étude des mots grammaticaux qui est de présenter sous une même vedette toute l'étendue des emplois et toutes les implications que les grammaires dispersent dans les chapitres que, par vocation, elles consacrent à des catégories ou à des schemes syntaxiques.


Tels sont, à peine effleurés, quelques points de méthodologie lexico- jraphique. Les problèmes abondent. Chacun d'eux ferait l'objet d'un
55
article détaillé [18]. Nous voudrions dire surtout que la méthode du T.L.F. n'a rien d'immuable, qu'elle reste ouverte à toutes les influences. C'est peut-être son seul mérite : mais c'est aussi une garantie de vitalité.

Notes de l'article

  1. 44, avenue de la Libération, 54-Nancy.
  2. Il comprend actuellement MM. R. Lebègue, président, G. Antoine, C. Brunei, J. Dubois, J. Fabre, G. Gougenheim, P. Imbs, F. Lecoy, J. Lefèvre, G. Matoré, B. Quemada et R.-.L. Wagner.
  3. 33, quai de la Tournelle, Paris (5e). Il est dirigé par M. F. Lecoy.
  4. 30, rue Mégevand, 25-Besançon. Il est dirigé par M. B. Quemada.
  5. [45 - 1] Sur demande adressée au directeur du Centre.
  6. [46 - 1] On en trouvera reproduit un exemplaire dans la brochure que le C.N.R.S. a consacrée au T.L.F. (Paris, C.N.R.S., Bureau des relations extérieures et de l'information, 1967, 48 p.), pp. 24-25.
  7. [47 -1] Pour les mots grammaticaux cependant, on ne retient, par texte dépouillé, que 10 attestations tirées au hasard.
  8. [47 - 2] Une micro fiche de 105 x 148 mm contiendra 16 feuilles-concordances (chacune de 15 concordances) ou 64 fiches-texte.
  9. [47 - 3] Pour l'ancienne langue, on prépare un Dictionnaire théorique des formes flexionnelles dont les principes sont exposés (p. 29 et p. 31) dans la brochure citée plus haut.
  10. [48 - 1] On appelle « formes d'expression », de préférence à « genre littéraire », le corpus des textes en prose, des textes en vers, des poèmes en prose, le corpus des fragments de textes à prédominance de pronoms personnels, d'adjectifs et de pronoms possessifs de lre personne (soliloques, journaux intimes, mémoires intérieurs...), de 2e personne (textes de dialogue), de 3e personne (récits, commentaires...).
  11. [49 - 1] Par exemple la langue contemporaine pour le T.L.F. moderne.
  12. 50 -1 Cf. P. Imbs, « Au seuil de la définition », Cahiers de lexicol, 1960, t. 2, p. 15 : « II est théoriquement impensable et pratiquement impossible que le contenu sémantique d'un mot ne se ressente pas peu ou prou du chemin qu'il a parcouru dans le temps et dans l'espace; c'est à déceler ce passé subsistant dans le présent que doit aider le rappel de l'étymologie. »
  13. [51 - 1] On trouvera la liste des textes dépouillés et l'exposé des principes de sélection dans les suppléments du Fr. mod. réservés au T.L.F. Deux fascicules sont déjà parus (1968, 2, pp. 162-176 et 1968, 3, pp. 257-272). Une part importante est réservée aux textes mineurs. Voir à ce sujet les recommandations de M. R.-L. Wagner, Les Vocabulaires français, Paris, Didier, 1967, en partie, pp. 144 et suiv.
  14. [51 - 2] Par opposition à une. liste finie de mots « grammaticaux »ou « fonctionnels ».
  15. [51 -3] La probabilité à priori de trouver A et В former n G.B. (N étant le nombre total de G.B. formés) est de :

  16. [53 - 1] Sur l'importance dans le découpage des sens de l'analyse dérivationnelle (comme d'ailleurs de l'analyse syntaxique), on ne peut que renvoyer au Dictionnaire du français contemporain que M. J. Dubois et une équipe de linguistes ont publié à la Librairie Larousse (Paris, 1966).
  17. [54 - 1] Encore faut-il que le procès sur le lieu duquel on interroge soit susceptible de s'inscrire en fait entre des limites précises; d'où la prédilection accordée au passé simple (Quand revint-il?), au futur ou au présent dans le sens d'un futur proche; d'où aussi la valeur itérative obtenue généralement par la combinaison avec l'imparfait.
  18. Outre les études auxquelles il a été renvoyé au cours de cet article, on lira avec intérêt : R.-L. Wagner, « Le Trésor de la langue française », Mercure de France, 1962, pp. 365-369; G. Gorcy, « Le Trésor de la langue française », La Revue de VA.U.P.E.L.F., 1964, t. 2, pp. 52-55, et « Trésor et mathématiques », L'Ingénieur des industries chimiques, 1964, t. 37, pp. 26-28; etsurtout les actes du Colloque de Strasbourg consacré, en l'J57, au projet d'un trésor de la langue française : Lexicologie et lexicographie françaises et romanes, orientations et exigences actuelles (Avant-propos de P. Imbs), Paris, G.N.R.S., 1961, vin-295 p. Cf. aussi « Le Trésor de la langue française. Projet de dictionnaire du vocabulaire français avec l'utilisation du Gamma 60 » Bull Informations, 1963, n° 8, pp. 1-4.

Notes de la rédaction

  1. Jacques Dendien, « Histoire de l’informatisation du TLF » dans le livret d’accompagnement au TLFi, CNRS éditions, Paris, 2004, p. 14-15.
  2. Effectivement, quelques années plus tard (1975 environ) le B.A.L.F a été déployé en système documentaire avec le logiciel Mistral sur l'Iris 80 de l'IUCAL (témoignage de Jacques Ducloy (discussion) 14 juin 2021 à 07:44 (CEST))
  3. Ce qui sera permis à partir 1974 avec l'IRIS 80, et ultérieurement avec les développements de Jacques Dendien sur Frantext.

Voir aussi

Dans le réseau Wicri :

La page de référence « Langue française (1969) Martin, TLF » est sur le wiki Wicri/Linguistique.