par Thierry Selva
Dans son étude Le Roman, qui préface Pierre et Jean, Maupassant, reprenant les idées de Flaubert1 définit sa propre vision de l'écriture en déclarant :
Quelle que soit la chose qu'on veut dire, il n'y a qu'un mot pour l'exprimer, qu'un verbe pour l'animer et qu'un adjectif pour la qualifier. Il faut donc chercher, jusqu'à ce qu'on les ait découverts, ce mot, ce verbe et cet adjectif, et ne jamais se contenter de l'à-peu-près, ne jamais avoir recours à des supercheries, même heureuses, à des clowneries de langage pour éviter la difficulté. On peut traduire et indiquer les choses les plus subtiles en appliquant ce vers de Boileau : Il n'est point besoin du vocabulaire bizarre, compliqué, nombreux et chinois qu'on nous impose aujourd'hui sous le nom d'écriture artiste, pour fixer toutes les nuances de la pensée ; mais il faut discerner avec une extrême lucidité toutes les modifications de la valeur d'un mot suivant la place qu'il occupe. Ayons moins de noms, de verbes et d'adjectifs aux sens presque insaisissables, mais plus de phrases différentes, diversement construites, ingénieusement coupées, pleines de sonorités et de rythmes savants. Efforçons-nous d'être des stylistes excellents plutôt que des collectionneurs de termes rares. |
Et un peu plus loin :
La langue française, d'ailleurs, est une eau pure que les écrivains maniérés n'ont jamais pu et ne pourront jamais troubler... La nature de cette langue est d'être claire, logique et nerveuse. Elle ne se laisse pas affaiblir, obscurcir ou corrompre. Ceux qui font aujourd'hui des images, sans prendre garde aux termes plus abstraits, ceux qui font tomber la grêle ou la pluie sur la propreté des vitres peuvent aussi jeter des pierres à la simplicité de leurs confrères ! Elles frapperont peut-être les confrères qui ont un corps, mais n'atteindront pas la simplicité qui n'en a pas. |
Par ces propos, Maupassant recherche clairement la simplicité et se positionne dans le camp des écrivains d'instinct par opposition aux écrivains de recherche.
Mais que veut dire exactement simplicité ? Est-ce que ce terme implique l'utilisation d'un vocabulaire commun, pauvre, avec en conséquence une certaine redondance, une certaine répétition dans les mots et tournures employés (car l'uvre de Maupassant, si elle n'atteint pas le volume d'un Zola ou d'un Hugo, est quand même conséquente) ? Ou bien la simplicité a-t-elle un rapport avec l'emploi, ou plutôt le non-emploi, de termes rares, sans toutefois exclure une richesse et une diversité du vocabulaire ? D'ailleurs, qu'en est-il de la simplicité du vocabulaire de Maupassant ? Est-elle réelle ou apparente ? La présente étude va tenter, preuves à l'appui, d'apporter une réponse à ces questions, maintes fois débattues sans jamais disposer des seuls éléments qui permettent de résoudre le problème de manière concluante : la liste des mots employés par Maupassant dans toute son uvre, et sa taille. Il s'agit donc ici d'une étude quantitative car les notions de rareté ou de fréquence sont liées directement au nombre d'occurrences d'un mot dans les textes.
La clarté présumée du vocabulaire de Maupassant a toujours donné l'impression que celui-ci utilise très peu de mots. C'est d'ailleurs un sentiment généralement admis, même parmi les spécialistes. Armand Lanoux écrit par exemple2 :
Il n'y a pas de grand écrivain français qui ait écrit aussi bien avec aussi peu de mots. |
De même, André Vial3 cite l'étude de Albert Schinz4 qui
... dénombrant le vocabulaire de dix contes de Maupassant, constate que l'auteur se sert à peu près du dixième des mots qui existaient de son temps - ce serait en somme un rapport renouvelé de celui de Racine - ... |
Et plus loin,
Le roman de Maupassant, dans son ensemble, appelle les mêmes conclusions. A quelques exceptions près, qui seront précisées, il ne requiert du lecteur moyen l'usage d'aucun dictionnaire, et le vocabulaire dont il est fait n'épuise qu'une partie bien exiguë du Petit Larousse. |
Alors, qu'en est-il vraiment ?
A l'époque de M. Schinz (1909), on ne pouvait que prendre son courage à deux mains et lire chaque texte en notant sur une feuille de papier le vocabulaire rencontré. De la sorte, on n'allait pas bien loin, et c'était compréhensible. Le problème est que le nombre de mots différents augmente avec la quantité de texte et qu'une dizaine de contes, même sélectionnés avec attention, ne sont absolument pas représentatifs de l'ensemble de l'uvre.
De nos jours, l'existence de corpus électroniques et d'analyseurs automatiques rend ce dénombrement bien moins fastidieux. Ainsi, pour cette étude, nous avons utilisé les ressources et outils dont nous disposions : d'une part le corpus Maupassant, rassemblé sur notre site Maupassant par les textes, qui couvre l'ensemble de l'uvre. Il comprend 306 contes et nouvelles, 6 romans plus l'Âme étrangère et l'Angelus, inachevés et ne dépassant pas le chapitre, 3 récits de voyage, un peu plus de 200 chroniques journalistiques, la poésie et le théâtre5, soit en tout l'équivalent de 5 000 pages de l'édition Pléiade. D'autre part, nous avons fait fonctionner un logiciel d'analyse textuelle, Cordial Analyseur 7, qui permet d'obtenir, pour chaque mot, sa forme canonique ou lemme (infinitif pour les verbes, masculin singulier pour les adjectifs, singulier pour les noms), et qui permet de dresser ainsi l'inventaire du vocabulaire de Maupassant.
Cordial Analyseur a la réputation dans le monde universitaire d'être un des meilleurs analyseurs sur le marché (on parle en fait d'étiqueteur, c'est-à-dire d'un programme qui associe à chaque mot une ou plusieurs étiquettes morpho-syntaxiques, comme le lemme ou la catégorie grammaticale). Cependant, il faut savoir que l'étiquetage de textes n'est pas, pour diverses raisons dans lesquelles nous n'entrerons pas ici, une science exacte et que l'état de l'art dans le domaine correspond à un taux d'erreur de 5 %. C'est-à-dire qu'en moyenne un mot sur vingt, ce qui est tout de même une faible proportion pour notre étude, est mal étiqueté. L'une des erreurs les plus fréquentes est la confusion entre l'adjectif et le participe passé. Ainsi, bien souvent, doué est étiqueté comme le participe passé de douer et non comme adjectif, alors que c'est bien cet emploi que l'on retrouve majoritairement dans les textes. De même certains adjectifs comme tigré ou tacheté sont considérés comme des verbes sous l'emploi de participe passé. Bien que cela soit gênant, la proportion de ces erreurs reste faible et, si les chiffres donnés ci-dessous ne sont pas exacts à 100 %, ils sont très proches de la réalité et nous permettent de tirer des conclusions fiables.
L'analyse des textes a donné les résultats suivants :
Noms communs | Verbes | Adjectifs | Adverbes | Total |
---|---|---|---|---|
10 021 | 3 117 | 4 352 | 766 | 18 256 |
Ces chiffres couvrent la quantité effective de mots dans chacune des catégories grammaticales. Les noms propres, chiffres sous forme numérique, formes patoisantes, étrangères (prussiennes notamment), coquilles et mots non reconnus par l'analyseur ont été écartés, soit automatiquement, soit par correction manuelle. Les listes ainsi que les textes sont accessibles sur notre site Internet. Si l'on rajoute au total les autres catégories (articles, pronoms, prépositions, conjonctions, etc.), vides sémantiquement et qui sont au nombre de quelques centaines, on obtient donc un vocabulaire total de 18 000 à 18 500 mots. Signalons par ailleurs que la notion de mot, très floue, est ici très restrictive : est considéré comme mot, à de rares exceptions près qui sont le fait du dictionnaire de l'analyseur, toute série de lettres entre deux séparateurs typographiques (blancs, ponctuation). Donc des mots comme pomme de terre, chemin de fer, bon marché, etc. sont décomposés. Le nombre de ces unités polylexicales étant loin d'être négligeable, le vocabulaire de Maupassant s'en trouve d'autant augmenté. On est donc bien loin d'une quantité de 2 000 - 3 000 mots que l'on entend parfois ou encore, selon André Vial, d'une portion congrue des dictionnaires6. Néanmoins, ces chiffres restent difficiles à interpréter dans l'absolu. 18 000 mots, cela paraît respectable, mais est-ce vraiment beaucoup ? Qu'en est-il des autres écrivains ? Comme il nous manquait un point de comparaison, nous avons dès lors étendu l'étude à trois grands auteurs assez proches de Maupassant chronologiquement, trois auteurs n'ayant pas la réputation d'utiliser un vocabulaire simplifié : Flaubert, Proust et Zola.
Pour pouvoir comparer le vocabulaire de ces grands écrivains, nous avons fait porter notre étude sur un genre littéraire commun à tous les quatre : le roman. D'une part, un roman est un ensemble cohérent dans le sens où il y a une certaine unité de sujet et de vocabulaire. Celui-ci ne s'éparpille pas dans tous les sens comme il le fait dans une série de textes courts couvrant de multiples sujets, les contes de Maupassant par exemple. D'autre part, il est possible de télécharger sur Internet les uvres respectives, dans une quantité comparable à celle des romans de Maupassant.
Pour cette étude, les corpus comprennent (entre parenthèses, la taille des fichiers en kilo-octets, un octet correspondant, dans le cas des fichiers texte, à un caractère) :
Auteur | Nb. de noms communs | Total des occurrences | Moyenne d'emploi |
---|---|---|---|
Flaubert | 8 070 | 94 905 | 11,76 |
Maupassant | 5 879 | 85 685 | 14,57 |
Proust | 6 815 | 83 098 | 12,19 |
Zola | 5 880 | 91 774 | 15,82 |
Auteur | Nb. de verbes | Total des occurrences | Moyenne d'emploi |
---|---|---|---|
Flaubert | 2 500 | 76 943 | 30,77 |
Maupassant | 2 149 | 83 435 | 38,83 |
Proust | 2 403 | 85 111 | 35,42 |
Zola | 2 277 | 86 693 | 38,07 |
Auteur | Nb. d'adjectifs | Total des occurrences | Moyenne d'emploi |
---|---|---|---|
Flaubert | 2 653 | 20 223 | 7,62 |
Maupassant | 2 636 | 31 934 | 12,11 |
Proust | 3 108 | 29 080 | 9,36 |
Zola | 2 127 | 26 134 | 12,29 |
Auteur | Nb. d'adverbes | Total des occurrences | Moyenne d'emploi |
---|---|---|---|
Flaubert | 510 | 28 530 | 55,94 |
Maupassant | 461 | 34 609 | 75,07 |
Proust | 615 | 41 763 | 67,91 |
Zola | 414 | 36 105 | 87,21 |
Ainsi, Maupassant a utilisé approximativement un peu moins de 6 000 noms communs différents dans ses romans, ce qui représente environ 85 700 occurrences de noms dans ses textes. La dernière colonne indique la moyenne d'emploi : Maupassant utilise un nom commun en moyenne 14,57 fois. Ce dernier chiffre ne veut rien dire pour un mot en particulier mais dénote une tendance, celle de la diversité du vocabulaire. A ce jeu-là, c'est Flaubert qui a le vocabulaire le plus diversifié (ce qui correspond bien à son souci d'éviter les répétitions), et Zola, à l'exception des verbes8, le moins varié. Nous ne commenterons pas les résultats dans le détail, mais force est de constater qu'il n'apparaît pas une différence flagrante entre la quantité de vocabulaire de Maupassant et celles des autres écrivains, pour une quantité de texte comparable. Il a certes utilisé moins de noms communs que Flaubert (le champ lexical de Salammbô qui se déroule à une autre époque et dans une autre culture pourrait expliquer cette abondance, mais il conviendrait d'approfondir l'étude sur ce cas particulier), moins d'adjectifs que Proust et moins de verbes que Zola, mais on aurait pu s'attendre, au vu des commentaires des spécialistes, à une taille bien plus réduite de son vocabulaire. D'un point de vue uniquement quantitatif, les vocabulaires, ou plutôt les densités de vocabulaire, de Maupassant et Zola sont comparables.
Pour terminer cette étude, nous nous pencherons sur un des aspects qui déclencha une polémique entre Maupassant et Goncourt, à la parution en 1888 de Pierre et Jean : l'emploi de mots rares.
Le point de départ du dernier paragraphe de cette étude a été la phrase de Julien Gracq, relevée par Armand Lanoux9, à propos du succès de Maupassant à l'étranger :
Sa vogue à l'étranger me paraît d'ailleurs en tout point justifiée, nul auteur n'étant plus propre à faire accéder de plain-pied à une sorte de basic-french littéraire, où manquent tous les éléments subtils. |
N'étant pas critique littéraire, nous ne nous pencherons pas sur le côté subtil ou non subtil de l'uvre de Maupassant, mais sur l'aspect « basique » de son vocabulaire, tel que le prétend Gracq. Les chiffres mentionnés plus haut peuvent déjà donner un élément de réponse et ont tendance à montrer que ce vocabulaire est loin d'être « basique ». Cependant, la taille du vocabulaire n'est pas la seule variable à prendre en compte, car il se peut que tous les mots appartiennent à des tranches de fréquence élevées, tandis qu'un écrivain peut s'évertuer à employer des mots dans des tranches plus basses. Qu'en est-il de Maupassant ?
Pour pouvoir répondre à cela, nous avons utilisé la liste de fréquences établie à partir du corpus du Trésor de la Langue Française10 (TLF) qui recouvre la plupart des textes de la littérature française du 19e et de la première moitié du 20e siècle (1 500 uvres). Comme nous disposions des 12 000 premiers mots de cette liste sous format électronique, nous l'avons appliquée aux listes obtenues à partir de nos quatre corpus. Les résultats suivants dénombrent le nombre de mots non présents dans notre portion de liste TLF, et donc les mots de plus basse fréquence que les 12 000 plus employés dans la littérature française11. La liste TLF n'a pas été appliquée aux adverbes, ceux-ci n'étant pas très significatifs.
Auteur | Nb de noms com. hors liste TLF | Total occurrences hors liste TLF | % de la totalité des noms com. | % des occurrences |
---|---|---|---|---|
Flaubert | 2 770 | 6 719 | 34 % | 7,08 % |
Maupassant | 1 350 | 3 494 | 23 % | 4,08 % |
Proust | 2 006 | 4 487 | 29 % | 5,4 % |
Zola | 1 622 | 6 303 | 28 % | 6,87 % |
Auteur | Nb de verbes hors liste TLF | Total occurrences hors liste TLF | % de la totalité des noms com. | % des occurrences |
---|---|---|---|---|
Flaubert | 826 | 1 992 | 33 % | 2,59 % |
Maupassant | 608 | 1 297 | 28 % | 1,55 % |
Proust | 773 | 1 545 | 32 % | 1,82 % |
Zola | 776 | 2 102 | 34 % | 2,42 % |
Auteur | Nb d'adjectifs hors liste TLF | Total occurrences hors liste TLF | % de la totalité des noms com. | % des occurrences |
---|---|---|---|---|
Flaubert | 636 | 1 013* | 24 % | 5,01 % |
Maupassant | 502 | 930* | 19 % | 2,91 % |
Proust | 819 | 1 291* | 26 % | 4,44 % |
Zola | 357 | 628* | 17 % | 2,4 % |
* Pour cette colonne, nous avons enlevé l'adjectif sûr, dont le nombre d'occurrences est nettement supérieur à celui des autres mots. Il est possible qu'il y ait eu un problème avec l'accent circonflexe lors de l'établissement de la liste TLF. |
Maupassant a donc utilisé 608 verbes « peu fréquents » (parmi les plus nombreux : dévêtir, surexciter, cribler, pivoter, vagabonder, etc.), l'ensemble de ces verbes ayant été employés 1 297 fois. Ces 608 verbes représentent 28 % des verbes utilisés dans les romans (voir première série de tableaux ci-dessus) et 1,55 % des occurrences de tous les verbes.
L'analyse des résultats montre que Maupassant utilise un vocabulaire plus simple, c'est-à-dire contenant moins de mots peu fréquents, au contraire de Flaubert qui obtient la plupart du temps les plus hauts pourcentages. Ici, les études statistiques rejoignent ce qu'indique l'intuition, c'est-à-dire une simplicité (qui, du reste, a été voulue par Maupassant), mais dans une certaine mesure toutefois. Car, malgré tout, la portion de vocabulaire peu fréquent, bien que plus réduite sans aucun doute par rapport aux trois autres écrivains, reste non négligeable et représente, suivant les catégories grammaticales, de 19 à 28 % du total des mots employés. On est donc loin d'un « basic-french » littéraire comme le prétendait Gracq. On trouve en effet dans l'uvre de Maupassant des mots n'appartenant pas à une langue de spécialité et qui nécessitent, de la part du lecteur moyen, une recherche dans un dictionnaire : suri, blet, gibbeux, rogaton, improbation, houppelande, racornir, réchampir, alentir, etc. Néanmoins, ces mots, rares, sont incontestablement moins nombreux chez Maupassant que chez les autres écrivains de l'étude, ce dont on peut s'apercevoir en parcourant les listes de fréquences.
Avant de conclure, une remarque sur les noms communs employés par Zola : de nos quatre écrivains, Zola est celui qui a employé le moins de noms communs différents. Pourtant, la quantité des occurrences des noms considérés comme peu fréquents est assez élevée, presque au même niveau que Flaubert. On en déduit une des caractéristiques des textes de Zola : un vocabulaire relativement réduit, spécialisé et spécifique au thème du roman, au contraire de Maupassant qui utilise des termes plus généraux.
+M -F | -M +F | +M -P | -M +P | +M -Z | -M +Z | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
baronne | 88 | carthaginois | 128 | secousse | 52 | amabilité | 57 | nuance | 45 | boche | 180 |
casino | 40 | suffète | 122 | député | 38 | sonate | 45 | casino | 40 | coron | 160 |
jetée | 28 | citoyen | 71 | commissaire | 27 | aubépine | 24 | confrère | 37 | zingueur | 96 |
bock | 23 | prunelle | 63 | colosse | 25 | historien | 23 | landau | 37 | mécanicien | 89 |
venue | 16 | apothicaire | 61 | entraînement | 24 | bâtonnier | 21 | aspect | 34 | chapelier | 60 |
morne | 15 | airain | 51 | bock | 23 | golf | 21 | poète | 30 | chauffeur | 60 |
bijoutier | 13 | zaïmph | 46 | pistolet | 22 | écart | 20 | falaise | 26 | houille | 51 |
douche | 13 | bouclier | 42 | plaie | 22 | affectation | 18 | baigneur | 25 | charbonnier | 46 |
reporter | 13 | glaive | 38 | inspecteur | 21 | goûter | 18 | fiancé | 25 | hangar | 45 |
cadette | 12 | numide | 38 | obsession | 19 | interprétation | 18 | granit | 25 | herscheuse | 44 |
mondain | 12 | libyen | 37 | rédaction | 17 | individualité | 17 | bock | 23 | haveur | 41 |
vivacité | 12 | pique | 30 | senteur | 17 | interlocuteur | 17 | opéra | 23 | terri | 41 |
attrait | 11 | catapulte | 28 | butte | 16 | zone | 17 | rédacteur | 23 | vacarme | 41 |
contentement | 11 | poignard | 28 | mâle | 16 | catleya | 16 | écrivain | 22 | câble | 38 |
folle | 11 | javelot | 26 | paquebot | 16 | coterie | 16 | poésie | 22 | fauconnier | 38 |
kiosque | 11 | sandale | 26 | vagabond | 16 | grand-hôtel | 15 | romancier | 22 | sergent | 38 |
songerie | 11 | tunique | 26 | liane | 14 | lift | 15 | combinaison | 21 | lavoir | 37 |
télégramme | 11 | écart | 25 | magistrat | 14 | fresque | 14 | procédé | 20 | putois | 36 |
vicomtesse | 11 | galère | 25 | auvergnat | 13 | prunelle | 14 | artifice | 19 | accrochage | 34 |
bilboquet | 10 | phalange | 25 | divan | 13 | acclimatation | 13 | attachement | 18 | boisage | 34 |
+M -F | -M +F | +M -P | -M +P | +M -Z | -M +Z | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
rêvasser | 20 | objecter | 43 | suffoquer | 27 | dépourvoir | 23 | apprécier | 36 | rigoler | 44 |
dévêtir | 19 | délecter | 24 | ronger | 24 | correspondre | 20 | savourer | 28 | méfier | 29 |
emprisonner | 13 | dénigrer | 20 | harceler | 19 | approfondir | 19 | modifier | 27 | aplatir | 27 |
froisser | 13 | démolir | 17 | affaisser | 16 | superposer | 19 | gémir | 24 | buter | 27 |
accentuer | 12 | brandir | 16 | baptiser | 16 | assimiler | 16 | éprendre | 21 | égorger | 21 |
sonder | 11 | débarquer | 16 | bégayer | 15 | identifier | 15 | observer | 19 | combler | 19 |
imprégner | 10 | déplorer | 16 | étrangler | 13 | incarner | 15 | exposer | 15 | débarbouiller | 19 |
braver | 9 | étinceler | 16 | cramponner | 11 | abolir | 14 | dévoiler | 14 | brandir | 17 |
jaser | 8 | alléguer | 15 | flanquer | 11 | empreindre | 14 | assaillir | 13 | démolir | 17 |
retraverser | 8 | égorger | 15 | ramer | 11 | neutraliser | 14 | simuler | 13 | déblayer | 16 |
atterrer | 7 | tourbillonner | 15 | broyer | 10 | transmettre | 14 | ressaisir | 12 | soûler | 16 |
interpréter | 7 | camper | 14 | épandre | 10 | impliquer | 13 | survenir | 12 | débarquer | 15 |
rager | 7 | dilater | 14 | galoper | 10 | différencier | 12 | ramer | 11 | embaucher | 14 |
ruser | 7 | épancher | 14 | chausser | 9 | interposer | 12 | captiver | 10 | écorcher | 13 |
cicatriser | 6 | recourir | 14 | vagabonder | 9 | repenser | 12 | chérir | 10 | blêmir | 12 |
alimenter | 5 | rehausser | 14 | échauffer | 8 | adapter | 11 | contourner | 10 | cuver | 12 |
courbaturer | 5 | écarquiller | 13 | gésir | 8 | proférer | 11 | imprégner | 10 | enfiler | 11 |
désuvrer | 5 | solder | 13 | injurier | 8 | résider | 11 | pivoter | 10 | hébéter | 11 |
enrégimenter | 5 | assouvir | 12 | saigner | 8 | adhérer | 10 | réciter | 10 | adhérer | 10 |
impressionner | 5 | entrecroiser | 12 | secourir | 8 | approprier | 10 | discerner | 9 | débouler | 10 |
+M -F | -M +F | +M -P | -M +P | +M -Z | -M +Z | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|
constant | 33 | punique | 50 | inexprimable | 24 | individuel | 36 | bizarre | 75 | boche | 39 |
vibrant | 31 | carthaginois | 23 | haletant | 22 | momentané | 27 | banal | 34 | soûl | 24 |
séduisant | 28 | vertueux | 19 | effaré | 20 | antérieur | 26 | gracieux | 34 | dégoûtant | 20 |
surprenant | 25 | splendide | 18 | mignon | 18 | identique | 24 | poétique | 33 | chétif | 17 |
adroit | 23 | funeste | 16 | minéral | 18 | dénué | 23 | artiste | 28 | fumant | 14 |
voilé | 18 | exorbitant | 15 | paralytique | 18 | permanent | 22 | moderne | 26 | fumeux | 14 |
bienveillant | 17 | obscène | 14 | livide | 15 | inverse | 21 | principal | 25 | réglementaire | 14 |
électrique | 16 | quadrangulaire | 11 | meurtri | 13 | magique | 19 | surprenant | 25 | enflé | 13 |
niais | 16 | exprès | 10 | cocu | 12 | frivole | 17 | inexprimable | 24 | terrifié | 13 |
tenace | 16 | immoral | 9 | lugubre | 12 | voluptueux | 17 | dévoué | 21 | passif | 11 |
troublant | 16 | indistinct | 9 | perplexe | 12 | total | 16 | hautain | 21 | terreux | 11 |
apparent | 15 | pitoyable | 9 | rusé | 12 | vertueux | 15 | brillant | 20 | abattu | 10 |
frêle | 14 | antérieur | 8 | thermal | 12 | éphémère | 13 | divin | 20 | borain | 10 |
remuant | 14 | entre-clos | 8 | torturant | 12 | glorieux | 13 | ridicule | 20 | éreinté | 10 |
affolé | 13 | gaulois | 8 | veuf | 12 | snob | 12 | factice | 18 | barbouillé | 9 |
ignorant | 13 | pécuniaire | 8 | inapaisable | 11 | supplémentaire | 12 | minéral | 18 | chouette | 9 |
meurtri | 13 | dispendieux | 7 | inavouable | 11 | avancé | 11 | paralytique | 18 | peureux | 9 |
cocu | 12 | individuel | 7 | retroussé | 11 | mythologique | 11 | ingénieux | 17 | évanoui | 8 |
éveillé | 12 | lyrique | 7 | saisi | 11 | subjectif | 11 | vulgaire | 17 | ferré | 8 |
hésitant | 12 | bourbeux | 6 | entrouvert | 10 | contigu | 10 | ravissant | 15 | révolutionnaire | 8 |
1 Maupassant décrit Flaubert comme étant « obsédé par cette croyance absolue qu'il n'existe qu'une manière d'exprimer une chose, un mot pour la dire, un adjectif pour la qualifier et un verbe pour l'animer » et qu'il « se livrait à un labeur surhumain pour découvrir, à chaque phrase, ce mot, cette épithète et ce verbe » (Gustave Flaubert, préface aux lettres de Gustave Flaubert à George Sand, Charpentier 1884).
2 Maupassant, le Bel-Ami, Grasset, 1979, p. 428.
3 Guy de Maupassant et l'Art du Roman, Nizet, 1954, p. 570.
4 Le Vocabulaire de Maupassant et de Mérimée, Revue des langues romanes, 6e série, t. II janvier-février 1909, pp. 504 à 531.
5 Nous n'avons pas inclus les lettres de la correspondance qui sont des textes privés non destinés à l'origine à la publication.
6 Un dictionnaire de langue comme le Petit Robert recense environ 36 000 mots datés d'avant 1900. Maupassant utilise donc dans son uvre la moitié des mots connus de son époque.
7 Seul le début du roman a été retenu pour que l'on puisse établir des tailles comparables entre les différents corpus.
8 Parmi lesquels un certain nombre de verbes familiers ou argotiques : baisoter, bazarder, bousiller, dépiauter, etc.
9 Maupassant, le Bel-Ami, p. 425.
10 Paul Imbs : Trésor de la langue française, Paris, C.N.R.S., Gallimard, 1971-1994.
11 Soulignons au passage qu'un étranger non francophone est bien loin, en général, de connaître 12 000 mots de français : les études en apprentissage des langues montrent en effet qu'un apprenant de niveau avancé connaît de 5 000 à 8 000 mots.