Combien y a-t-il de mots dans la langue française ? Quelle est leur fréquence d’utilisation ? Combien de mots les français connaissent-ils en moyenne ?
Autant de questions pertinentes sur lesquelles l’Académie française et l’Éducation nationale se sont penchées.
Ne pourrait-on se poser des questions similaires à propos de la richesse et de la qualité d’un roman ?
Bien sûr la littérature a sa part de subjectivité que je n’ai pas l’intention de nier. Peut-on néanmoins quantifier la qualité ?
La question s’est posée il y a plus d’un siècle, dans un autre domaine peu enclin lui aussi à l’approche quantitative : la psychologie. Des travaux riches et utiles ont été menés. Pourtant, approche quantitative et psychologie semblent antinomiques. La psychologie avec toute sa part de subjectivité peut-elle faire l’objet de mesure ?
À vrai dire lorsqu’on observe un individu, on remarque qu’il est unique mais en même temps on voit des ressemblances avec d’autres personnes. C’est là qu’interviennent les statistiques. Sur un plan individuel, l’observation aboutit à la seule conclusion de l’unicité de l’individu. Mais avec les grands nombres, les choses changent et l’unicité peut cohabiter avec des caractères partagés et communs. La psychométrie est née. Elle permet de poser un regard objectif en comparant les personnes entre elles sans les déposséder de leurs particularités. Pour cela, elle a recours aux travaux d’un statisticien de génie qui n’avait pas pensé que ses recherches s’appliqueraient un jour à la psychologie : Gauss avec sa fameuse courbe.
Quel rapport avec la littérature ? direz-vous.
Fixons-nous un objectif avant de répondre. Si, en tant qu’éditeur, je pouvais rapidement et objectivement évaluer la qualité d’un écrit, ça me ferait gagner un temps précieux et serait source d’économies. Si en tant qu’auteur, je pouvais rapidement et objectivement évaluer la qualité de mes écrits, j’augmenterais mes chances d’être édité.
Forts de ces deux objectifs, nous allons étudier l’apport de l’approche quantitative de la littérature.
Tout d’abord il nous faut un référentiel de mesure (ce qu’on appelle en statistique un étalonnage). La fréquence d’apparition des mots dans la langue en est un qu’on pourra utiliser. A partir de là, on pourra savoir si un mot est plus fréquemment utilisé dans l’écrit analysé que dans la langue, si les mots pauvres, les redondances, etc. sont nombreux. Grace aux statistiques, il est possible de mesurer les occurrences et les lourdeurs. L’analyse statistique pourrait même dégager des tendances dans différents genres littéraires renforçant ainsi les lignes éditoriales.
Aujourd’hui les critères de sélection d’un roman, lorsque l’auteur est inconnu, sont le synopsis ou la première page. Ces deux critères sont pertinents mais insuffisants. Parfois seul le réseau (recommandations, notoriété de l’auteur…) tient lieu de critère.
C’était ce qui se pratiquait autrefois en sélection : un entretien au feeling ou une sélection sur recommandation. Avec un risque élevé de mauvais choix s’accompagnant d’un coût important.
Avec la concurrence internationale, internet, les plateformes de distribution (Amazon)… la rapidité et la fiabilité dans la prise de décision deviennent clé pour faire la différence.
Est-ce la fin des lecteurs et des services manuscrits des maison d’édition ? Pas du tout. C’est au contraire la montée en compétence de ces professionnels en les équipant d’outils performants qui s’ajoutent à leurs prestations, enrichissant leur analyse d’éléments factuels et objectifs.
Quantifier c’est apporter de la précision et favoriser la diversité.
Alors, à quand la littéramétrie ?
Antony Erb
Vous avez écrit un livre : un roman, un essai, des poèmes… Il traine dans un tiroir.
Publiez-le sans frais, partagez-le, faites le lire et profitez des avis et des commentaires de lecteurs objectifs…
Incrémentation de notre monBookTime...
@Yvar Bregeant Merci pour votre commentaire. La technologie fait ce qu'on lui demande de faire, à nous ensuite de définir un code de bonne utilisation. Or je vois qu'elle fait peur. C'est de nous-même que nous devrions avoir peur. S'il existe une occasion d'améliorer techniquement la qualité de la littérature, je ne vois pas de raison de s'en priver.
Plus les auteurs seront équipés de technologie permettant une meilleure production, plus ils pourront consacrer de temps aux critères évoqués par Catarina : apport original, souffle...
Or je lis dans certains commentaires, des refus catégoriques. Pour reprendre mon image de l'agriculteur en réponse à Catarina, c'est comme refuser le tracteur pour labourer son champ.
Les artisans du mot ne feront plus pousser de belles oeuvres de leurs seules mains. Ce que j'écris s'adresse également à moi ; j'ai écris mon roman seul et sans technologie en passant des heures à corriger et relire, un vrai travail du XXe siècle.
@catarina viti
Bonjour Catarina, je reprends l'échange.
En effet la définition de vos critères ne relève pas ou peu de la "littéramétrie". Vos critères correspondent au niveau ultime de la sélection d'une oeuvre, une fois qu'on a fait le travail de préselection. La littéramétrie épargne la besogne fastidieuse pour libérer du temps à l'analyse avancée qu'illustrent vos critères. Or c'est exactement ce que proposait mon article.
Evidemment d'autres paramètres entrent en considération dans la sélection comme les aspects économiques. Les écrivains sont des producteurs de contenu, des agriculteurs des mots. Pour l'essentiel, beaucoup de travail et un faible revenu. Vous avez peu de chance d'être référencé si vous n'offrez pas des perspectives de production importante. L'offre et la demande jouent à plein. Avec le Covid l'offre a explosé, rendant plus ardue la compétition. Le contenu importe moins, sa diffusion est le véritable enjeu. Mais c'est un autre débat.
Merci pour votre contribution
Oui Antony, la technique ou la technologie est malheureusement souvent un moyen rassurant pour nous donner l'impression que l'on maîtrise notre sujet, en l'occurrence ici, la littérature et, en filigrane, l'âme humaine avec tout ce qu'elle a de richesses à transmettre.
C'est le syndrome de l'apprenti sorcier.
Et plus ce monde glissera vers le pire, plus il se réfugiera vers la technique en pensant qu'elle va le sauver alors que le problème de fond est tout autre.
Non seulement les connaissances techniques s'avèrent souvent insuffisantes mais en plus, elles génèrent quasi systématiquement chez ceux qui n'ont qu'elles une forme de présomption et d'autisme vis à vis de l'essentiel : l'âme (en littérature, de l'auteur) qui ne saurait être disséquée.
Je ne parle bien sûr pas pour vous. J'ai bien compris que votre propos est mesuré et vos textes parlent d'eux-mêmes.
Vous parvenez à hiérarchiser et harmoniser correctement conscience et science.
Cela a dû d'ailleurs être un long cheminement personnel.
Et quant à moi, je ne prêche pas, vous l'avez compris, non plus, pour le retour à la bougie.
Mais pour un monde où les consciences seront éveillées et parfaitement éduquées pour utiliser chaque outil technologique à sa juste mesure en le laissant à sa juste place.
L'incapacité à prioriser l'essentiel et à maintenir la technologie à sa juste place est, de mon point de vue, un juste énième symptôme de notre civilisation malade de maux plus lourds et plus profonds sur lesquels chacun(e) y mettra ses mots mais que toutes et tous devineront.
Bien tristement, la littérature ne saurait être, à moyen long terme, non plus épargnée.
Vous avez donc une lourde responsabilité que de fournir un outil en expliquant comment l'utiliser et le borner.
Mais je vois que Catarina va vous y aider car elle ne vous laissera, la connaissant, sûrement pas faire n'importe quoi !
Vous avez intérêt à faire gaffe, je vous le dis !
Je la laisse faire car elle sera dans ce domaine plus pertinente que moi.
Bien à vous.
Yvar.
Antony,
merci pour votre réponse. Voici mon lexique :
originalité = point de vue. Tous les thèmes ont maintenant été traités, ce qui m'importe, c'est le point de vue privilégié par l'auteur. Qu'est-ce que le point du vue ? L'angle sous lequel l'auteur considère son sujet et la distance qu'il pose entre lui et son écriture. Le vocabulaire n'entre pas dans cette catégorie, il pourrait même nuire s'il prenait l'envie à l'auteur de tarabiscoter l'affaire.
*
Enrichissement intellectuel : je ne pensais pas aux mots rares et inconnus qui n'ont leur place que face à une pensée qui serait, elle aussi, rare et inconnue. Ce critère pourrait se résumer trivialement à "est-ce que je retire quelque chose de cette lecture qui me permet d'élargir ou de préciser ma "carte du monde"".
*
Stimulation émotionnelle : Je crois que l'émotion née d'un ensemble de facteurs liés à l'auteur, à sa sincérité, sa congruence, mais pas des mots eux-mêmes. Par exemple, Marius Youssouf, dans ses poèmes, emploie des mots simples pour dire des idées simples, mais le résultat atteint le coeur directement (à moins que le lecteur en soit dépourvu ou s'évertue à le croire).
"Que la grâce de ton amour m'inonde
Et m'aide à rendre plus beau ce monde".
Plus simple, tu meurs, non ?
*
Densité de l’écriture : on sent que l'auteur a pleinement habité son texte. L'histoire est palpable, elle "quitte le papier" pour prendre vie en nous, pour "nous envahir". Nous sommes alors dans ce que l'écriture peut avoir de vivant; une dynamique au-delà des mots. Je n'ai jamais trouvé d'autre terme que "souffle" pour traduire l'idée. Exactement comme en musique, en peinture, dans tous les autres arts.
Merci pour ce dialogue à ciel ouvert !
Bonjour Catarina. Merci pour votre contribution. Passons en revue vos 5 critères.
— Style & qualité d’écriture : ici, la « littéramétrie » est d’un grand apport.
— Originalité : tout dépend du sens que nous mettons derrière, mais si elle inclut un choix de mots peu fréquents, une association de mots peu courante, elle peut contribuer à la mesure de l’originalité.
— Enrichissement intellectuel : là encore, tout dépend du sens que nous donnons à votre critère, mais les mots rares et inconnus contribuent à l’enrichissement intellectuel.
— Stimulation émotionnelle : ici en effet la « littéramétrie » ne nous est pas d’un grand secours, à part dans le recours à un vocabulaire émotionnel.
— Densité de l’écriture : j’avoue ne pas nettement saisir ce que recouvre ce critère.
En revanche, « raide dinguefou de la chose écrite » est un critère personnel et subjectif que ne traite pas la « littéramétrie », mais une analyse littéramétrique pourrait, après avoir passé en revue vos critères, conclure : pour ce qui est du ressenti, il est propre à chacun, et certains lecteurs resteront insensibles à vos écrits, tandis que d’autres seront « raides dinguefous » :-)
Bonjour Yvar. Merci d’enrichir le débat.
Oui la question est « qui va l’utiliser [l’instrument], comment et avec quelle intention ? Comme dans de nombreux domaines, ça n’est pas la technologie qui est mauvaise mais la personne qui s’en sert. Et en effet je suis d’accord avec vous Yvar « [la technique] fait souvent perdre de vue au conducteur, la tête perdue dans sa montre et son tableau de bord, la beauté même de la route alentour comme de ses dangers. »
Voyez ce que pense Palmova dans L’œuvre de Dieu, la part des gènes « Une voiture était faite pour transporter d’un endroit à un autre, ce qu’il y avait sous le capot ne l’intéressait pas. De même qu’un bébé était fait pour transporter de joie, ce qu’il y avait dans sa couche ne l’intéressait pas plus. Chez les hommes comme chez les femmes, le détail technique l’emportait souvent sur la finalité. Partir à la découverte de nouveaux horizons avec ces mécaniques, oui, partir à la découverte de ces mécaniques sans changer d’horizon la laissait interdite. ».
Vous abordez la manière de faire des maisons d’édition. C’est un vrai sujet. De nombreux critères interviennent dans leur choix et leur production dont le talent de l’auteur, sa notoriété et son réseau, et ce qu’il a à dire. La notoriété et le réseau sont les plus importants d’un point de vue économique et l’emporteront toujours. Cela mériterait un article et je me dis que je vais me mettre à ma plume :-)
Bonjour,
Pour ce qui me concerne, voici mes critères de lecture
— Style & qualité d’écriture
— Originalité
— Enrichissement intellectuel
— Stimulation émotionnelle
— Densité de l’écriture
Il me semble que la « littéramétrie » n’éclairerait qu’une partie de mon premier critère.
Pouvez-vous me dire comment cette approche éclairerait tous mes critères, lesquels, à l’heure actuelle, sont ceux qui me permettent de prendre plaisir, palpiter, voire admirer, me perdre dans une œuvre littéraire ?
Pour reprendre une remarque précédente, j’utilise également les statistiques du correcteur Antidote au moment de l’évaluation critique de mes trucmuches, car nous avons tous des tics d’écriture (et surtout d’immenses lacunes), cela me permet d’avoir un regard plus froid sur mes phrases. Mais en matière d’évaluation d’un de mes textes, rien ne vaut, selon moi, le regard impartial d’un autre humain passionné, raide dinguefou de la chose écrite.
(ce texte contient 9 erreurs/problèmes de langue, 10 problèmes de style, au niveau sémantique : 5 occurrences faibles, 8 fortes, 7 négatives, 10 positives. Lexique 0 mot rare, 2 inconnus. Logique : 2 charnières, 1 entre guillemets, 2 négatives. Performances 1 errreur/184 mots, 2 erreurs /15 phrases (0,1 erreur par phrase). etc.)
Merci pour cet article qui nous fait gamberger...
Bonjour @ toutes et tous, Bonjour Antony,
Partons je crois du principe qu’il est ici question d’un outil statistique et technique visant à estimer la qualité de rédaction d’un texte dans sa forme et qu’il n’est donc pas question qu’il puisse donner un avis pertinent sur la qualité de son contenu.
Si l’on parle donc d’un outil, par nature nécessairement utile à quelque chose, comme la plupart des outils que l’homme s’est donné, la question n’est pas tant de savoir s’il est utile ou pas à l’amélioration de la rédaction mais plutôt qui va l’utiliser, comment et avec quelle intention.
Va-t-il être utilisé pas des maisons d’éditions en constant process de fusions-acquisitions pour formater opportunément des contenus de textes préparamétrés, vomis par une IA, afin de servir un discours unique alimentant les temps de cerveaux disponibles du monde des lecteurs pour mieux vendre et contrôler ?
Ou sera-t-elle utilisée par de nombreuses maisons d’édition à l’esprit pluriel comme un moyen didactique pour aider un auteur dont le contenu lui a plu mais dont la forme pèche afin de lui permettre de s’améliorer et de s’autocorriger ou plus simplement pour le corriger elles-mêmes ?
Ne perdons pas de vue non plus le risque de donner la primeur à la course à la technique. Elle fait souvent perdre de vue au conducteur, la tête perdue dans sa montre et son tableau de bord, la beauté même de la route alentour comme de ses dangers. Elle lui donne un sentiment de toute-puissance qui lui fait croire à tort être immunisé contre ces derniers.
Permettez-moi à ce titre une simple comparaison avec les modèles climatiques : c’est aujourd’hui, on le voit, la course permanente au sein du GIEC entre scientifiques pour l’actualisation de leurs modèles techniques, car ceux-ci sont chaque jour totalement dépassés. Comme ils sont par nature focalisés sur l’aspect technique, le risque est évident que les scientifiques soient alors tentés de se déresponsabiliser, et, plutôt que de sonner l’hallali, de se tromper de priorité en se dédiant corps et âme à parfaire leur modèle afin d’atteindre le modèle ultime, le modèle climatique « parfait » qui n’omettra plus aucun paramètre.
Sauf que, hm… lorsqu’ils l’auront atteint, il sera évidemment juste bien trop tard.
De plus, et à n’en pas douter, les rapports du GIEC n’ont pas beaucoup de fautes. Ils ont sans nul doute une qualité rédactionnelle de très haut niveau, à faire pâlir d’envie les gueux que nous sommes. Pour autant, cette suprême qualité d’écriture n’empêche pas les compagnies pétrolières et les puissants de, pardonnez-moi l’expression, "se torcher" allègrement avec..
Le grand risque est donc que le recours à la technique ne masque en fin de compte qu’une perte de vue de la beauté du monde, de perte de contenu, de cœur ou de conscience, tant de la part des auteurs, de leurs mandants éditeurs que de leurs lecteurs.
Donc, pour répondre à votre question : alors à quand la littéramétrie ?
Eh bien, hm, à vue de nez, snif, au regard des fusions-concentrations dans le monde de l’édition, et de l’évolution exponentielle en IA, sans guère de doute pour très bientôt.
Mais malheureusement je ne crois pas que cet outil qui pourrait être, sans doute, pourquoi pas, dans l’absolu, correctement utilisé comme outil de révision rédactionnel le sera alors par des esprits animés de la bonne motivation.. re-snif..
PS : Et quand je vous ai dit tout cela, sachez bien que j'ai pesé avec soin chacun de mes mots ;)
@Antony Erb merci pour votre réponse effectivement dans ces conditions je suis d accord avec vous
@Lenab merci de vous joindre à la discussion. Pour répondre à votre remarque, il me faudrait d'abord définir la qualité, ce qui serait trop long ici. Disons qu'un ensemble de choses contribue à la qualité dont l'absence de redondances, de mots pauvres... bref des choses aisément quantifiables. Dans ce sens, la "littéramétrie" que je propose participe de l'amélioration de la qualité. Mais elle participe seulement.
@Hugues Cayzac Merci pour votre commentaire. Bien sûr que seul l'humain peut apprécier l'humain. Mais cela n'interdit pas de mettre à la disposition de l'humain un outil d'analyse.
Mon univers professionnel est celui de la psychologie. Combien de psychologues ne m'ont-ils pas dit "ça n'est pas avec vos statistiques que vous ferez le tour de l'humain !". Je ne veux pas faire le tour de l'humain (si tant est que ce soit possible), je propose d'apporter un éclairage qui complète et va (parfois) plus loin que la simple perception.
Pour ce qui est de l'entre-soi du petit monde de l'édition, il me semble de c'est un autre sujet, très intéressant, que vous pourriez initier à travers un article, qu'en pensez-vous ?
Bonjour,
Cet article est intéressant , il invite à la réflexion , au questionnement , quantifier permet de gagner du temps à n en pas douter, est ce pour autant un gage de qualité , je n en suis pas convaincue .
@Franck Broage L'IA peut faire des choses merveilleuses techniquement mais l'IA n'est pas créative. De plus elle n'éprouve pas de sentiments. Elle est en revanche d'une grande aide dans l'évaluation des fondamentaux en grammaire, en syntaxe, en style...
Cela rejoint la "littéramétrie". Autant déléguer cette partie fastidieuse à la machine (ou s'en équiper pour développer ses compétences) et se consacrer à ce "je ne sais quoi qui fait la différence".
Mais l'approche quantitative constitue un premier passage obligé, étape que peuvent mal appréhender les éditeurs (par manque de temps et de ressources). Une mauvaise syntaxe et un mauvais style agacent et ennuient le lecteur, aussi géniale soit l'histoire.
Merci Franck pour vos commentaires
Tout à fait d'accord avec ce que vous écrivez @Antony Erb. J'ai une dernière remarque : l'arrivée des IA, avec l'approche que vous proposez, pourra être biaisée et seuls les romans écrits artificiellement seront reconnus comme s'approchant de la perfection technique. Il y manquera encore (mais combien de temps ?) la poésie, le charme, le croustillant et la saveur que seul un être humain est (encore) capable de formuler. Mais je ne me trompe pas d'approche : votre idée est de donner un outil aux uns et aux autres pour faire une première évaluation rapide, qui devra être complétée par une étude traditionnelle.
Merci @Franck Broage pour votre commentaire. Bien sûr vous avez entièrement raison et l'objet n'est pas de tout quantifier... et ce serait vain. L'idée est de gagner en temps et en qualité dans une prise de décision.
L'approche quantitative permet également une analyse de groupe de mots, de phrases et de paragraphes. Toujours dans l'idée de gagner en précision et rapidité d'analyse sans aucune prétention d'évaluation du "charme et du croustillant" et de toutes ces choses impalpables qui font la beauté de la littérature.
Eh bien justement, votre exemple est parfaitement trouvé, Perec adopte une approche par définition quantitative en bannissant le e de son roman. Ca n'altère en rien son oeuvre, au contraire ça la singularise. L'analyse "littéramétrique" conclurait : voici un roman fort bien écrit sans jamais avoir recours à la lettre la plus utilisée de la langue française. Aucun roman à ce jour (en référence à l'étalonnage) ne possède cette caractéristique.
Ensuite on aime ou pas c'est un autre débat.
Un rêve (ou un cauchemar) de technocrate... Pas grand-chose à voir avec l'art.
Merci @Antony Erb pour votre article. Cependant, n'y manque-t-il pas un élément essentiel ? Si je ne trompe pas, vous considérez les mots comme des données brutes (chacun apportant une richesse qui lui est intrinsèque). Cependant, c'est la mise en musique de ces mots, les "programmes qui utilisent les data", les romans et les poèmes, qui mettent en valeur tous ces mots. Il est vrai qu'une histoire remplie de répétitions est lassante et n'utilise que partiellement les possibilités qu'apporte la langue, cependant la manière dont les mots sont utilisés par l'auteur est ce qui donne tout son charme, son croustillant et sa saveur au texte qui est lu. Qu'en pensez-vous ?
J'ai une deuxième question : comment quantifieriez-vous le roman de Georges Perec "La disparition", écrit volontairement sans faire apparaître une seule fois la lettre "e" ?
Merci encore pour votre article, très surprenant et qui présente une approche très intéressante à la qualification d'un ouvrage.
@audreyhey Merci pour votre commentaire. En effet vous avez raison, le problème est crucial pour les éditeurs car, pour les plus réputés, ils reçoivent des centaines de manuscrits par mois. Et le phénomène s'est amplifié depuis le Covid. Comment sélectionner de manière fiable et économique une production aussi importante ?
Je poursuis sur la lancée de Marie. Il existe bien des outils comme Antidote mais combien d’auteurs les utilisent ? Ici sur mBS combien y ont recours ? Je parierais pas plus de quelques pourcents. Le sondage est lancé.
Quant aux éditeurs, ils ne les utilisent pas (en tout cas pas pour la lecture des manuscrits), car cela nécessiterait d’avoir la version Word. On en reste donc aux méthodes d’autrefois dans la sélection : feeling ou recommandation.
Mais la « littéramétrie », avec les techniques statistiques, va plus loin*, elle considère chaque roman ou ouvrage comme un individu et liste avec fiabilité ses caractéristiques. Une bonne manière de singulariser les auteurs.
* en théorie puisqu’elle n’existe pas
Elements de reflexion super interessants. Est-ce que le besoin de quantifier se ferait sentir dès qu'on passe à grande echelle ? Merci pour ce sujet. Saugrenu ou precurseur? Moi j'aime bien la seconde proposition. L'avenir le dira...
Incrémentation de notre monBookTime...
@Marie Bataille Merci Marie pour ces conseils. Dommage que vos écrits ne soient pas sur mBS, j'anticipe une grande qualité de style.
@Antony Erb
Votre article (quelque peu saugrenu) me ramène à la mémoire un mien camarade de l'époque où j'étais cheftaine des majorettes de Baizenpoche-en-Artois. Il se prénommait Lucien, mais on l'appelait tous Bas-d'la-Caisse parce qu'il était cul-de-jatte (il faut dire qu'en cet heureux temps, on était tous aussi spirituels que des pinsons). Bref, Lucien n'était guère loquace, non pas qu'il n'eût jamais rien à dire, mais il était toujours d'une scrupulosité quasi maladive quant au choix de ses paroles. En plus d'être cul-de-jatte, Lucien possédait un autre talent, celui du bricolage. Je me souviens très bien que, dans ce domaine, il touchait au génie. Et c'est ainsi qu'il eut un jour l'idée de mettre au point, au fond de sa cave, une balance pour peser ses mots. Il fallait y penser, n'est-ce pas ? et quelque chose me dit que vous vous seriez très certainement entendus comme larrons en foire. Malheureusement, l'ayant depuis perdu de vue (vu sa taille, il s'égarait facilement dans la foule), je ne pourrai pas vous mettre en contact, et c'est dommage car j'imagine très bien qu'ensemble, vous auriez fait des étincelles.
Allez, bien le bonjour à votre dame, et au bégonia qui s'étiole tristement sur votre balcon. Haut les coeurs, camarade ! Les bégoniacées vaincront !
Peut-on quantifier la qualité d'une pensée ?
Voire d'une poésie ?
On peut oublier Descartes et tous les haïkus !