Flint

Flint Production

L’intelligence artificielle peut-elle créer une poésie d’un genre nouveau ?

L’intelligence artificielle peut-elle créer une poésie d’un genre nouveau ?

Thierry Poibeau est directeur de recherche au CNRS et directeur adjoint du laboratoire LATTICE (Langues, Textes, Traitements informatiques et Cognition). Dans cet article, il se penche sur les programmes de gĂ©nĂ©rations de poĂ©sie en ligne, qui se dĂ©veloppent grâce Ă  l’intelligence artificielle et les consignes de l’humain. Comment fonctionnent-ils rĂ©ellement ? Ont-ils vraiment un intĂ©rĂŞt autre que qu’ĂŞtre ludique ? Et d’ailleurs, comment peut-on s’amuser en « crĂ©ant » des poĂ©sies de A Ă  Z ?

Il existe des centaines de programmes de gĂ©nĂ©ration de poĂ©sie sur Internet – c’est-Ă -dire des systèmes capables de produire de la poĂ©sie automatiquement –, mais Ă  quoi peuvent-ils servir ? Ces programmes ont-ils un intĂ©rĂŞt, au-delĂ  de celui de satisfaire leur concepteur ?

On a beaucoup entendu parler de GPT2 ou GPT3, ces Ă©normes programmes informatiques capables de produire des textes très rĂ©alistes, et mĂŞme de la poĂ©sie. GPT2 et GPT3 sont en fait des « modèles Â», des espèces de bases de connaissances, alimentĂ©s par des milliards de phrases et de textes glanĂ©s sur Internet, et « digĂ©rĂ©s Â» afin de pouvoir produire des textes nouveaux, inspirĂ©s des textes anciens, mais en mĂŞme temps très diffĂ©rents.

Ajouter des contraintes

Pour produire de la poĂ©sie, il « suffit Â» d’y ajouter des contraintes : surveiller les rimes et la longueur des vers, respecter la structure globale, l’absence de rĂ©pĂ©tition en position rimĂ©e, etc. Les systèmes de gĂ©nĂ©ration automatique connaissent un certain succès (on en trouve un nombre phĂ©nomĂ©nal sur Internet) car la tâche est amusante, ludique, mais aussi complexe si on veut produire des textes avec du sens (et encore plus si on veut contrĂ´ler ce qui est dit).

On a donc ici un cadre idĂ©al pour expĂ©rimenter (souvent hors contrainte de financement) : la gĂ©nĂ©ration de poĂ©sie est souvent un loisir et un passe-temps, chez le chercheur comme chez l’amateur Ă©clairĂ©.

Une question se pose toutefois. Ces systèmes sont-ils dignes d’attention ?

Sur le plan littĂ©raire, la plupart des systèmes sont encore, il faut bien l’avouer, assez rudimentaires et ont du mal Ă  rivaliser avec du Baudelaire ou du Rimbaud. Les plus avancĂ©s sont toutefois bluffants, et c’est avant tout la base d’entraĂ®nement qui joue un rĂ´le crucial (c’est-Ă -dire l’ensemble des textes qui ont permis au système d’apprendre. On peut en effet fournir Ă  un système un jeu de donnĂ©es rĂ©duit, mais spĂ©cialisĂ© (des Ĺ“uvres de poètes du XIXe siècle par exemple) pour « spĂ©cialiser Â» un système, l’adapter Ă  moindre coĂ»t. On peut alors obtenir des systèmes qui rĂ©digent des paragraphes Ă  la manière de Balzac, ou de la poĂ©sie Ă  la manière de Baudelaire.

Il faut toutefois noter que les résultats apparaissant dans la presse (qu’il s’agisse de génération de prose ou de poésie) sont souvent le fruit de multiples essais, voire le fruit d’un travail de postédition de la part du journaliste.

Le projet Oupoco

Le projet Oupoco (Ouvroir de poésie combinatoire) que nous avons développé avec une équipe du laboratoire LATTICE, avait un but plus modeste. À l’image de l’expérience de Queneau dans Cent mille milliards de poèmes, notre ambition première était de produire des milliards de poèmes simplement en recombinant des vers issus d’un corpus poétique français représentatif.

Cent mille milliards de poèmes, Raymond Queneau, 1961. Musée Médard

Ă€ cette fin, nous avons assemblĂ© une base de plus de 4000 sonnets d’auteurs allant du dĂ©but du 19e jusqu’au dĂ©but du XXe siècle. Alors que tous les vers de Queneau riment ensemble, il nous a fallu dĂ©terminer automatiquement la rime de chaque vers afin de pouvoir produire de la poĂ©sie avec rimes. Le projet Ă©tait donc dès l’origine davantage un projet d’analyse qu’un projet de gĂ©nĂ©ration (comme en tĂ©moigne cette vidĂ©o. https://www.youtube.com/embed/_FTfZ3G_zdw?wmode=transparent&start=0

Ce projet peut paraĂ®tre dommageable, en ce qu’il ferait passer la poĂ©sie pour du « n’importe quoi Â». Mais le but est Ă©videmment bien diffĂ©rent. Des expĂ©riences concrètes et la rencontre avec le public nous ont montrĂ© que cette crainte est en grande partie injustifiĂ©e. Le public (jeunes et vieux, femmes et hommes) est amusĂ©, intriguĂ©, veut en savoir plus. Un public d’ordinaire peu attirĂ© par la poĂ©sie s’intĂ©resse Ă  ce qui est produit. Le public n’est pas naĂŻf, mĂŞme quand il s’agit d’enfants : il voit bien le caractère fabriquĂ©, Ă©trange et ludique de l’affaire. Il sait que derrière ce qui est produit se cachent d’autres textes et l’incongruitĂ© d’un vers hors norme pousse souvent Ă  aller voir le contexte original, c’est-Ă -dire le poème d’origine.

Un exemple de poĂ©sie (Oupoco) – en rouge, les passages prĂ©sentant un problème de cohĂ©rence. Oupoco, Fourni par l’auteur

Le générateur de poésie, avec les dispositifs de diffusion qui vont avec (comme la Boîte à poésie, une œuvre d’art conçue par l’Atelier Raffard-Roussel et permettant d’obtenir un objet portatif intégrant le générateur de poésie d’Oupoco), permettent à un public large de renouer avec la poésie, alors que c’est une forme souvent délaissée même par les lecteurs régulier.

Quant aux expĂ©riences en gĂ©nĂ©ration pure (oĂą la poĂ©sie produite n’est pas composĂ©e Ă  partir de vers prĂ©existants, mais est rĂ©ellement conçue par ordinateur), elles amènent Ă  rĂ©flĂ©chir Ă  d’autres aspects. Sur le texte lui-mĂŞme : quelle est la richesse du texte produit ? Qu’est-ce qui fait la valeur d’un texte poĂ©tique ? Si on est dans le cadre d’une gĂ©nĂ©ration « Ă  la manière de Â» (de façon similaire Ă  la production de musique « Ă  la manière de Â»), on peut s’interroger sur la valeur du rĂ©sultat, sur les caractĂ©ristiques d’un auteur, sur ce qui fait le style d’un auteur, finalement.

Différents niveaux de créativité

Ces questions amènent enfin Ă  s’interroger sur la notion de crĂ©ativitĂ© elle-mĂŞme. Margaret Boden, une informaticienne anglaise ayant dĂ©veloppĂ© une thĂ©orie sur la question, distingue trois niveaux de crĂ©ativitĂ©, chez les humains comme chez les ordinateurs : la « crĂ©ativitĂ© exploratrice Â», qui consiste juste Ă  Ă©tendre un peu ce qui existe dĂ©jĂ  (Ă©crire un poème Ă  la façon de Hugo) ; la « crĂ©ativitĂ© combinatoire Â», qui consiste Ă  combiner de façon originale des Ă©lĂ©ments existants autour de nous, mais de nature Ă©loignĂ©e (les travaux de l’Oulipo, mĂŞlant littĂ©rature et contraintes mathĂ©matiques sont probablement de cet ordre). La troisième forme de crĂ©ativitĂ©, qualifiĂ©e de « transformationnelle Â», est d’une autre nature, elle change radicalement la façon de voir la rĂ©alitĂ© et produit gĂ©nĂ©ralement toute une nouvelle lignĂ©e d’œuvres. Margaret Boden parle de l’invention du cubisme par Picasso ; on peut penser Ă  l’abandon des codes du roman dans les annĂ©es 1950, autour du nouveau roman, mais la notion de rupture en littĂ©rature serait un concept Ă  discuter en lui-mĂŞme.

Le système Oupoco, recombinant juste des vers existants, est indĂ©niablement de nature exploratrice, mĂŞme si cette exploration est fondĂ©e sur la combinatoire. Le Graal de la crĂ©ativitĂ© par ordinateur serait d’atteindre la crĂ©ativitĂ© transformationnelle, au sens que Boden accorde Ă  ce mot. Un ordinateur serait-il capable d’atteindre ce niveau ? On peut en douter, car ce niveau implique une certaine conscience de soi, une prise de recul par rapport au rĂ©el, pour imaginer des mĂ©canismes complètement nouveaux. L’apprentissage artificiel, Ă  la source de la plupart des dĂ©veloppements rĂ©cents et mĂ©diatiques en matière d’IA (intelligence artificielle), est très bon pour gĂ©nĂ©raliser et recombiner les milliards de donnĂ©es reçues en entrĂ©e, mais est incapable de « faire un pas de cĂ´tĂ© Â», pour rĂ©ellement transformer le rĂ©el.

Notons enfin que les humains apprennent aussi Ă  partir de stimulis et par imitation. La nature et la rĂ©alitĂ© de la crĂ©ativitĂ© transformationnelle n’est pas complètement prouvĂ©e. Peut-ĂŞtre qu’à partir des milliards de perceptions reçues au cours de sa vie l’homme est capable de recombiner de manière suffisamment libre pour donner l’impression d’une crĂ©ativitĂ© transformationnelle. On est alors au cĹ“ur de la cognition !


Ont participé à Oupoco les personnes suivantes : Claude Grunspan, Mylène Maignant, Clément Plancq, Frédérique Mélanie Becquet, Marco Naguib, Yann Raphalen, Mathilde Saurat, ainsi que l’Atelier Raffard-Roussel.

DĂ©claration d’intĂ©rĂŞt

Thierry Poibeau est membre de l’institut 3IA PRAIRIE (PaRis Artificial Intelligence Research InstitutE). Le projet Oupoco a aussi Ă©tĂ© soutenu par l’EUR Translitterae.

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.