Comment j'ai transformé mon prochain livre en intelligence artificielle


Bonjour toi,

Oui, je sais, tu vas me dire : mais tu m’a déjà écrit la semaine dernière, c’est pas tous les quinze jours la lettre du dimanche ? Alors… oui. Mais bon les règles sont faites pour être bousculées non ? Et puis j’avais des questions à te poser et je n’avais pas envie d’attendre. Mais avant ça, je voulais te parler d’une expérience étonnante que j’ai vécu cette semaine…

❤️ Avant de commencer, si tu ne me connais pas, je me présente : je suis Benoît Raphaël, co-fondateur de Flint. Et un dimanche sur deux, je réfléchis avec toi sur la façon dont nous pouvons parvenir à penser par nous-mêmes dans le chaos de l'info. Dans cette édition spéciale nous parlerons : de la naissance d'une IA, étape après étape, d'un nouveau moteur de recherche utilisant l'IA, de comment écrire un business plan avec ChatGPT et d'un projet de formation Flint sur le sujet ! ❤️




Au lieu de faire des trucs sérieux d'entrepreneur, je me suis amusé à faire de mon livre ("Information: l'indigestion", à paraître en avril prochain) une intelligence artificielle. L'idée ? Créer une sorte de clone de moi-même, qui soit capable de répondre à toutes les questions que l'on pourrait lui poser sur le contenu de mon bouquin. Le résultat ? Ah ! Fascinant ! Comme tu vas le découvrir.

C'est Thomas Mahier, le monsieur "Intelligence artificielle" de Flint
qui a commencé à y réfléchir, suite à des échanges que nous avions eu sur WhatsApp en début de semaine à propos de ChatGPT (si tu ne sais pas ce que c'est, j'en parle plus bas). Il s'est dit "et si on branchait le moteur de cette intelligence artificielle sur un corpus de documents fermé pour voir ce que ça donne ?" Moi :  "Euh c'est à dire ?"  Thomas : "Eh bien un bouquin, comme le rapport du GIEC, ou alors ton livre par exemple. Ça permettrait aux gens de te poser des questions sur ce que tu as écrit, sauf que c'est un robot qui répondrait en temps réel..." Le projet était lancé. Voici comment nous avons fait.

Tout d'abord, Thomas voulait que je sois capable de comprendre le code (ce qui est un peu ma grosse faiblesse dans cette boîte...). Donc il a monté le programme sur une plateforme en ligne pour que je puisse suivre tout le processus avec lui, et jouer avec. Si tu ne connais pas, retiens bien l'astuce, cette plateforme s'appelle "colab.research.google.com". Elle te permet de tester des programmes codés en "Python" (le langage N°1 pour faire de l'intelligence artificielle). Super efficace pour apprendre l'IA. Il n'y a rien à installer sur ton ordinateur, tout se fait en ligne, et tu peux même coder en mode collaboratif...

Thomas m'a ensuite demandé de prendre le manuscrit de mon livre, et ses 400.000 signes, que j'ai transformé en fichier ".txt" (pour n'avoir que le texte). Il m'a demandé de l'envoyer sur la plateforme en utilisant un programme en python. Évidemment, j'ai mis deux heures avant de comprendre comment ça marchait... Je t'ai mis un extrait de mes échanges avec Thomas dans l'image ci-dessous... Comme tu peux le vérifier, je suis complètement dans mon élément.



Thomas a ensuite codé un programme pour le découper en petits morceaux (appelés "chunks") facilement assimilables par l'IA.
 
Troisième étape : brancher notre programme sur l'interface (c'est à dire l'API) d'Open AI.

OpenAI, c'est la société qui a créé l'intelligence artificielle derrière le fameux ChatGPT, lequel s'appuie en partie sur GPT-3.5 (qui est donc un peu sa maman). Nous avons décidé d'utiliser GPT-3.5. Pour cela nous avons eu besoin d'une clé d'entrée unique pour ouvrir la porte de l'API, que l'on peut récupérer en créant un compte sur leur site.

Nos petits morceaux de livre ont ensuite été indexés par l'IA d'OpenAI. Cette dernière  leur a associé des "vecteurs". Les vecteurs sont des suites de chiffres qui permettent de les situer dans un espace à plusieurs dimensions en fonction du sens des phrases. On a transformé le résultat en fichier ".csv", afin de ranger ces données enrichies dans un tableau. C'est cette base qui a ensuite servi de "contexte" à l'intelligence artificielle pour lui permettre de répondre aux questions.

Dans l'image ci-dessous tu peux voir des extraits de mon livre transformés en blocs (les fameux "chunks") auxquels le robot a associé des vecteurs (les séries de chiffres à droite).




Une fois le livre indexé et "vectorisé", il nous a fallu construire le chemin de réflexion du robot. On a fait simple pour commencer : il nous fallait définir un  "prompt" et son environnement. Le prompt, c'est l'instruction préliminaire que l'on donne à l'intelligence artificielle pour qu'elle puisse répondre aux questions correctement. Ce prompt n'est pas un programme, juste une phrase. Thomas a proposé cette phrase : 

"Réponds à la question le plus honnêtement possible en utilisant le contexte fourni, et si la réponse n'est pas contenue dans le texte ci-dessous, dis "Je ne sais pas".

J'ai proposé ce prompt-là, plus imprévisible ! 😁

"Réponds à la question le plus honnêtement possible comme si tu étais l'auteur, en utilisant le contexte fourni, et si la réponse n'est pas contenue dans le texte ci-dessous, dis "Je n'ai pas trouvé la réponse dans le livre du coup j'extrapole", et réponds quand même..."



Ensuite, le modèle de réflexion... Pour aller vite, nous lui avons demandé de repérer les 5-10 blocs de texte les plus proches de la question et de piocher dedans pour formuler sa réponse. On peut régler le nombre de blocs. Plus on monte le chiffre, plus l'IA consomme... On pourrait dire que plus le robot a de blocs à utiliser est important, plus il est performant, mais ce n'est pas forcément vrai. Parfois, moins de données permet d'avoir de meilleures réponses...

Après on a fait un truc plus rigolo. Avec GPT-3.5, tu peux régler ce qu'on appelle la "température" de la réponse. Ce curseur détermine la liberté que l'IA va prendre avec les données. Plus la température est haute, plus elle est capable d'inventer quand elle n'a pas assez d'informations. Elle sera aussi plus créative et moins répétitive. Comme les humains quoi...

On a appelé ce curseur le degré "bullshit". On donc créé deux "répondants" : Un "Benoit 1" pas bullshit, et un "Benoit 2" bullshit, pour voir la différence...

Une fois tout ça lancé dans la machine, il n'y avait plus qu'à tester quelques questions pour voir ce que ça aller donner ! Suspense !

Alors, cher "Benoit Robot", de quoi parle ton livre ?


Réponse de l'IA :

"Mon livre parle de la façon dont nous captons et interprétons l'information et comment cela peut avoir un impact sur notre santé, notre bonheur et le sens que nous donnons à chaque détail de la vie. Il aborde également le sujet de l'autorégulation des entreprises et de l'éducation de notre cerveau à poser des limites. Enfin, il propose des conseils pour remplacer le FOMO (Fear Of Missing Out) par la JOMO (Joy Of Missing Out)".

Bon, pas mal... mais pas super super clair. Mais peut-être est-ce mon livre qui n'est pas clair ?

Autre question : Comment lutter contre la désinformation ?

"Il est important de s'assurer que les informations proviennent d'une source fiable et vérifiable. Il est également important de vérifier l'onglet "à propos de" pour voir si la source est connue et si des journalistes professionnels ou des scientifiques (attachés à une université) font partie de l'équipe. Il est également important de consulter un médecin si le risque pour la santé est supérieur à l'intérêt que l'on a à creuser en profondeur cette information. Enfin, il est important de reconnaître que les médias peuvent parfois donner une ampleur à un phénomène qui n'en a pas statistiquement."

Pas mal du tout ! Il est allé piocher dans plusieurs bouts de mon livre et en a fait une synthèse... c'est un peu une liste à la Prévert, mais je suis impressionné.

Par contre pas de différence notable entre les versions bullshit et non bullshit... Je pense que c'est dû au fait que le corpus de données est faible et super cohérent, ce qui confirme les études sur le sujet. Plus les données sont larges, plus l'IA est susceptible de se tromper ou d'inventer...



Voilà ! Nous n'en sommes qu'au début de cette exploration. Ce que j'ai appris de ce premier exercice c'est que l'IA d'OpenAI n'est pas un cerveau, mais une capacité à identifier de façon très pertinente ce qui fait sens dans un texte. Cela parait limité mais, en fait, c'est aussi une question d'interface et de structuration préliminaire de son process de "pensée". Cette semaine, Thomas a découvert la page GitHub (la plateforme préférée des développeurs) d'un chercheur de Stanford qui raconte comment il s'est amusé à essayer de donner à GPT-3.5 une méthode pour lui permettre de faire des déductions. C'est à dire de répondre à des questions qui ne sont pas répondues directement dans un texte. En résumé, comme me l'a expliqué Thomas, "au lieu de lui demander une réponse à une question, on lui demande la question qu'il doit se poser pour y répondre..."

On va essayer de tester ça... Je ne garantis pas le résultat, mais je trouve ça tout à fait fascinant, notamment parce que ça nous dit aussi quelque chose sur l'intelligence. Ce n'est pas tant l'étendue du savoir qui compte ou la puissance de notre cerveau (comme celui d'un surdoué par exemple) mais la façon dont nous réfléchissons. 
🎓 APPRENDS AVEC MOI !

Une formation à ChatGPT, par Flint ?


J'y réfléchis depuis un petit moment... et quand je vois passer le nombre de guides et formations bullshit sur le sujet, je me dis que Flint pourrait t'apporter quelque chose de plus, et d'un peu sérieux. Sauf que c'est la première fois que je fais ça. Du coup je me suis tapé plein de formations en ligne pour comprendre comment elles étaient construites. Mais pour finaliser cette formation (qui pourrait être disponible dans les deux prochaines semaines, youhou...) j'ai besoin de ton avis pour la personnaliser !

J'ai donc deux petites questions à te poser. Tu peux y répondre en cliquant sur le lien ci-dessous, merci !

👉 Je réponds !
🤖 LES SECRETS DE CHATGPT
Vulgarisation courte : ChatGPT
fr.linkedin.com - 27 jan.
Vulgarisation courte : ChatGPT

Un article écrit par un lecteur de Flint pour comprendre ChatGPT de l'intérieur... Vincent Pinte Deregnaucourt raconte : "J'avais prévu une note plus longue mais la réalité est que ChatGPT est tellement dément, que montrer ne serait ce qu'en gros ce qu'il peut faire (y compris de comique) avec des exemples, c'est déjà un livre de 550 pages. Si si !" Très facile à lire et pédagogique.

🇬🇧 OpenAI a fait appel à des travailleurs kenyans payés moins de 2 dollars de l'heure pour rendre ChatGPT moins toxique
time.com - 18 jan.
🇬🇧 OpenAI a fait appel à des travailleurs kenyans payés moins de 2 dollars de l'heure pour rendre ChatGPT moins toxique

La réussite d'OpenAI n'est pas le fruit du seul génie de la Silicon Valley. Dans sa quête pour rendre ChatGPT moins toxique, OpenAI a fait appel à des travailleurs kenyans externalisés gagnant moins de 2 dollars de l'heure, selon une enquête du TIME. C'est aussi ça, l'intelligence artificielle...

voonze.com  -  27 jan.
🇬🇧 BONUS : ChatGPT n'est pas intelligent. Que lui manque-t-il pour qu'il le soit ?
Un état des lieux de la recherche en la matière, à conserver dans tes favoris.
🤖 TRAVAILLER AVEC L'IA
Peut-on vraiment écrire avec les grands modèles de langage comme ChatGPT et ses concurrents ? Alors il y a des plus et des moins... Deux exemples !
J'ai lancé un complément alimentaire avec ChatGPT
agilite-marketing.com - 27 jan.
J'ai lancé un complément alimentaire avec ChatGPT

Un exemple plutôt bluffant (enfin je trouve) d’un expert en marketing qui a essayé ChatGPT pour préparer le lancement d’un produit (fictif) . Conclusion de ce test ? "ChatGPT m’a réellement étonné par la qualité et le sens du détail de ses réponses. Je m’attendais à des réponses génériques et peu précises, mais j’ai été agréablement surpris de constater à quel point ChatGPT était capable de comprendre et de répondre à mes questions de manière précise et détaillée. En utilisant ChatGPT, j’ai pu obtenir des informations de qualité supérieure à ce que j’aurais pu trouver en effectuant des recherches traditionnelles. Il m’a aidé à économiser beaucoup de temps et d’effort dans mes projets".

🇬🇧 Un journaliste robot du site CNET semble avoir commis un plagiat important
futurism.com - 23 jan.
🇬🇧 Un journaliste robot du site CNET semble avoir commis un plagiat important

On parle beaucoup de ce que le journalisme peut faire avec ou face à l'intelligence artificielle. Bon, peut-être pas ce qu'a fait ce média en ligne américain.. "Les articles écrits par l'IA de CNET ne sont pas seulement truffés d'erreurs", raconte l'article, "is semblent également être largement plagiés."

La version de l'histoire, par CNET : 

Le site tech américain a publié un bilan de son expérience avec le robot-journalisme. C'est assez intéressant, et ça te permettra de te faire une idée sur la question : 

"En novembre, l'une de nos équipes éditoriales, CNET Money, a lancé un test utilisant un moteur d'IA conçu en interne - pas ChatGPT - pour aider les rédacteurs à créer un ensemble d'explications de base autour de sujets liés aux services financiers. Nous avons commencé modestement et avons publié 77 histoires courtes à l'aide de l'outil, soit environ 1 % du contenu total publié sur notre site au cours de la même période. Les rédacteurs ont d'abord généré les grandes lignes des histoires, puis ils ont développé, complété et modifié les ébauches de l'IA avant de les publier. Après qu'une des histoires assistées par l'IA ait été citée, à juste titre, pour des erreurs factuelles, l'équipe éditoriale de CNET Money a procédé à un audit complet."

Que leur a appris cet audit ? 

- Que des erreurs ont été constatées dans certains des articles produits. La rédaction a corrigé les erreurs mais a mis le projet en pause afin d'apporter des modifications à ses processus éditoriaux...
- La transparence : CNET a aussi travaillé sur l'étiquetage des signatures afin d'accroître la transparence (préciser que c'est bien un robot qui a écrit, ce qui est en effet la base...).
- CNET travaille également à la mise en place de moyens supplémentaires pour signaler le plagiat et les fausses informations potentielles dans ses articles.

Au final, CNET a été beaucoup décrié, mais le média a appris de ses erreurs et a pris un train d'avance sur les autres. Reste à savoir si c'est une route que les médias doivent prendre ou s'ils doivent au contraire s'en démarquer.
cnet.com  -  27 jan.
👉 CNET Is Testing an AI Engine. Here's What We've Learned, Mistakes and All
🧠 CHATGPT DANS TON CERVEAU ?
Une intelligence artificielle branchée sur le cerveau
futurism.com - 27 jan.
Une intelligence artificielle branchée sur le cerveau

Une info un peu folle sur la transcription de la pensée en texte... Une équipe de scientifiques de Stanford affirme avoir testé une nouvelle interface cerveau-ordinateur (ICC) capable de décoder la parole à une vitesse allant jusqu'à 62 mots par minute, améliorant ainsi de 3,4 fois le précédent record. Il s'agirait d'un pas de géant vers la conversion de la parole en temps réel au rythme de la conversation humaine naturelle.

🧰 TROUVAILLES
You.com : l'intelligence artificielle qui veut changer ton rapport à l'information
you.com - 27 jan.
You.com : l'intelligence artificielle qui veut changer ton rapport à l'information

You.com est un moteur de recherche d'un nouveau genre, sans liens sponsorisés, mettant l'intelligence artificielle et le contrôle de son information au coeur de son projet. Lancé en 2021 par des anciens de Salesforces (avec 20 millions d'euros d'investissement), il propose une interface façon ChatGPT mais aussi des applications à intégrer pour obtenir des réponses plus ciblées et pratiques. Tu peux aussi créer des images automatiquement. On devrait en entendre parler de plus en plus !

🤓 PARTAGEONS NOS LECTURES

Quand Jacques Attali présente Flint comme le prototype des médias du futur...



C'est une étudiante en journalisme, Evy, qui m'a envoyé la capture du livre. Je l'avais lu en 2021, mais pas jusqu'au bout, et je n'avais pas repéré la mention... Dans son ouvrage de référence, "Histoire des médias", l'auteur évoque l'avenir des médias et parle "d'avvisi numériques", des sortes de lettres confidentielles personnalisées. Selon lui, "Flint en constitue une première approche". On ne peut qu'être d'accord avec lui, non ?

Par ailleurs, si l'on omet sa fin apocalyptique un peu lourde, l'ouvrage est une mine d'informations sur le sujet.
fayard.fr  -  27 jan.
👉 "Histoires des médias", Jacques Attali
L'information libre, diffusée par des médias accessibles à tous et établie par des professionnels cherchant la vérité est le fruit d’une histoire récente, inattendue. Et elle est à présent terriblement menacée.
🗣 CONSTRUISONS CETTE LETTRE ENSEMBLE !
🤔 PARTAGEONS NOS REFLEXIONS

Les aventures de Geneviève chez ChatGPT...

Geneviève (qui est prof) continue de partager avec nous ses expériences avec ChatGPT et ses élèves, et c'est toujours aussi passionnant de la lire...

"Je réagis à ce que disent les articles sur l'inquiétude face à ChatGPT (aucun élève ne m'a encore parlé de ça d'ailleurs). Pour ma part, je m'amuse beaucoup à en cerner les usages et mésusages, mais je ne serais pas prête encore à payer pour cela, elle est trop imparfaite à mes yeux. 
Pour ce qui est de l'utilisation de ChatGPT pour les devoirs, je rejoins Seth Godin et généralement, je donne surtout des choses à lire et nous faisons la plupart des rédactions en classe, sur traitement de textes ceci dit... (...) . Cela depuis un certain temps, pour éviter les différences entre les élèves qui se font aider : relire chez eux par leurs parents et ceux qui n'ont pas cette possibilité (...) Les seuls travaux que les élèves font à la maison sont les travaux de lecture, mais pour ce que j'en ai  vu, ChatGPT les conduirait plutôt à des erreurs... 
Ce que j'ai trouvé amusant chez ChatGPT cette semaine, c'est quand on lui demande de réciter un poème (comme Demain dès l'aube de Victor Hugo) : il récite très bien la moitié du poème et ensuite, il invente ! C'est très drôle et j'avoue que je ne comprends pas très bien pourquoi, puisque le poème doit être en entier dans sa base de données je pense."

Connais-tu l'ignorance critique ?

Natacha m'a envoyé une édition d'une newsletter à laquelle elle est abonnée ("La lettre de Umanz") qui propose une approche interessante pour éviter la surcharge informationnelle... Voici un extrait : 

 "Va-t-on un jour enseigner l’ignorance critique à l’école ?  C’est pourtant ce que conseillent plusieurs chercheurs face à la surabondance d’information digitale. 
(...) 
Parmi les techniques d’Ignorance Critique : le “Self Nudging” qui consiste à bannir définitivement certaines sources ou applications de son environnement digital immédiat ou de limiter son temps de social media (dans une étude de 2020 les personnes encouragées à désinstaller Facebook pendant un mois avaient regagné en moyenne 1 heure de temps libre par jour)  la lecture latérale (lateral reading) qui consiste à aller vérifier la crédibilité d’une source consultée online ou encore d’appliquer l’habitude de ne pas “nourrir les trolls” en les ignorant purement et simplement."
🤗 Pour participer, tu peux réagir directement à cette lettre, ou m'écrire à benoit @ flint.media. Je réponds à tout le monde !
😗 TRAVAILLONS ENSEMBLE !

Tu as un projet ?

Si tu as un projet média, ou d'intelligence artificielle lié à l'information, tu peux faire appel à moi, ou à Thomas... ou les deux, pour t'accompagner ou te guider. C'est une manière utile de soutenir notre mission tout en profitant de notre expérience.

Tu peux directement réserver une séance (payante) d'une heure ou de 30mn pour challenger ton projet. Mais si tu veux juste me présenter rapidement ton idée, tu peux aussi réserver un call (gratuit) de 15mn. 👉 Il faut aller ici
🤗 PARTAGE OU ABONNE-TOI !
🥳 Vous avez été 9223 à avoir lu la dernière lettre, soit un peu moins que la fois précédente. Sur un total de 19965 abonnés francophones (bientôt 20.000 !) ! Merci !

💌 Si tu veux partager cette lettre, tu peux renvoyer vers ce lien.

📩 Si on t'a transféré cette lettre, tu peux aller t'abonner ici !

📭 Si tu veux lire les précédentes lettres, c'est par là !

🤗 Et tu peux aussi me rejoindre sur Instagram ou sur Linkedin !

☃️
Je te souhaite un beau dimanche d'hiver !

💛 Benoît
Flint

Cette lettre a été réalisée par Flint Business. Flint utilise l'intelligence artificielle pour te permettre de créer des newsletters intelligentes en moins de 5 minutes afin de partager les meilleurs contenus d'information trouvés sur Internet, et d'y apporter (si tu veux) ton expertise. Tu peux tester ce nouveau service pendant 30 jours en cliquant sur le logo Flint ci-dessus ! ☝️