Une de mes plus grandes convictions est que l’intelligence artificielle va révolutionner de manière profonde et majeure les paradigmes et systèmes éducatifs. C’est en lisant un des articles les plus fascinants sur ce sujet “Why we stopped making Einsteins” que j’ai compris le potentiel infini de l’IA pour faire de nos enfants des génies comme l’Histoire en a connu depuis Aristote jusqu’à la digitalisation du monde et la lobotomisation globale des esprits.

On peut bien entendu discuter des apports de la technologie dans l’enrichissement général de nos économies, mais cette transformation est arrivée avec un coût sociétal énorme pour nos cerveaux de primates : sur-stimulés, incapables de se concentrer, de réfléchir plus de quelques minutes, habités par la peur de rater quelque chose d’important dans le monde digital (le fameux FOMO), attaqués de partout par des distractions algorithmiques qui cherchent à nous soutirer la moindre seconde de notre attention, nous régressons inéluctablement.

Lorsque les adultes n’y arrivent pas, comment pourrait-on s’attendre à ce que les enfants dont le développement cognitif est encore en cours, y arrivent ? Pour répondre à cette problématique, l’IA offre des perspectives intéressantes et enthousiasmantes qui peuvent rediriger la puissance algorithmique dans le bon sens : le développement cognitif des plus jeunes, mais aussi la stimulation intellectuelle, le maintien de la curiosité, l’intérêt pour les matières les moins séduisantes comme l’art, l’histoire, la philosophie etc..

Si les Large Language Models (LLM) ont été une révolution dans le domaine de la production de contenu, l’arrivée du text-to-speech naturel, fluide et interactif ouvre la voie à une autre révolution : des instructeurs personnels disponibles, abordables et pertinents pour chaque enfant, chaque adulte curieux d’apprendre.

La révolution des assistants audio

L’un des aha moments qui m’ont stupéfié a été la première démonstration de OpenAI de leur Audio Advanced Mode en septembre 2023

OpenAI Audio Advanced Mode

La fluidité et le naturel de la voix et la très faible latence furent déconcertants. Nous avions enfin à notre portée un outil capable d’être programmé pour parler/discuter/crier/pleurer/échanger/rire/s’offusquer/s’émerveiller rendant la modalité voix aussi simple et agréable d’utilisation que de discuter avec un chatbot. Si la lecture est un canal avec une bande passante d’information faible estimée autour de 12 bytes par seconde, la voix permet de tripler cette valeur pour atteindre environ 39 bytes par seconde selon les langages parlés. C’est tout simplement un moyen plus efficace et moins contraignant pour échanger de l’information, et qui surtout libère les yeux de l’utilisateur ce qui est fondamental en situation de mobilité pour permettre aux images de venir compléter naturellement la conversation (c’est la raison pour laquelle les sous-titres sont désagréables et handicapants).

OpenAI Audio Advanced Mode

Aujourd’hui, l’accès à l’advanced audio mode d’OpenAI a été ouvert de manière programmatique (il y a quelques semaines) à tous mais à un prix équivalent à celui d’un opérateur de call-center (à peu près 1000 MAD par million de tokens, soit un équivalent 100 à 150 MAD par heure de conversation peu ou prou). C’est juste assez pour commencer à bousculer l’hégémonie humaine dans l’interaction avec le client/usager mais pas assez diversifier les use cases, notamment éducatifs dans des pays comme le nôtre.

En parallèle, Google travaille depuis 2023 sur son concept de NotebookLM, un assistant de recherche capable d’ingérer de très grandes quantités de données et de répondre de manière synthétique et concise à des questions complexes, cela grâce à la particularité des modèles LLM de Google qui ont une taille de contexte 3 à 4 fois supérieure à ceux de la concurrence. Mais la révolution est audio, et depuis quelques mois, NotebookLM permet de faire un résumé aussi des documents sous la forme d’un podcast incroyablement naturel entre deux professionnels. Le service est gratuit et la qualité du podcast est époustouflante si on aime les émissions à l’américaine avec un ton décalé, humoristique et très dynamique.

Google NotebookLM

Pour écouter un exemple, voici celui que j’ai généré sur l’article Why we stopped making Einsteins.

Et aujourd’hui, l’Open Source rattrape doucement l’état de l’art des assistants vocaux avec par exemple une initiative impressionnante capable de cloner des voix et de générer des émotions : F5-TTS (ne fonctionne que sur l’anglais et le chinois pour le moment). Bref, ça bouge et l’audio aura bientôt son chatGPT moment.

Du coup, pourquoi avons-nous arrêté de faire des Einsteins ?

Une des raisons citées dans l’article est la disparition des tuteurs privés de haute qualité qui pouvaient doser chirurgicalement le savoir, ajuster parfaitement le rythme d’apprentissage et offrir une attention personnalisée à chaque enfant. Aujourd’hui, nous y sommes presque car l’état de l’art de l’IA a résolu l’interface voice (après avoir résolu l’interface text avec les chatGPTs like). Peut-être ne manque-t-il plus qu’un visage humain pour anthropomorphiser la machine et passer le cap du robot instructeur.

La Chine a massivement investi dans les AI personal tutors car elle a compris l’importance éducative, sociétale et civilisationnelle de leap-froger sa population en termes d’intelligence, selon cet article du World Economic Forum sur les AI Tutors qui déplore le manque de professeurs compétents principalement en Afrique subsaharienne et en Asie du sud-est.

Global Teacher Shortage

Pour ma part, je profiterai pour l’instant de cette révolution et de la maturation de la solution de Google NotebookLM (uniquement en anglais mais les autres langues suivront probablement) pour me faire mon propre instructeur sur des sujets d’intérêts divers et variés (blockchain, IA, géopolitique, société etc..). Et dans le pipe, il y a probablement un instructeur personnel pour mes enfants :) so stay tuned.

Je suis particulièrement la start-up Synthesis qui propose un instructeur personnel pour les enfants à un coût très abordable.

Synthesis

Vous trouverez dans le lien spotify suivant les sujets au format podcast (avec NotebookLM mais j’explorerai d’autres technologies):

Red Frog Podcast

Lien SPOTIFY - Red Frog Podcast

Le podcast s’appelle Red Frog Podcast et est une AI-émission de vulgarisation scientifique qui parle de sujets d’actualité et de science avec un ton accessible et décalé. Il n’est pas monétisé et sera alimenté des sujets intéressants (et de liens soigneusement choisis) que je n’ai pas le temps d’ingérer en mode lecture.

Au menu au moment de l’écriture de cet article :

L’article s’arrête ici et continue dans l’épisode “Why we stopped making Einsteins” du podcast. Bonne écoute !