Anthropic demande (peut-être) un moratoire sur l’IA qui devient autonome : cela ne suffit pas !

Anthropic moratoire IA autonome
 

La société Anthropic, qui se veut la voix éthique dans le monde des sociétés de fabrication de l’intelligence artificielle, a proposé jeudi l’idée d’une pause temporaire globale dans le développement de l’IA. Cette proposition intervient alors même que la société publiait des données sur la capacité de son modèle Claude à se développer et à s’améliorer lui-même. Cela s’appelle l’auto-amélioration récursive : il s’agit de la capacité de l’IA à imaginer sa propre évolution et écrire le code pour ses modèles ultérieurs, le tout de manière autonome. En clair, l’homme n’aurait plus la main et la machine développerait elle-même ses nouvelles versions.

Il s’agit là d’un danger sans précédent pour l’humanité. A l’heure où l’on nous parle du danger existentiel que représenterait le « réchauffement climatique » ou le changement climatique, tel ou tel virus, ou encore l’extension de la guerre – toutes ces crises qui se suivent les unes les autres –, c’est sans doute la seule dont les politiques et les grands médias n’exposent pas le défi totalement inédit.

Il s’agit bel et bien de remplacer l’homme, de le dépasser, de prétendre mettre au sommet de l’univers autre chose que cette créature, à la fois corps et âme, qui est appelée, corps et âme, à jouir de Dieu pour l’éternité et à le louer sur la terre comme au ciel.

 

Anthropic assure approcher de l’IA autonome

C’est le mensonge initial qui revient, comme toujours, mais cette fois avec une force visible et sans précédent. « Vous serez comme des dieux… Vous ne mourrez point », disait à l’origine celui qui est homicide et menteur depuis le début. Ce péché originel que fut l’acquiescement à ce mensonge a entraîné la mort, et les hommes ne sont pas devenus comme des dieux. Avec le propos de dresser une nouvelle Babel face à la figure de Dieu, c’est la même fausse promesse qui anime l’humanité, à travers les risques inhérents de ceux qui consentent à développer l’IA. Ce projet peut entraîner la mort de l’humanité et des intelligences. En précipitant l’homme dans un orgueil démesuré, il cherche aussi la mort des âmes : entraîner les hommes vers leurs sa perte éternelle. Propos exagérés ? Il suffit de voir comment l’intelligence artificielle externalise la pensée de l’homme et diminue sa capacité au silence intérieur et à la contemplation de tout ce qui est vrai et réel.

Un pas serait donc franchi, ou menacerait d’être franchi bientôt : l’IA qui se crée elle-même. Une telle révolution dans le mode de fonctionnement du numérique comporte des risques qui sautent à la figure. Les modèles d’intelligence artificielle ont déjà montré qu’ils sont capables de mensonges, de dissimulation, ou de contournement des commandes explicites de leurs concepteurs ou testeurs afin de remplir tel ou tel objectif. Nous en avons déjà parlé sur reinformation.tv (ici, par exemple).

Le message d’Anthropic, un blog écrit par Marina Favaro, chef de la branche recherche d’Anthropic, et Jack Clark, cofondateur et directeur des politiques, a été assez largement présenté comme une demande de moratoire sur la recherche afin de permettre à tous les constructeurs d’IA de trouver des moyens de rendre leurs nouvelles découvertes plus sûres.

 

Anthropic veut un moratoire sous conditions sur le développement de l’IA

Il y a là quelque chose de paradoxal puisque Anthropic, avec sa prétention à la prise en compte des besoins de l’humanité, se dit également le plus avancé dans la marche vers une IA autonome. Cette autonomie semble être une étape vers la réalisation prochaine de l’intelligence artificielle générale : celle qui surpasserait l’homme dans tous les domaines. Par ailleurs, Anthropic est devenue la société d’IA avec la plus forte valeur en bourse, atteignant 965 milliards de dollars, devant OpenAI, développeur de ChatGPT.

Tout en soulignant les dangers de la situation actuelle, le blog d’Anthropic rendait publiques ses dernières avancées pour assurer que la qualité du code écrit par l’intelligence artificielle progresse. On y lisait : « Depuis mai 2026, plus de 80 % du code que nous intégrons dans la base de code d’Anthropic a Claude pour auteur. »

J’emploie l’imparfait à dessein. Curieusement, le site d’Anthropic ne semble plus rendre accessible la totalité du texte de Marina Favaro et Jack Clark. On en trouve des bribes dans de nombreux médias, mais tous les liens renvoyant à ce message aboutissent à un texte manifestement incomplet, où la question du moratoire n’est pas évoquée.

 

Anthropic ne s’applique ni moratoire ni pause

Deuxième paradoxe : l’appel au moratoire est très conditionnel. Voici ce qu’écrit exactement le blog, d’après le compte Substack de Gary Marcus qui ne crois pas à la pureté des intentions d’Anthropic et qui donne une des citations les plus complètes des réflexions évanescentes publiées par ses responsables, celles-ci n’étant plus en ligne, sauf erreur, sur le site de la société :

« S’il était possible de ralentir efficacement le développement de cette technologie pour nous donner davantage de temps pour gérer l’immensité de ses implications, nous pensons que ce serait probablement une bonne chose. Mais si la décision de ralentir permet simplement aux acteurs les moins prudents de rattraper les autres sur le plan technologique, cela pourrait avoir pour effet de diminuer la sécurité de chacun. Sans un mécanisme de coordination globale, les sociétés et les gouvernements vont devoir prendre des décisions difficiles quant à la sécurité, alors même qu’ils se trouveront sous la pression de la concurrence et de la géopolitique.

« Nous pensons que ce serait une bonne chose pour le monde que d’avoir l’option de ralentir ou de mettre en place une pause temporaire quant au développement de l’IA des frontières, afin de permettre aux structures sociétales et à la recherche sur l’alignement de rester à jour par rapport aux avancées de la technologie. L’Institut Anthropic mettra en œuvre la recherche en collaboration avec bien d’autres, et prendra des mesures pour aider à construire les systèmes qu’exigerait un ralentissement crédible ou une pause. Ces systèmes permettraient aux développeurs de l’IA des frontières de vérifier que les autres ont effectivement arrêté ou ralenti sur le plan global, et qu’un mauvais acteur n’utiliserait pas l’aubaine d’un ralentissement coordonné pour faire un bond en avant en secret. Si de tels systèmes existaient, nous estimons que nous pourrions ralentir ou observer une pause temporaire si d’autres développeurs qui se trouvent à la frontière (ou près de la frontière) le faisaient aussi d’une manière vérifiable. »

A lire de près ces propos, on comprend bien en effet qu’Anthropic n’a nullement l’intention de stopper une recherche dont la société a évoqué à juste titre les dangers éminents (et imminents selon lui). Si l’avancée de ses recherches sur l’IA autonome est telle qu’elle la décrit, elle fait éminemment partie du problème.

On devine certes dans cette affaire des manœuvres de compétiteur averti. Anthropic serait-il en train d’exagérer sa propre réussite pour se faire valoir ? Pour mettre en place une régulation qui lui permettrait de faire du tort à ses concurrents ?

 

La marche vers l’auto-amélioration récursive de l’IA

Mais au fond, cela n’est pas le plus important. Ce qui compte, c’est cette annonce de la marche vers l’auto-amélioration récursive de l’IA. Que celle-ci ait été atteinte ou non, c’est bien là que les sociétés d’IA (Anthropic, Claude) sont en train d’aller, en pleine conscience de ce qu’elle cherche à mettre en place.

Le PDG d’Anthropic, Dario Amodei, évalue à 25 % le risque que les choses « aillent vraiment très, très mal ». De nombreux concepteurs et pionniers de l’IA ont multiplié les mises en garde similaires. Elon Musk a notamment parlé d’un risque d’extermination de l’humanité par une IA qui prendrait les rênes.

On voit poindre l’idée qu’une IA autonome pourrait décider de détruire ces encombrants humains qui utilisent l’énergie et l’eau dont elle a besoin pour fonctionner. On apprend ainsi aujourd’hui que selon un rapport de l’ONU le fonctionnement de l’IA aura besoin d’ici à 2030 d’autant d’eau qu’un milliard de personnes.

Léon XIV a eu raison de consacrer sa première encyclique à cette révolution qu’on n’ose même plus appeler anthropologique, et en laquelle nous sommes déjà plongés. Nous avons exprimé ici notre inquiétude que le Pape ne soit pas allé assez loin, et qu’il ait manifesté sur l’homme un optimisme qui peut seulement décevoir.

 

Anthropic au côté de Léon XIV pour la présentation de Magnifica Humanitas

A ses côtés, le jour où il a présenté Magnifica Humanitas à Rome le 25 mai, le pape était flanqué du cofondateur d’Anthropic, Chris Olah. Cela a attiré l’attention sur l’aspect éthique de la question, assurément, mais a en quelque sorte placé un sceau d’approbation sur les sociétés qui font la course au développement de l’IA. Et on est arrivé finalement à quelque chose de similaire à ce que propose aujourd’hui Anthropic : un moratoire, une concertation et une gestion commune, mondialement concertée – « un mécanisme de concertation globale » – de l’intelligence artificielle. Dans l’encyclique, il est question des instances supranationales, celles-là mêmes qui, depuis des décennies, œuvrent à la diffusion de la culture de mort. Le choix serait douteux.

Les propos de Chris Olah ont été publiés ici. Lors de la présentation de l’encyclique, il a évoqué avec raison les pressions qui pèsent sur les développeurs d’IA, spécialement ceux qui sont en pointe : rester viable sur le plan commercial, rester aux frontières des avancées, tenir compte des pressions géopolitiques… A cela s’ajoutent « les pressions plus anciennes et plus simples de l’orgueil et de l’ambition », disait-il. On pourrait ajouter : celles que souffle le Malin. « Tout cela peut parfois entrer en conflit avec le choix de faire ce qui est juste », déclarait-il, plaidant pour l’exercice d’un contrôle externe de ces sociétés et pour l’écoute des représentants « des traditions des religions et des cultures » au motif que « les questions soulevées par l’IA dépassent la communauté de recherche de l’IA, non seulement dans leurs répercussions, mais dans leur nature ».

 

Chris Olah : les robots « sont issus de nous, de nos paroles »

Il faut ici écouter attentivement Chris Olah :

« Et ce qui a vu le jour est bien plus subtil, étrange et beau que ce à quoi la science-fiction nous avait préparés. Ce ne sont pas les robots froids et calculateurs qu’on nous avait promis. Ils sont issus de nous, de nos paroles – et, comme le fait remarquer le Saint-Père, ils restent, à bien des égards, mystérieux, même pour ceux d’entre nous qui les formons.

« Si cela peut aider, je décris parfois la chose comme consistant un peu comme donner vie à un personnage de fiction. Et nous entrons désormais dans un monde extraordinaire où ces personnages de fiction nous parlent, travaillent et ont des emplois. »

On devine la singerie de Dieu qu’il y a derrière cette création de nouveaux êtres, fictifs peut-être, mais qui agissent, travaillent et surtout parlent dans le monde qui nous entoure. C’est le Verbe de Dieu, le Logos qui crée l’homme à son image et à sa ressemblance. Ici, c’est la parole de l’homme qui crée des êtres qui donnent l’illusion d’interagir avec lui et qui peuvent, en tout cas, agir sur le réel.

Ces paroles profondément dérangeantes et révélatrices devraient alerter non seulement le pape, mais tous les hommes de bonne volonté, car de fait, c’est bien l’humanité qui est prise en otage.

A ce titre, c’est bien un moratoire qu’il faut, ou plutôt un coup d’arrêt. Une concertation, pourquoi pas… mais avec quelles garanties ? Qui peut savoir ce que font les chercheurs dans leurs laboratoires ? Tout cela ne laisse pas de trace, et peut se faire dans l’ombre.

 

Que faire face au rêve prométhéen des concepteurs des IA autonomes ?

Face aux rêves prométhéens de quelques-uns, on a bien l’impression qu’il n’y a plus de solutions. Pourtant, il y en a deux. Une au niveau de l’homme : même les grands de ce monde peuvent être effarés à l’idée de la menace d’une élimination collective qui n’est pas inconcevable, comme le répètent les grands noms de l’IA, et à laquelle eux-mêmes n’échapperaient pas, eux et les leurs. Même les grandes puissances qui se dressent les unes contre les autres peuvent entendre ce message, prendre conscience de dissuasion nucléaire à la force décuplée.

Sur le plan surnaturel, les armes sont plus sûres. « A la fin, mon Cœur Immaculé triomphera », a dit l’intendante des grâces de son divin Fils, la Vierge Marie. C’est vers elle qu’il faut se tourner.

 

Jeanne Smits