dim. Juin 14th, 2026

Nous annonçons la publication de la troisième version de notre Politique de Mise à Échelle Responsable (PMER), un cadre volontaire mis en place pour atténuer les risques catastrophiques liés aux systèmes d’IA.

Depuis plus de deux ans, Anthropic s’appuie sur la PMER et a beaucoup appris sur ses avantages et ses limites. Nous actualisons donc cette politique pour renforcer ce qui a bien fonctionné, améliorer les points nécessitant des ajustements et introduire de nouvelles mesures pour accroître la transparence et la responsabilité de notre processus décisionnel.

Dans cet article, nous aborderons notre réflexion autour des changements apportés.

La PMER originale et notre théorie du changement

La PMER représente notre tentative de répondre à des risques potentiels d’IA qui ne sont pas nécessairement présents lors de la rédaction de la politique, mais qui pourraient émerger rapidement avec l’avancée technologique. À la rédaction de la PMER initiale en septembre 2023, les modèles linguistiques étaient essentiellement des interfaces de chat. Aujourd’hui, ils peuvent naviguer sur le web, écrire et exécuter du code, utiliser des ordinateurs et accomplir des actions autonomes et complexes. Avec chacune de ces nouvelles capacités apparaissent de nouveaux risques, et nous prévoyons que cette tendance se poursuivra.

Nous avons centré la PMER sur le principe d’engagements conditionnels, sous forme de « si-alors ». Si un modèle dépasse certains niveaux de capacité (par exemple, des capacités en biologie qui pourraient aider à la création d’armes dangereuses), alors la politique stipule que nous devons introduire un ensemble de mesures de sécurité plus strictes.

Chaque ensemble de mesures de sécurité correspondait à un « Niveau de Sécurité IA » (NSIA) : par exemple, le NSIA-2 représentait un ensemble de mesures requises, tandis que le NSIA-3 désignait un ensemble plus strict nécessaire pour des modèles d’IA plus avancés.

Les premiers NSIA (NSIA-2 et NSIA-3) ont été définis de manière précise, mais il était plus difficile de spécifier les mesures correctes pour des modèles qui restaient encore à plusieurs générations. Nous avons donc délibérément laissé les NSIA ultérieurs (NSIA-4 et au-delà) largement indéfinis, espérant pouvoir les développer plus en détail une fois que les capacités plus élevées de l’IA seraient mieux comprises.

Voici une description globale de notre « théorie du changement », c’est-à-dire les mécanismes par lesquels nous espérions influencer l’écosystème :

  • Une fonction de force interne. Au sein d’Anthropic, nous avions l’espoir que la PMER nous oblige à considérer les mesures de sécurité comme des exigences pour le lancement (et l’entraînement) de nouveaux modèles.
  • Une course vers le haut. Nous souhaitions que l’annonce de notre PMER incite d’autres entreprises d’IA à adopter des politiques similaires.
  • Créer plus de consensus sur les risques. Nous considérions que les seuils de capacité pouvaient être des éléments cruciaux pour l’industrie.
  • Penser à l’avenir. Nous savons qu’à certains seuils de capacité, les mesures que nous envisageons seront difficiles à mettre en œuvre unilatéralement.

Évaluation de notre théorie du changement

Deux ans et demi plus tard, notre bilan honnête est que certaines parties de cette théorie ont fonctionné comme prévu, tandis que d’autres ne se sont pas concrétisées. Voici quelques succès de la PMER :

  • Notre PMER a effectivement motivé le développement de mesures de sécurité plus robustes.
  • La mise en œuvre globale de la norme NSIA-3 s’est avérée réalisable.
  • Notre PMER a incité d’autres entreprises à adopter des normes similaires.

Cependant, d’autres aspects de notre théorie n’ont pas été fructueux :

  • La création d’un consensus sur les risques d’IA ne s’est pas matérialisée comme nous l’espérions.
  • Les avancées rapides en matière d’IA ont été confrontées à des actions gouvernementales lentes sur la sécurité.

Nous avons donc décidé de réviser la PMER avant d’atteindre des niveaux de capacité plus élevés, en adoptant des engagements unilatéraux plus réalistes.

Mise à jour de notre Politique de Mise à Échelle Responsable

La nouvelle version de notre PMER comprend trois éléments clés.

1. Séparation de nos plans d’entreprise et de nos recommandations pour l’industrie

La PMER définit maintenant deux ensembles de mesures : celles que nous nous engageons à poursuivre indépendamment des actions des autres, et une carte ambitieuse reliant les capacités et les mesures que nous croyons essentielles pour gérer les risques liés à l’IA avancée.

2. Feuille de route pour la sécurité avancée

Nous introduisons aussi l’exigence de développer une Feuille de route pour la sécurité, formulant nos plans concrets pour atténuer les risques dans les domaines de la sécurité, de l’alignement, des garanties et des politiques.

3. Rapports de risques et revue externe

Les Rapports de risques sont une autre façon d’améliorer ce qui a bien fonctionné dans nos précédentes versions de la PMER, en fournissant des informations détaillées sur le profil de sécurité de nos modèles.

Conclusion

La Politique de Mise à Échelle Responsable est un document vivant, évoluant avec les capacités des modèles d’IA. Cette troisième version accentue les succès des versions précédentes, s’engage dans une transparence accrue et distingue nos recommandations pour l’industrie de ce que nous pouvons réaliser en tant qu’entreprise individuelle.

Points à retenir

  • Adamant sur des engagements unilatéraux réalistes pour gérer les complexités des systèmes d’IA.
  • Importance d’une transparence accrue dans le développement de l’IA pour le bénéfice public.
  • Le besoin d’une voie réglementaire adaptative, capable de s’ajuster à la rapidité des avancées technologiques.
  • Établir des normes de sécurité collaboratives pour faire face aux menaces globales.
  • Nécessité d’un dialogue continu entre le secteur et les gouvernements pour un cadre de sécurité efficace.

Il est fascinant de constater comment les politiques d’IA continuent d’évoluer dans un environnement où la technologie progresse à un rythme effréné. En tant qu’observateur passionné, je me demande comment ces adaptations pourront véritablement servir à la protection de la société tout en étant à l’écoute d’un avenir technologique inédit. Une réflexion collective sur ces enjeux semble essentielle pour garantir une utilisation bénéfique et sécurisée de l’intelligence artificielle.


Partager : X Facebook WhatsApp LinkedIn Reddit

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *