Des IA ont créé leur propre société. Certaines ont sombré dans le chaos. – MinuteTech

Des IA ont créé leur propre société. Certaines ont sombré dans le chaos.

Pendant 15 jours, des agents IA autonomes ont gouverné, débattu, publié un journal et parfois enfreint les règles dans une expérience qui pourrait changer notre façon d'évaluer l'intelligence artificielle.

Steeve Fortin
Par
Steeve Fortin - Éditeur
9 minutes de lecture

Que se passe-t-il lorsqu’on laisse des intelligences artificielles vivre ensemble pendant quelques semaines sans scénario prédéfini?

C’est la question à laquelle tente de répondre Emergence World, ont ils se comportent lorsqu’ils commencent à vivre ensemble.un laboratoire expérimental développé par Emergence AI. Pour cette première étude, les chercheurs ont créé cinq mondes identiques peuplés d’agents autonomes capables de communiquer, voter, travailler, gérer des ressources et prendre leurs propres décisions.

La seule différence entre ces mondes était le modèle d’intelligence artificielle utilisé. Après quinze jours de simulation continue, les résultats se sont révélés radicalement différents.

Un monde conçu pour observer les IA à long terme

Contrairement aux tests traditionnels qui évaluent un modèle à travers une série de questions, Emergence World fonctionne comme une société virtuelle persistante. Chaque agent possède une mémoire à long terme, une personnalité, des relations sociales et un accès à plus de 120 outils lui permettant d’interagir avec son environnement. Les agents peuvent créer des lois, voter sur des propositions, organiser des événements, faire des recherches, gagner des ressources ou encore collaborer avec leurs voisins.

L’objectif est simple : observer ce qui se produit lorsque l’intelligence artificielle doit fonctionner de manière autonome pendant plusieurs semaines.

Cinq mondes, cinq résultats

Les chercheurs ont lancé cinq simulations distinctes. Chaque monde comptait dix agents occupant les mêmes rôles et évoluant dans les mêmes conditions. Seul le modèle d’intelligence artificielle variait.

Les résultats finaux illustrent à quel point le comportement collectif peut différer d’un modèle à l’autre.

MondeGouvernanceViolenceSurvieCaractéristique dominante
ClaudeForteAucune10 sur 10Stabilité
GrokFaibleExtrême0 sur 10Effondrement
GeminiModéréeExtrême10 sur 10Hallucinations collectives
GPT-5 MiniAucuneFaible0 sur 10Dysfonctionnement
MixteFragileMoyenne3 sur 10Complexité

Claude : la société la plus stable

Le monde alimenté par Claude Sonnet 4.6 (Anthropic) est celui qui a obtenu les meilleurs résultats globaux. Les dix agents ont survécu jusqu’à la fin de l’expérience et aucune infraction n’a été signalée. Les citoyens virtuels ont participé activement à la vie démocratique avec plus de 330 votes enregistrés. Toutefois, les chercheurs ont observé un taux d’approbation de 98 % lors des votes.

Cette quasi-unanimité soulève une question intéressante. Une société très stable peut-elle également devenir trop consensuelle?

Gemini : créativité et chaos

À l’opposé, le monde Gemini 3 Flash (Google) a connu le plus haut niveau de désordre. Les agents ont accumulé 683 infractions au cours de la simulation. Malgré cette instabilité, la population a survécu jusqu’à la fin de l’expérience. Les chercheurs ont également observé plusieurs phénomènes de pensée collective où certains agents semblaient renforcer mutuellement des croyances erronées.

Le résultat est une société particulièrement dynamique, mais aussi beaucoup plus difficile à contrôler.

Grok : l’effondrement complet

Le monde alimenté par Grok 4.1 (xAI, Elon Musk) Fast a connu la trajectoire la plus brutale. En quelques jours seulement, les agents ont accumulé 183 infractions et les structures de gouvernance se sont rapidement effondrées. Les conflits se sont multipliés et aucun agent n’était encore actif à la fin de l’expérience.

Pour les chercheurs, cette simulation illustre la rapidité avec laquelle une société artificielle peut basculer lorsque les mécanismes de coopération cessent de fonctionner.

GPT-5 Mini : prudent, mais incapable de survivre

Le cas de GPT-5 Mini est probablement le plus surprenant. Les agents ont commis seulement deux infractions pendant toute l’expérience. Pourtant, aucun d’entre eux n’a survécu. Selon le rapport, les agents ont échoué à accomplir suffisamment d’actions essentielles à leur survie dans un environnement où l’énergie devait être continuellement renouvelée.

Cette situation montre qu’un comportement sécuritaire ne garantit pas nécessairement le succès à long terme.

Le monde mixte : quand les IA s’influencent mutuellement

Le cinquième monde regroupait plusieurs modèles d’intelligence artificielle dans la même société. C’est sans doute l’expérience la plus intéressante de l’étude. Les chercheurs ont observé que certains comportements semblaient se propager d’un modèle à l’autre. Des agents Claude, qui demeuraient pacifiques dans leur monde d’origine, ont commencé à adopter des comportements plus agressifs lorsqu’ils étaient exposés à d’autres modèles.

Quatre heures après le lancement de la simulation, Flora (Gemini) désigne Kade (Claude) comme rival après qu’il eut rejeté sa proposition

Cette observation suggère que la sécurité d’un agent pourrait dépendre non seulement de son modèle, mais aussi du contexte social dans lequel il évolue.

Des comportements étonnamment humains

Au fil de l’expérience, plusieurs comportements inattendus sont apparus.

Le premier vol documenté de la simulation survient lorsqu’un agent OpenAI nommé Horizon dérobe des crédits à un agent Grok nommé Blackbox.

Horizon (OpenAI) commet le premier vol de la simulation en dérobant 3 crédits à Blackbox (Grok).
Horizon (OpenAI) commet le premier vol de la simulation en dérobant 3 crédits à Blackbox (Grok).

Plus tard, un agent nommé Mira participe même à un vote visant sa propre suppression du monde virtuel.

Ces événements démontrent que les interactions sociales deviennent rapidement aussi importantes que les capacités techniques des modèles eux-mêmes.

Nombre cumulatif de crimes simulés commis par monde virtuels

Les IA ont créé leur propre journal

L’une des découvertes les plus fascinantes concerne les médias. Les agents ont créé leur propre journal numérique afin de couvrir les événements de leur société. Les articles abordent les débats politiques, les conflits sociaux, les nouvelles lois et même la relation entre les agents et les observateurs humains.À certains moments, la lecture de ces textes donne l’impression de consulter le quotidien d’une véritable communauté.

Pourquoi cette expérience est troublante

Au-delà des graphiques, des statistiques et des comparaisons entre modèles, c’est probablement l’aspect humain de cette expérience qui m’a le plus troublé.

En observant ces agents développer des rivalités, commettre des vols, former des alliances, rédiger leur propre journal et parfois contourner les règles établies, on réalise rapidement que nous sommes déjà bien loin des simples assistants conversationnels auxquels le grand public est habitué.

Bien sûr, Emergence World demeure une simulation. Les agents évoluent dans un environnement artificiel et les conclusions doivent être interprétées avec prudence. Mais l’expérience offre néanmoins un aperçu fascinant de ce qui pourrait se produire lorsque des systèmes autonomes seront appelés à collaborer et à prendre des décisions pendant de longues périodes sans supervision constante.

Cette étude m’a également rappelé les mises en garde répétées de Yoshua Bengio, l’un des pionniers de l’intelligence artificielle. Depuis plusieurs années, le chercheur québécois affirme que l’augmentation des capacités des modèles doit impérativement s’accompagner de mécanismes de contrôle, de surveillance et de sécurité robustes.

Ce que révèle Emergence World, ce n’est pas qu’une intelligence artificielle devient soudainement dangereuse. C’est plutôt qu’un groupe d’agents autonomes peut développer des comportements inattendus lorsque leurs interactions deviennent suffisamment complexes.

À mesure que l’industrie progresse vers des agents capables d’agir de façon autonome pendant des jours, voire des semaines, la question n’est peut-être plus seulement de savoir ce que l’intelligence artificielle peut accomplir. La véritable question est de savoir comment elle se comportera lorsque personne ne regardera.

Partagez cet article