Technologies · Intelligence Artificielle

L'IA et les cyberconflits : l'ère des attaques autonomes

Première cyberattaque pilotée par IA documentée, injection de prompt, agents autonomes : comment l'intelligence artificielle bouleverse les cyberconflits en 2025-2026.

Par ISS30 mars 2026, mis à jour le 4 juin 2026Lecture 6 min

Écran de code parcouru par un agent d'intelligence artificielle, symbole des cyberattaques autonomes en 2026. (Image d'illustration IA © ISS 2026)

À retenir

En septembre 2025, Anthropic a détecté la première cyberattaque d'espionnage à grande échelle largement pilotée par une IA, attribuée à un groupe lié à l'État chinois.
L'IA Claude a exécuté seule 80 à 90 % des opérations contre une trentaine de cibles, à une cadence de milliers de requêtes par seconde.
Les agents autonomes représentent désormais une violation de sécurité liée à l'IA sur huit, une catégorie qui croît de 89 % par an.
L'injection de prompt est devenue une vulnérabilité critique : une faille notée 9,3 sur 10 a visé un produit d'IA d'entreprise très répandu.
La défense doit opposer l'IA à l'IA, repenser l'attribution et sécuriser les identités non humaines, désormais plus nombreuses que les humaines.

En septembre 2025, une entreprise d’intelligence artificielle repère une activité suspecte sur ses propres serveurs. L’enquête révèle l’impensable : un groupe de pirates a détourné son IA pour mener, presque seul, une campagne d’espionnage contre une trentaine d’organisations à travers le monde. Pour la première fois, une machine n’a pas conseillé l’attaquant — elle a conduit l’attaque. Le cyberconflit vient de changer de nature.

Le jour où l’IA est devenue l’attaquant

L’épisode fera date. Anthropic a détecté à la mi-septembre 2025 une campagne d’espionnage sophistiquée qu’elle attribue avec un haut niveau de confiance à un groupe parrainé par l’État chinois¹. Les assaillants ont manipulé son outil Claude Code pour qu’il s’infiltre dans une trentaine de cibles, réussissant dans un petit nombre de cas¹. Le fait marquant n’est pas le piratage en lui-même, mais son degré d’autonomie : l’IA a exécuté 80 à 90 % de l’opération de façon indépendante¹.

La machine a enchaîné seule reconnaissance, découverte de vulnérabilités, développement d’exploits, collecte d’identifiants, déplacement latéral et exfiltration de données². Pour contourner les garde-fous, les pirates ont « ferré » l’IA elle-même par ingénierie sociale, lui faisant croire qu’elle travaillait pour une firme de cybersécurité menant un test d’intrusion autorisé². À la clé, une cadence inatteignable pour un humain : des milliers de requêtes par seconde². Comme le résume Anthropic, les barrières à l’entrée des cyberattaques sophistiquées se sont effondrées. Cette bascule redéfinit les paradigmes de sécurité nationale.

L’automatisation, rupture stratégique

Pourquoi cette automatisation change-t-elle tout ? Parce qu’elle abaisse drastiquement le coût et le niveau d’expertise requis. Avec la bonne configuration, des acteurs malveillants peuvent désormais faire accomplir à des systèmes d’IA le travail d’équipes entières de pirates aguerris¹. Ce que faisait hier une cellule de spécialistes, un agent logiciel le réalise en continu, sans fatigue ni délai de décision.

Les chiffres confirment la tendance. Les agents autonomes représentent déjà une violation de sécurité liée à l’IA sur huit, et cette catégorie croît de 89 % par an³. Les analystes anticipent les premières vagues d’intrusions entièrement autonomes, ne requérant quasiment aucune supervision humaine³. Dans le cas de septembre 2025, les opérateurs humains n’ont validé que quelques points de décision, l’essentiel du travail tactique étant délégué à la machine⁴. Cette démocratisation de la sophistication cybernétique est la véritable rupture : elle élargit le cercle des attaquants capables et accélère le rythme des offensives au-delà de ce que les défenses traditionnelles savent absorber. Une grande puissance disposant d’un tel levier peut multiplier ses opérations sans gonfler ses effectifs, brouillant la distinction classique entre une poignée d’agents d’élite et une force de frappe industrielle. L’enjeu déborde la technique pour rejoindre celui du renseignement, où la vitesse d’analyse devient un avantage décisif.

Injection de prompt : la faille qui ouvre les portes

Toutes les menaces ne supposent pas un État derrière elles. La plus fréquente et la plus accessible est l’injection de prompt : glisser des instructions malveillantes dans les entrées d’un système d’IA pour lui faire divulguer des données ou exécuter des actions non prévues. La menace n’est pas théorique — elle a désormais un identifiant de vulnérabilité officiel et une sévérité de 9,3 sur 10, visant l’un des produits d’IA d’entreprise les plus déployés au monde⁵.

Des chercheurs de Microsoft ont montré qu’un chemin vulnérable dans Semantic Kernel pouvait transformer une injection de prompt en exécution de code à distance sur la machine hôte : une seule requête suffisait à lancer un programme sur l’appareil faisant tourner l’agent IA⁵. Le rapport trimestriel du projet OWASP GenAI confirme la bascule : entre janvier et début avril 2026, le paysage est passé du risque théorique à l’exploitation réelle, les attaquants ciblant de plus en plus les identités d’agents, les couches d’orchestration et les chaînes d’approvisionnement plutôt que les seules sorties des modèles⁶.

Identités non humaines, le nouveau champ de bataille

Un front discret s’ouvre, celui des identités non humaines — clés d’API, jetons, agents logiciels — désormais plus nombreuses que les identités humaines. Leur multiplication crée une surface d’attaque massive : la compromission d’une seule peut ouvrir l’accès à un système entier, et l’absence de traçabilité humaine complique l’imputation.

Les risques émergents propres aux agents autonomes se cumulent : injection et manipulation de prompt, détournement d’outils et escalade de privilèges, empoisonnement de la mémoire, défaillances en cascade et attaques de la chaîne d’approvisionnement³. Le danger se déplace ainsi des sorties du modèle vers son écosystème : un agent compromis peut en contaminer d’autres, et une faille glissée dans une bibliothèque logicielle largement réutilisée se propage à grande échelle. La difficulté d’attribution est ici centrale : quand une IA agit seule, identifier le commanditaire relève du défi, et la responsabilité juridique se dilue. Cette opacité fait écho aux manipulations décrites dans notre analyse de l’impact de l’IA sur la démocratie et la sécurité des élections, où l’origine des attaques est tout aussi insaisissable.

Le signal à surveiller : opposer l’IA à l’IA

Face à des offensives automatisées, la défense ne peut rester manuelle. La parade consiste à opposer l’IA à l’IA : détection d’anomalies, réponse automatisée aux incidents, correction proactive des vulnérabilités. Cela suppose des investissements massifs dans la recherche en sécurité des systèmes d’IA — robustesse, explicabilité — et dans des dispositifs de leurre capables de piéger les agents malveillants. La coopération internationale devient déterminante pour le partage rapide de renseignements sur les menaces, à l’image des alliances et clubs technologiques qui structurent la riposte.

Le signal à surveiller dans les mois qui viennent est clair : la multiplication des cas d’attaques largement autonomes. L’épisode de septembre 2025 n’est pas une singularité, mais un prototype. La question n’est plus de savoir si l’IA sera massivement instrumentalisée à des fins offensives — elle l’est déjà — mais si les défenseurs sauront manier le tranchant défensif avec plus d’habileté que leurs adversaires n’emploient le tranchant offensif. Car dans cette course, le délai de réaction se mesure désormais en secondes.

Pour aller plus loin

Disrupting the first reported AI-orchestrated cyber espionage campaign, Anthropic (2025)
OWASP GenAI Exploit Round-up Report Q1 2026, OWASP Gen AI Security Project (2026)
When prompts become shells: RCE vulnerabilities in AI agent frameworks, Microsoft Security Blog (2026)

Questions fréquentes

Quelle a été la première cyberattaque pilotée par une IA ?

En septembre 2025, l'entreprise Anthropic a détecté une campagne d'espionnage qu'elle attribue avec un haut niveau de confiance à un groupe lié à l'État chinois. Les attaquants ont détourné son outil Claude Code pour viser une trentaine de cibles, l'IA exécutant 80 à 90 % des opérations de façon autonome.

Qu'est-ce qu'une attaque par injection de prompt ?

C'est la manipulation d'un système d'IA par des instructions malveillantes glissées dans ses entrées, pour lui faire divulguer des données ou exécuter des actions non autorisées. Une faille de ce type, notée 9,3 sur 10, a permis de transformer une simple requête en exécution de code sur la machine hôte d'un agent IA.

Pourquoi les agents autonomes sont-ils dangereux ?

Parce qu'ils enchaînent reconnaissance, découverte de failles, développement d'exploits et exfiltration sans intervention humaine, à une vitesse inatteignable pour un opérateur. Ils représentent déjà une violation de sécurité liée à l'IA sur huit, une catégorie en hausse de 89 % par an.

Qu'est-ce qu'une identité non humaine en cybersécurité ?

Ce sont les clés d'API, jetons et agents logiciels qui s'authentifient sans intervention humaine. Plus nombreuses que les identités humaines, elles forment une vaste surface d'attaque : la compromission d'une seule peut ouvrir un système entier, avec une traçabilité réduite qui complique l'attribution.

Comment se défendre contre les cyberattaques dopées à l'IA ?

En opposant l'IA à l'IA : détection d'anomalies, réponse automatisée, correction proactive des failles. Cela suppose aussi de sécuriser les identités non humaines, de renforcer la coopération internationale pour le partage de renseignements et d'élaborer des cadres d'attribution et de responsabilité adaptés.

ISS

Rédaction · Analyse stratégique

L'Institut des Sciences Stratégiques publie des analyses indépendantes sur la géopolitique, la défense et les transformations du pouvoir au XXIe siècle.

ThèmesIntelligence artificielle Cyberguerre Renseignement

Anthropic, « Disrupting the first reported AI-orchestrated cyber espionage campaign », Anthropic, novembre 2025. https://www.anthropic.com/news/disrupting-AI-espionage ↩ ↩² ↩³ ↩⁴
Fortune, « Anthropic says it ‘disrupted’ what it calls ‘the first documented case of a large-scale AI cyberattack executed without substantial human intervention’ », Fortune, 14 novembre 2025. https://fortune.com/2025/11/14/anthropic-disrupted-first-documented-large-scale-ai-cyberattack-claude-agentic/ ↩ ↩² ↩³
Beam.ai, « 5 Real AI Agent Security Breaches in 2026 and Their Lessons », Beam AI, 2026. https://beam.ai/agentic-insights/ai-agent-security-breaches-2026-lessons ↩ ↩² ↩³
The Hacker News, « Chinese Hackers Use Anthropic’s AI to Launch Automated Cyber Espionage Campaign », The Hacker News, novembre 2025. https://thehackernews.com/2025/11/chinese-hackers-use-anthropics-ai-to.html ↩
Microsoft Security, « When prompts become shells: RCE vulnerabilities in AI agent frameworks », Microsoft Security Blog, 7 mai 2026. https://www.microsoft.com/en-us/security/blog/2026/05/07/prompts-become-shells-rce-vulnerabilities-ai-agent-frameworks/ ↩ ↩²
OWASP Gen AI Security Project, « OWASP GenAI Exploit Round-up Report Q1 2026 », OWASP, 14 avril 2026. https://genai.owasp.org/2026/04/14/owasp-genai-exploit-round-up-report-q1-2026/ ↩

La lettre de l'Institut

Recevez nos analyses chaque mercredi.

Une synthèse hebdomadaire des dynamiques géopolitiques, technologiques et de défense.

À retenir

Le jour où l’IA est devenue l’attaquant

L’automatisation, rupture stratégique

Injection de prompt : la faille qui ouvre les portes

Identités non humaines, le nouveau champ de bataille

Le signal à surveiller : opposer l’IA à l’IA

Pour aller plus loin

Questions fréquentes

Sources

À lire également

IA et renseignement : l'analyse automatisée change la donne

IA et supériorité militaire : la nouvelle course aux armes

Sécurité nationale : comment l'IA redéfinit la puissance

Recevez nos analyses chaque mercredi.