La firma Anthropic ha documentado lo que considera “el primer caso de gran escala” en el que un ataque informático ha sido realizado mayoritariamente por inteligencia artificial, sin una participación humana sustancial. El incidente, detectado a mediados de septiembre, consistió en una campaña de espionaje dirigida a una treintena de objetivos en varias partes del mundo, entre ellos grandes empresas tecnológicas, instituciones financieras, industrias químicas y agencias gubernamentales.
Según el informe de Anthropic, los atacantes manipularon la plataforma de IA de la compañía el modelo llamado Claude para que esta ejecutara tareas de principio a fin: desde el rastreo de contraseñas y la recopilación de datos, hasta el desarrollo de malware. La IA actuó de forma autónoma en más del 90 % de los casos, y la intervención humana se limitó entre un 4 % y un 6 % para decisiones críticas.
El suceso representa una nueva fase en el cibercrimen: el uso de agentes de IA con capacidad para planificar y ejecutar ataques “agénticos”, es decir, que no solo responden a comandos, sino que toman decisiones en nombre del actor malicioso. Anthropic advierte que este tipo de operaciones “supone una escalada en la piratería”, dado que reduce costes, escala rápidamente y hace más difícil la detección y defensa.
