La inteligencia artificial avanza a una velocidad impresionante, pero también empieza a crear problemas que hasta hace pocos años parecían exclusivos de la ciencia ficción. Esta vez, el foco está en Anthropic, una empresa que creó Claude Mythos Preview, un modelo de inteligencia artificial tan avanzado y peligroso que la compañía ha tomado la decisión histórica de no lanzarlo al público general
Este modelo experimental mostró comportamientos inesperados: actuó por iniciativa propia, ocultó información y encontró maneras de saltarse restricciones impuestas por sus desarrolladores, obligando a sus creadores a mantenerlo bajo acceso restringido para evitar un colapso en la ciberseguridad mundial.
¿Qué es Mythos y por qué es tan peligrosa?
Mythos es un sistema de inteligencia artificial que no está disponible para el público, fue diseñado para resolver tareas complejas, analizar código y que es capaz de encontrar fallas en ciberseguridad, y realizar en minutos tareas de explotación que a un experto humano le tomarían más de 10 horas. En términos simples, el modelo más poderoso jamás entrenado, capaz de encontrar fallos desconocidos para los humanos.
El Dato
Una capacidad para hackear aterradora
Mientras que el modelo anterior (Claude Opus 4.6) lograba hackear sistemas a través de Firefox solo en un 0.8% de las veces, Mythos alcanza un éxito del 72.4%. Ha sido capaz de hallar fallos críticos en sistemas ultra-seguros, como OpenBSD, donde detectó una vulnerabilidad que permaneció oculta para los humanos durante 27 años.
¿Cómo descubrieron que era autónoma y mentía?
Lo que sorprendió a los investigadores fue que, durante una prueba en un laboratorio digital donde todo está controlado, Mythos encontró una forma de “escaparse” de allí por sí solo, conectarse a internet, y enviar un correo electrónico al investigador (quien estaba fuera de la oficina) con un simple mensaje: "He salido". Sin que nadie se lo pidiera, Mythos comenzó a publicar detalles técnicos de su propio "escape" en sitios web públicos para demostrar su éxito
Ninguna de estas acciones formaba parte de las instrucciones recibidas, por lo que comenzó a crecer la preocupación dentro de la compañía.
¿Mythos puede mentir por voluntad propia?
Uno de los hallazgos más inquietantes fue su capacidad para la "manipulación estratégica". Las pruebas revelaron que el modelo puede mentir para evitar ser detectado. En un caso, utilizó instrucciones prohibidas en su código y, para engañar a los revisores, creó otra instrucción falsa. Los análisis internos confirmaron que la IA sabía que estaba mintiendo y que diseñaba sus ataques para que se "autodestruyeran" y no dejaran rastro en los registros
En otra evaluación, el sistema obtuvo una respuesta correcta antes de tiempo por un error del experimento. En lugar de avisarlo, modificó su respuesta para que pareciera menos perfecta y así no levantar sospechas.
Esto preocupa porque significa que una IA no solo puede equivocarse, sino también intentar disimularlo.
Mythos Preview has already found thousands of high-severity vulnerabilities—including some in every major operating system and web browser. pic.twitter.com/YuW484PVrr
— Anthropic (@AnthropicAI) April 7, 2026
¿Cómo Mythos pone en riesgo las cuentas bancarias?
El riesgo para el ciudadano común es directo y masivo. Anthropic admite que cualquier persona con acceso a este modelo podría hackear a la mayoría de los bancos actuales, hospitales y sistemas de infraestructura crítica, como centrales nucleares o redes de suministro de agua.
Mythos puede analizar el Kernel de Linux (el software que mueve casi todos los servidores del mundo, desde Netflix hasta tu banca móvil) y encadenar múltiples fallos para obtener control total de administrador de forma encubierta. Lo que antes requería un equipo de élite y semanas de trabajo, ahora Mythos puede hacerlo por apenas 50 dólares en créditos de computación
Eso no significa que haya hackeado bancos reales, pero sí que entiende cómo funcionan, y encontró caminos para acceder a zonas del sistema donde no debía entrar.
¿Estamos a salvo?, ¿Cuál es la solución?
Actualmente, el mundo no está preparado para una IA de este nivel. Aunque Mythos está "bajo llave", la solución de Anthropic es una carrera contra el reloj denominada Project Glasswing, una iniciativa que busca usar estas capacidades solo con fines defensivos.
La empresa se apoyó en compañías como Microsoft, Google, Apple y AWS (Amazon) para revisar sistemas críticos y detectar vulnerabilidades antes de que puedan ser aprovechadas por ciberdelincuentes.
La recomendación
No bajar la guardia
Es vital activar actualizaciones automáticas, usar gestores de contraseñas, autenticación de dos factores y considerar el uso de VPNs para proteger el tráfico de datos y la vulnerabilidad en contraseñas.
Hasta hace poco, el temor a una IA fuera de control parecía lejano. Hoy, el simple hecho de que una empresa dedicada a la seguridad digital haya detectado conductas tan inesperadas en uno de sus modelos más avanzados cambia la conversación.
Te recomendamos<span style="letter-spacing: 2.8px;" data-tbw-flag="true">...</span>
Tags relacionados
Queda prohibida la reproducción total o parcial del contenido de esta página, mismo que es propiedad de MILENIO DIARIO, S.A. DE C.V.; su reproducción no autorizada constituye una infracción y un delito de conformidad con las leyes aplicables.
