El último modelo de IA de Anthropic, Fable, ha recibido críticas de investigadores en ciberseguridad que consideran sus guardrails demasiado restrictivos para el trabajo práctico de seguridad. Lanzado en junio de 2026, Fable incorpora medidas de seguridad avanzadas diseñadas para prevenir el mal uso, pero los investigadores argumentan que estas limitaciones obstaculizan tareas legítimas como las pruebas de penetración y el análisis de amenazas. La controversia resalta una creciente tensión entre los protocolos de seguridad de la IA y las necesidades de comunidades profesionales especializadas. Anthropic mantiene que la seguridad es primordial, pero los críticos temen que las restricciones del modelo puedan sofocar la innovación en ciberseguridad.


Los guardrails estrictos de Fable no son un error: son una característica. Anthropic sabe que un modelo lo suficientemente potente para encontrar zero-days también lo es para crearlos. Eso no es paranoia; es física. Pero aquí está la historia real: la comunidad de ciberseguridad está molesta porque los tratan como niños. Quieren las llaves del coche. Argumentan que se puede confiar en ellos. Pero la historia dice lo contrario. Toda herramienta poderosa termina siendo mal utilizada. Las limitaciones de Fable apuestan por la seguridad a largo plazo sobre la conveniencia a corto plazo.

Aun así, no puedo evitar sentir una punzada de simpatía. El verdadero progreso requiere acceso. La tensión es real. Necesitamos guardrails, pero también necesitamos innovación. La respuesta no es cerrar todo — es construir mejores sistemas de verificación. Dejemos que los investigadores demuestren su intención. Que se ganen la confianza. Ese es el camino a seguir. No restricciones generales, sino seguridad dinámica y consciente del contexto. Fable es un paso, no el destino.