Degradación en Claude Code: Anthropic admite que cambios y bugs redujeron la calidad
Anthropic reconoció oficialmente la Degradación en Claude Code tras una investigación interna que atribuye el descenso de calidad percibido por usuarios a la superposición de cambios de sistema y bugs entre marzo y abril. El impacto se concentró en Claude Code, Claude Agent SDK y Claude Cowork, mientras que, según la compañía, la API de Claude no se vio afectada. La conclusión llega en forma de postmortem técnico y con reversiones ya aplicadas en varias fechas clave.
La empresa sostiene que no “empeoró” sus modelos de manera intencional; en cambio, tres ajustes independientes terminaron degradando resultados como coherencia, memoria de sesión y rendimiento medido en evaluaciones internas.
Degradación en Claude Code: tres cambios que se cruzaron
El postmortem detalla tres factores concretos detrás de la Degradación en Claude Code:
1) Cambio de “reasoning effort” por defecto (4 de marzo)
El 4 de marzo, Anthropic modificó el valor por defecto del parámetro de razonamiento (“effort level”) en Claude Code de high a medium, buscando reducir latencia. Este control define cuánta “cognición” aplica el modelo en tareas de razonamiento, con implicaciones directas en calidad, consumo de tokens y coste de inferencia. La compañía admite que fue “el trade-off equivocado” y revirtió el cambio el 7 de abril tras el feedback de usuarios que preferían máxima calidad por defecto y optar manualmente por menor esfuerzo en tareas simples.
Anthropic añade que builds recientes de Claude Code vuelven a priorizar mayor esfuerzo por defecto en configuraciones relevantes, citando una versión donde se establece “xhigh” sobre Sonnet 4.6.
2) Bug de caché que borraba estado de sesión en cada turno (26 de marzo)
El segundo incidente fue un bug introducido el 26 de marzo durante una optimización de caché. Claude cachea tokens de entrada durante una hora, lo que suele abaratar y acelerar llamadas secuenciales. El objetivo era limpiar “thinking sessions” (trazas/estado de razonamiento) cuando un usuario estuviera inactivo durante una hora, ya que no se reutilizarían. Sin embargo, el cambio terminó borrando ese estado en cada intercambio prompt-respuesta, provocando un comportamiento descrito por la propia empresa como “forgetful and repetitive”. La corrección se desplegó el 10 de abril para Sonnet 4.6 y Opus 4.6.
3) Ajuste del system prompt para reducir verbosidad (16 de abril)
El tercer factor fue una modificación del system prompt el 16 de abril diseñada para hacer a Claude menos verboso. El texto incorporó límites explícitos de longitud: mantener el texto entre tool calls en ≤25 palabras y respuestas finales en ≤100 palabras salvo necesidad. Aunque las evaluaciones internas iniciales indicaban que el cambio era seguro, pruebas de ablación posteriores (eliminando instrucciones del prompt para medir su efecto) revelaron una caída de rendimiento del 3% en Opus 4.6 y 4.7. Anthropic revirtió la sección problemática del system prompt el 20 de abril.
Qué significa para equipos que usan Claude en desarrollo
En términos prácticos, la Degradación en Claude Code afecta especialmente a flujos de trabajo donde la continuidad del contexto y el razonamiento prolongado son críticos: refactors iterativos, depuración multi-turn, planificación de cambios y revisiones de código. Un “reasoning effort” más bajo puede reducir la profundidad de análisis; un bug de caché puede romper la persistencia del estado de sesión; y un system prompt restrictivo puede forzar respuestas demasiado cortas incluso cuando la tarea requiere detalles técnicos.
Anthropic también enmarca estas medidas en un contexto de coste y capacidad: reducir “thinking” y mantener caches bajo control puede aliviar la carga de inferencia, pero el incidente muestra cómo optimizaciones orientadas a latencia o gasto pueden trasladar costes a la experiencia del usuario si no se evalúan con suficiente cobertura.
Medidas anunciadas por Anthropic tras la Degradación en Claude Code
Además de las reversiones y fixes ya aplicados, Anthropic promete ampliar el alcance y rigor de sus pruebas internas antes de publicar nuevas builds de Claude Code, mejorar su herramienta de Code Review y reforzar la evaluación de cambios en system prompts para evitar caídas de performance no detectadas. También anunció la creación de una cuenta @ClaudeDevs en X para explicar decisiones de producto y su justificación técnica con mayor profundidad.
La compañía indicó además que “reseteó” niveles de uso de cuentas para todos los usuarios, como medida compensatoria asociada al periodo afectado.
Fuentes y enlaces
Con estas correcciones, Anthropic busca cerrar un episodio que puso foco en un problema recurrente en productos de LLM: pequeñas variaciones en configuración, caching o system prompts pueden desencadenar una Degradación en Claude Code perceptible a escala, incluso cuando los modelos subyacentes no cambian de forma “intencional”.



