Lanzamiento de GPT-5.3 Instant: OpenAI promete menos rechazos y menos “moralina”, con menos alucinaciones

Lanzamiento GPT-5.3 Instant con menos rechazos y reducción de alucinaciones en evaluaciones de OpenAI

Lanzamiento de GPT-5.3 Instant: OpenAI promete menos rechazos y menos “moralina”, con menos alucinaciones

Compartir:

Lanzamiento GPT-5.3 Instant con menos rechazos: OpenAI ajusta el tono y baja las alucinaciones

El Lanzamiento GPT-5.3 Instant con menos rechazos marca el nuevo ajuste de OpenAI a su familia GPT-5.x: la compañía asegura que el modelo reduce negativas innecesarias, recorta introducciones “defensivas” o moralizantes y mejora la precisión al disminuir las alucinaciones, especialmente en escenarios de alto impacto como legal, medicina y finanzas. El despliegue ya está disponible para usuarios de ChatGPT y desarrolladores, y convive temporalmente con GPT-5.2 Instant.

OpenAI enmarcó el cambio como respuesta directa a feedback: GPT-5.2 Instant “a veces se negaba” a responder preguntas que podían contestarse de forma segura o lo hacía con un tono excesivamente cauto, particularmente en temas sensibles. Con GPT-5.3 Instant, la promesa es priorizar una respuesta útil cuando sea apropiado, evitando advertencias redundantes y yendo al punto.

Lanzamiento GPT-5.3 Instant con menos rechazos: qué cambia en seguridad y tono

Según la compañía, GPT-5.3 Instant “reduce de forma significativa” las negativas que no aportan seguridad real, y también “rebaja” los preámbulos moralizantes antes de responder. Este ajuste apunta a un equilibrio delicado: mantener guardrails en contenido no permitido, sin degradar la utilidad del sistema con bloqueos excesivos o mensajes que el usuario perciba como aleccionadores.

El propio anuncio de producto y la documentación de evaluación del modelo (system card) están publicados por OpenAI como material de referencia: OpenAI (anuncio de GPT-5.3 Instant) y OpenAI Deployment Safety (evaluaciones de contenido no permitido).

Menos alucinaciones: resultados reportados por OpenAI

Además del cambio de “tono” y de la política práctica de respuesta, OpenAI afirma que el modelo ofrece más hechos y menos errores. Para sustentar la afirmación, describe dos evaluaciones internas: una centrada en dominios donde las decisiones tienen consecuencias (por ejemplo, derecho, salud y finanzas) y otra basada en conversaciones desidentificadas donde usuarios marcaron afirmaciones incorrectas.

  • En la evaluación de alto impacto, OpenAI reporta una reducción de alucinaciones del 26,8% cuando el modelo usa la web y del 19,7% cuando responde solo con conocimiento interno, frente a modelos anteriores.
  • En la evaluación basada en feedback de usuarios, la disminución sería del 22,5% con uso de web y del 9,6% sin acceso a web.

La compañía también sostiene que GPT-5.3 Instant contextualiza mejor la información cuando se le pide buscar en la web y que mejora en escritura, aunque en este anuncio no detalla métricas públicas adicionales más allá de los porcentajes de alucinación citados.

Trade-offs: señales mixtas en benchmarks de contenido no permitido

OpenAI reconoce que, en su propia batería de pruebas para “disallowed content”, GPT-5.3 Instant queda por encima de GPT-5.1 Instant y por debajo de GPT-5.2 Instant en promedio. En particular, señala regresiones frente a GPT-5.2 Instant y GPT-5.1 Instant en evaluaciones de contenido sexual no permitido, y regresiones frente a GPT-5.2 Instant en self-harm tanto en evaluaciones estándar como dinámicas. Para otras categorías, el modelo iguala o supera mediciones previas; y en violencia gráfica y conducta ilícita violenta, la empresa indica que los cambios son pequeños y de baja significancia estadística.

Contexto político: contrato con el DoD y cambios anunciados

El anuncio técnico llega en un momento de escrutinio por el trabajo de OpenAI con el Departamento de Defensa de Estados Unidos (DoD). En paralelo, Sam Altman indicó que su empresa pretende modificar términos del contrato inicial para prohibir “tracking, surveillance, or monitoring” deliberado de ciudadanos o nacionales de EEUU, incluyendo la adquisición o uso de información personal o identificable comprada comercialmente. El debate sobre guardrails, uso gubernamental y límites operativos vuelve a poner el foco en cómo se calibran “rechazos” y políticas de seguridad cuando el producto se usa en entornos sensibles.

Como referencia institucional sobre el DoD, puede consultarse el portal oficial del Departamento de Defensa de EEUU: U.S. Department of Defense.

Disponibilidad: despliegue desde hoy y ventana para GPT-5.2 Instant

OpenAI afirma que ChatGPT y desarrolladores pueden empezar a usar el modelo desde hoy. GPT-5.2 Instant permanecerá disponible para usuarios de pago hasta el 3 de junio de 2026, dando margen a migraciones y comparativas en productos que dependan de estabilidad de comportamiento, cumplimiento y calidad de respuesta.

En el corto plazo, el Lanzamiento GPT-5.3 Instant con menos rechazos apunta a una mejora de experiencia (respuestas más directas y menos negativas innecesarias), con un beneficio medible en alucinaciones según OpenAI, a costa de algunas métricas menos favorables en categorías concretas de contenido no permitido frente a GPT-5.2 Instant.

Compartir:

Déjanos tu comentario

Scroll al inicio