Reliability, Escalación y Human-in-the-Loop

Por: Artiko
claudecertificacionreliabilityescalacionhuman-in-the-loop

Reliability, Escalación y Human-in-the-Loop

Anterior: Gestión de Contexto · Índice · Siguiente: Escenarios del Examen


Error handling patterns

Los agentes en producción enfrentan tres tipos de errores, cada uno con una estrategia diferente:

Transient errors → Retry

Errores temporales de red, rate limits, timeouts:

Validation errors → Fail-fast

Errores de datos incorrectos, schema violations, inputs inválidos:

Business logic errors → Escalate

Situaciones que requieren juicio humano:


Human-in-the-loop workflows

Cuándo escalar a un humano

TriggerEjemploAcción
Policy violationSolicitud que contradice términos de servicioEscalar con contexto
AmbigüedadInstrucciones del usuario pueden interpretarse de 2+ formasPedir clarificación
Alto valorTransacción > $10,000Requerir aprobación
Baja confianzaModelo reporta confidence < thresholdRouting a humano
ExcepciónCaso no cubierto por reglas existentesEscalar para decisión

Diseño de escalación

Efectivo: Structured summary

{
  "escalation_reason": "Refund request exceeds $500 threshold",
  "customer_context": "Premium tier, 3 years, no previous refunds",
  "attempted_resolution": "Offered partial refund of $200, declined",
  "recommended_action": "Approve full refund based on customer value",
  "confidence": "medium"
}

Inefectivo: Raw transcript

Para el examen: La escalación siempre debe incluir un structured summary con: razón, contexto, qué se intentó, y recomendación. No el transcript raw.


Self-evaluation y confidence routing

Pedir confidence score al modelo

Claude puede reportar su nivel de confianza, que sirve para routing:

Calibración del routing

El threshold de confidence debe calibrarse empíricamente:

  1. Recopilar N casos con confidence reportada
  2. Comparar contra ground truth (humano verifica)
  3. Ajustar thresholds hasta que el routing sea efectivo
  4. Monitorear drift — recalibrar periódicamente

Limitaciones de self-evaluation


Monitoring y observability

Qué monitorear en agentes de producción

Métricas operativas:

Métricas de calidad:

Alertas:

Structured logging

Cada step del agente debe logear:


Fallback strategies

Degradación graceful cuando tools fallan

Si una herramienta externa no está disponible:

  1. Retry transient — la tool puede estar temporalmente caída
  2. Fallback tool — usar herramienta alternativa si existe
  3. Partial response — completar lo que se pueda sin la tool
  4. Inform user — explicar qué no se pudo hacer y por qué
  5. Queue for later — guardar la tarea para cuando la tool vuelva

Fallback en pipelines multi-step

Si un step intermedio falla:

Circuit breaker pattern

Para tools que fallan repetidamente:


Patrones de fiabilidad combinados

Pipeline robusto de producción

flowchart LR
    A[Request] --> B[Validation]
    B --> C[Processing]
    C --> D[Verification]
    D --> E[Response]
    A -- error --> A1[Reject]
    B -- error --> B1[Fail-fast]
    C -- error --> C1[Retry 3x]
    C1 -- falla --> C2[Fallback/Partial]
    D -- error --> D1[Escalate]

Cada stage tiene su propia estrategia de error handling:


Resumen


Anterior: Gestión de Contexto · Índice · Siguiente: Escenarios del Examen