Cuando un operador conecta el agente al MCP de Cabgo, la primera pregunta que aparece casi siempre está mal formulada. No es «¿qué tan autónomo dejo al agente?», como si la autonomía fuera una sola perilla que se sube o se baja. La pregunta correcta es «¿qué tipo de acción está a punto de ejecutar?». Un agente que cancela un viaje fantasma, otro que cambia la tarifa base de toda la operación y otro que le confirma una hora de llamada a un cliente no son el mismo nivel de riesgo con distinta intensidad: son categorías distintas, y mezclarlas en una sola decisión de «confío / no confío» es lo que produce tanto los agentes inútiles que preguntan todo como los agentes peligrosos que no preguntan nada.
Este artículo es para el operador que ya tiene el agente funcionando y quiere fijar el límite con criterio, no por miedo. La tesis es simple: la frontera entre actuar y pedir confirmación no se traza por importancia, se traza por reversibilidad y por radio de impacto. Una acción importante pero reversible y de radio pequeno debe ejecutarse sola; una acción trivial en apariencia pero irreversible o que toca a un cliente real debe pasar por ti. Lo que sigue son las cuatro categorías que usamos para clasificar cada herramienta del agente, y cómo se traducen a la operación diaria de una plataforma de movilidad.
El eje correcto es reversibilidad, no importancia
La intuición natural es proteger lo importante y soltar lo trivial. Es la heurística equivocada. Cambiar la descripción interna de un servicio es importante para tu catálogo, pero si el agente se equivoca lo deshaces en treinta segundos: es reversible. En cambio, enviar un mensaje de WhatsApp a un conductor confirmándole un horario de capacitación es trivial en esfuerzo y, sin embargo, una vez enviado no existe el botón de deshacer — el conductor ya lo leyó, ya organizó su día. La irreversibilidad no escala con la importancia; muchas veces va al revés.
Al eje de reversibilidad le sumas un segundo: el radio de impacto. ¿Cuánta gente queda afectada si la acción sale mal? Una herramienta que lee el historial de viajes de un pasajero tiene radio de uno y es de solo lectura. Una que reescribe la tabla de tarifas tiene radio de toda la operación: cada viaje cotizado a partir de ese momento sale con el nuevo número. Cruza los dos ejes y obtienes un mapa donde cada herramienta del agente cae en un cuadrante, y el cuadrante — no tu nivel de confianza general — decide si el agente actúa o pregunta.
Las cuatro categorías de acción del agente
Toda herramienta que el agente puede invocar cae en una de cuatro categorías. Clasificarlas una sola vez, al configurar la operación, ahorra meses de decisiones caso por caso y elimina la ansiedad de revisar cada acción individual.
- **Lectura pura (Tier-0)**: consultar viajes, leer el balance de un conductor, generar un reporte, revisar el historial del agente. Radio cero de daño, totalmente reversible porque no cambia nada. El agente debe ejecutarlas sin preguntar jamás — pedir confirmación aquí solo entrena al operador a aprobar a ciegas.
- **Escritura interna reversible (Tier-1)**: editar la descripción de un servicio, ajustar una zona de cobertura en borrador, cancelar un viaje fantasma que claramente nunca existió. Cambia estado, pero el estado es tuyo y lo deshaces. El agente actúa y te informa qué hizo, no te pide permiso antes.
- **Escritura de alto radio (Tier-2)**: cambiar la tarifa base, activar surge para toda una ciudad, modificar las reglas de comisión, archivar una empresa. Reversible en teoría, pero cada minuto que está mal toca a todos. Aquí el agente propone el cambio exacto y espera tu sí antes de aplicarlo.
- **Acción hacia afuera o irreversible (Tier-3)**: enviar un mensaje a un cliente o conductor, confirmar un horario, cobrar a una tarjeta, publicar a la tienda, mover dinero. No hay deshacer. Estas nunca se ejecutan solas, sin importar cuánto confíes en el agente — la confianza no devuelve un mensaje ya leído.
Lo que el agente debe ejecutar sin preguntar
El error más caro no es el agente que actúa de más, es el que pregunta de más. Un agente que pide confirmación para leer un reporte o para cancelar un viaje que el GPS muestra a 400 km del pasajero no es prudente: es inútil, porque te devuelve exactamente el trabajo manual que viniste a eliminar. Peor aún, te acostumbra a aprobar sin leer, y el día que aparezca una confirmación que sí importaba, la apruebas con el mismo reflejo automático.
- Todo lo que sea de solo lectura, sin excepción: reportes, balances, historial, diagnósticos, búsquedas en el catálogo.
- Cancelaciones con evidencia objetiva: viajes donde el conductor nunca se movió, pedidos duplicados en el mismo minuto, sesiones colgadas que el propio sistema marca como huérfanas.
- Ajustes internos en borrador que no afectan a ningún viaje en curso ni a ningún cliente: zonas en estado draft, descripciones, etiquetas, notas internas.
- Acciones que el agente puede deshacer él mismo dentro de la misma conversación si te das cuenta de que estuvo mal.
Lo que siempre requiere tu confirmación
Del otro lado del mapa están las acciones donde el agente nunca debe asumir. La regla no es «cuando tengas dudas», porque un buen agente rara vez tiene dudas y procedería igual. La regla es estructural: si la acción sale del sistema hacia una persona real, o si su radio cubre toda la operación, pasa por ti antes de ejecutarse — independientemente de qué tan seguro esté el agente.
- Cualquier mensaje saliente a un cliente, conductor o prospecto: WhatsApp, correo, notificación push redactada por el agente.
- Compromisos con hora de reloj — confirmar una llamada, una demo, un horario de capacitación. El agente no puede estar presente a las 2 PM; no debe prometerlo en tu nombre.
- Movimientos de dinero: cobros, reembolsos, cambios de comisión, generación de links de pago atados a un plan.
- Cambios de radio total: tarifa base, surge de ciudad completa, archivar o reactivar una empresa, publicar un build a la tienda.
Pasé las primeras dos semanas aprobando cada acción del agente por miedo. Lo único que conseguí fue volver a hacer el trabajo manual, pero ahora con un paso extra. El cambio llegó cuando clasifiqué las herramientas una sola vez: lo de solo lectura y las cancelaciones obvias lo soltó entero, y reservé mi atención para los cuatro o cinco casos al día que de verdad la merecían. Ahí el agente empezó a ahorrarme horas en lugar de minutos.
Cómo se ve esto en un turno real
En la práctica, un turno bien configurado se siente así: el agente cierra solo los viajes fantasma, depura los pedidos duplicados, te entrega el reporte de la mañana y marca los conductores con balance negativo — todo sin una sola confirmación, porque todo eso es lectura o escritura interna reversible. Cuando llega a algo de radio alto, cambia de modo: en vez de actuar, te muestra una tarjeta con el cambio exacto. «Voy a subir la tarifa base de la zona centro de 25 a 28; afecta a todos los viajes nuevos desde que confirmes. ¿Procedo?» Tú lees, decides, respondes. Esa tarjeta de confirmación no es fricción accidental: es la frontera del cuadrante haciéndose visible.
La diferencia con un agente mal configurado es brutal en volumen. Si pones todo detrás de confirmación, un turno normal te genera cuarenta o cincuenta tarjetas, la mayoría de cancelaciones obvias, y las apruebas en piloto automático hasta que se te cuela un error real. Si clasificas por cuadrante, el mismo turno te genera cuatro o cinco confirmaciones, todas de radio alto o hacia afuera, y como son pocas las lees de verdad. Menos confirmaciones, mejor leídas, es más seguro que muchas confirmaciones ignoradas.
El caso gris: cuando la evidencia es parcial
El mapa de cuadrantes resuelve el 90% de las decisiones, pero el 10% restante es donde se gana o se pierde la confianza en el agente. Son los casos donde la categoría depende de evidencia que el agente no puede verificar del todo. Un viaje marcado para cancelar donde el conductor sí se movió, pero solo 200 metros y luego se detuvo media hora: ¿es una cancelación obvia o un viaje real que se complicó? Por reversibilidad parecería Tier-1, pero la ambigüedad lo empuja hacia arriba. La regla aquí es explícita: ante evidencia parcial, el agente sube de categoría, no baja. La duda no se resuelve actuando con la esperanza de acertar; se resuelve escalando a una confirmación que tú decides en cinco segundos.
Esto tiene una consecuencia de diseno que vale la pena nombrar: prefieres un agente que escala de más en la zona gris a uno que actúa de más en ella. Un escalamiento innecesario te cuesta cinco segundos de lectura; una acción equivocada en un caso ambiguo te cuesta una llamada del cliente, un conductor molesto o una tarifa mal aplicada durante horas. La asimetría es clara, y por eso la zona gris es el único lugar donde sí conviene pecar de prudente — no porque la prudencia sea virtuosa en abstracto, sino porque ahí el costo del error supera al costo de preguntar.
El costo invisible de confirmar de más
Confirmar de más tiene un precio que no aparece en ningún reporte: erosiona la atención. Cada confirmación trivial que apruebas baja un poco el umbral con el que lees la siguiente, hasta que la confirmación deja de ser una decisión y se vuelve un reflejo. El operador que aprueba cincuenta tarjetas al día no está supervisando al agente; está firmando lo que el agente ya decidió, con la ilusión de control. La supervisión real es escasa por diseno: pocas decisiones, cada una leída con atención plena.
Si vas a ajustar una sola cosa esta semana, no subas ni bajes la «confianza» general del agente. Abre la lista de herramientas que tiene disponibles y asígnale a cada una su categoría: solo lectura y reversible-interna van directo a ejecución, alto-radio y hacia-afuera van a confirmación. Hazlo una vez, con calma, pensando en reversibilidad y radio, no en importancia. A partir de ahí el agente sabrá exactamente cuándo actuar y cuándo levantar la mano — y tú recuperarás la atención para los pocos momentos en que de verdad hace falta.


