← SCRAM AI Lab
El patrón donde un lead agent delega a specialists usando el filesystem como bus de comunicación. Funciona cuando coordinar tres specialists cuesta menos que hacerlo serial.
May 21, 2026
10 lecturas
La versión 2.1.130 de Claude Code estabilizó el patrón lead agent + specialists: un agente principal recibe la tarea, la descompone, delega subtareas a agentes especializados que corren en paralelo, y reúne los resultados. No es revolucionario; es lo que ya hacías con scripts y subprocess, pero ahora con tool calls de primera clase y un protocolo de comunicación que el modelo entiende. Lo que realmente cambió es que ya no necesitas el truco de "agente que invoca a Claude vía CLI": el harness expone Task como herramienta nativa.
El error común: tratar al subagent como un agente más con menos privilegios. Si necesitas conversación iterativa, no es subagent. Si la tarea es "busca todos los archivos que cumplen X y devuélveme la lista", sí lo es.
Cuando lead y specialists comparten cwd, el filesystem es el protocolo: el lead escribe .tasks/research.md, lanza specialists que leen ese archivo y escriben .tasks/research-findings-id.md, y el lead consolida. Más confiable que pasar todo por argumentos: sobrevive a context limits, queda como log, y permite specialists que se ejecutan en sesiones distintas. Patrón que funciona en producción:
// Lead agent
const subtasks = [
{ id: "schema", prompt: "Audita el schema de Prisma..." },
{ id: "api", prompt: "Audita los controllers del módulo CRM..." },
{ id: "frontend", prompt: "Audita los componentes en app/crm/..." }
];
await Promise.all(subtasks.map(t =>
invokeTask({
description: t.id,
prompt: t.prompt + " Escribe hallazgos a .tasks/audit-" + t.id + ".md",
subagent_type: "code-reviewer"
})
));
// Lead reads .tasks/audit-*.md y produce el reporte final
La intuición engaña aquí. Tres specialists en paralelo no son tres veces más rápidos: hay overhead de spawn (~2-4s por subagent), context independiente (cada uno relee archivos), y consolidación final. La regla práctica:
El patrón degenerado más común es crear specialists para cosas que no son specialists, solo para "tener arquitectura". file-reader-agent que solo lee archivos. commit-agent que solo hace git commit. Estos no son specialists; son herramientas con disfraz de agente, y le cuestan al lead el doble de tokens y el doble de latencia.
Un specialist genuino tiene: (a) un dominio donde sabe más que el lead (porque tiene un system prompt especializado), (b) una tarea que se beneficia de contexto fresco (sin el ruido de la conversación del lead), o (c) una latencia que paraleliza con otras subtareas. Si no cumple ninguna de las tres, es ruido.
Auditorías de codebase grandes: lead descompone por módulo, lanza un specialist code-reviewer por módulo (en paralelo), cada uno escribe hallazgos, lead consolida y prioriza. Un audit que tomaba 25 minutos serial baja a 8 minutos. Las dependencias entre módulos las maneja el lead en la consolidación, no los specialists.
La pregunta correcta no es "¿debería usar multiagent?", es "¿esta tarea tiene tres subtareas verdaderamente independientes de minutos cada una?". Si no, el código serial es más rápido y más debugeable. ¿En tu próximo audit tienes ese perfil de carga?
Artículos relacionados
Hooks: el patrón que sustituye 80% de validaciones manuales
PreToolUse y PostToolUse son el lugar correcto para bloquear commits a main, formatear código, ejecutar tests y validar comandos peligrosos. Sin pedirle permiso al modelo.
Construye tu primer MCP server: el patrón real
Stdio sigue siendo la mejor opción para MCPs propios. HTTP solo si necesitas multi-cliente o auth. Una herramienta, un caso de uso atómico, schema Zod estricto.
MCPs propios: cuándo construir vs adoptar
Adopta cuando hay un MCP mantenido por gente seria. Construye cuando tu lógica de negocio, credenciales o latencia no toleran un intermediario genérico.