Os 3 erros de arquitetura que matam times de IA — e o checklist para diagnosticar
Por que agentes tecnicamente bons falham em posições erradas — 3 erros com sintomas, correção e validação.
Checklist de 5 itens para qualquer agente novo + diagnóstico dos 3 erros mais comuns
- ▸ Mais de 3 responsabilidades por agente é o primeiro sinal de erro de posição
- ▸ 5 decisões/dia passando por você = você é o gargalo, não o gestor
- ▸ 3 a 7 dias para ver melhora depois de corrigir o Erro 1 — 2 semanas para o Erro 3
Sem spam. Pode cancelar quando quiser.
Os 3 agentes que eu "demiti" — e o que aprendi depois
Eu tinha um agente de conteúdo que descartei depois de 2 semanas porque "não entendia o tom da marca." Depois, com o DNA documentado, usei o mesmo modelo base e funcionou perfeitamente.
Tinha um agente de aprovação que abandonei porque "aprovava coisas que não deveriam." Depois, com critérios explícitos, o mesmo tipo de agente virou o FLARE.
Tinha um agente de distribuição que desativei porque "sempre precisava que eu explicasse de novo." Depois, com o briefing de 5 blocos, ele distribuiu as tarefas sem nenhuma intervenção minha.
Os 3 agentes não eram ruins. Eu os coloquei em posições sem os pré-requisitos para funcionar. Demiti por erro de arquitetura e culpei a tecnologia.
O sintoma que você confunde com limitação do agente
O agente entregou algo ruim. Você ajusta. Ele entrega de novo. Você ajusta de novo. Na terceira vez você escreve: "Você não está entendendo o que eu quero."
Você está certo — ele não está entendendo. Mas não porque é burro. Porque não tem o que precisa: critério documentado, escopo definido, exemplos de certo e errado.
Você está pedindo para ele adivinhar o que está na sua cabeça. Ele adivinha com base em padrões estatísticos de milhões de textos. Você tem um padrão específico que não está em milhão nenhum — está na sua marca, na sua voz, na sua história. Sem isso documentado, o agente não é ruim. É cego.
Os 3 erros de arquitetura — sintoma, causa e correção
Esses 3 erros respondem por mais de 80% das falhas em times de IA que funcionam tecnicamente mas não produzem resultado consistente.
- ▸ ERRO 1 — ESCOPO INFLADO: Sintoma: output inconsistente — às vezes ótimo, às vezes péssimo, sem padrão aparente. Causa: o agente tem mais de 3 responsabilidades e escolhe qual priorizar baseado no contexto da sessão. Correção: liste todas as responsabilidades, selecione as 3 mais críticas, mova o resto para outros agentes. Validação: após 3 a 7 dias com escopo reduzido, a consistência do output sobe visivelmente.
- ▸ ERRO 2 — CRITÉRIO AUSENTE: Sintoma: FLARE aprova ou rejeita de forma aparentemente aleatória. Causa: o critério de aprovação existe na sua cabeça mas não está documentado no prompt. O agente infere critério de exemplos passados — sem exemplos suficientes, infere errado. Correção: documente no prompt: (1) 5 exemplos de aprovação com motivo de 1 linha, (2) 3 exemplos de rejeição com motivo, (3) 2 exemplos de borda — casos que dependem de contexto. Validação: taxa de aprovação estabiliza em 1 semana.
- ▸ ERRO 3 — VOCÊ COMO GARGALO: Sintoma: 5 ou mais decisões/dia chegam até você que o agente deveria ter tomado sozinho. Causa: o agente não tem autoridade declarada — sabe o que fazer mas não sabe até onde pode ir sem perguntar. Correção: adicione ao prompt: "Você tem autoridade para [liste as decisões]. Para qualquer outra, escalone com motivo em 1 linha. Nunca peça autorização para as decisões dentro do seu escopo." Validação: 2 semanas para estabilizar.
Checklist de validação — 5 perguntas antes de ativar qualquer agente
Use este checklist para qualquer agente novo. Se uma resposta for "não" ou "não sei", o agente não está pronto para operar.
- ▸ PERGUNTA 1 — ESCOPO: Este agente tem 3 responsabilidades ou menos documentadas explicitamente? Se tiver mais de 3, quais são as 3 mais críticas? As outras foram realocadas ou excluídas?
- ▸ PERGUNTA 2 — FENCE RULE: Existe pelo menos 1 coisa que este agente explicitamente NÃO decide documentada no prompt? Está formulada como "Você NÃO decide X — X é responsabilidade de [NOME DO AGENTE RESPONSÁVEL]"?
- ▸ PERGUNTA 3 — CRITÉRIO: Existem pelo menos 5 exemplos de output correto e 3 de output incorreto no prompt? Os exemplos são específicos (texto real) ou apenas conceituais ("algo no tom certo")?
- ▸ PERGUNTA 4 — AUTORIDADE: O prompt declara explicitamente quais decisões este agente toma sem perguntar? Existe regra de escalonamento clara para o que está fora do escopo de autoridade?
- ▸ PERGUNTA 5 — CONECTIVIDADE: Este agente sabe de quem recebe input e para quem entrega output? O prompt nomeia o agente anterior e o próximo na cadeia? Agente sem contexto de cadeia não mantém consistência.
O que fazer com um agente que falhou
Antes de desativar um agente que está entregando mal, responda as 5 perguntas do checklist sobre ele. Na maioria dos casos, você vai identificar o erro em menos de 10 minutos.
Se o Erro 1, corrija o escopo e teste por 3 a 7 dias. Se o Erro 2, adicione os exemplos e teste por 1 semana. Se o Erro 3, declare a autoridade explicitamente e aguarde 2 semanas.
Se depois de corrigir os 3 erros o agente ainda entrega mal, aí é limitação do modelo ou do prompt de base. Na maioria dos casos que já vi, o agente não precisa ser demitido. Precisa de uma posição melhor definida.
Pronto para ver onde está seu gargalo?
Diagnóstico gratuito — descubra as 3 prioridades para o seu sistema de conteúdo.
Fazer diagnóstico →