🔒 MENTORIA FUNNEL LABS I.A. · MATERIAL EXCLUSIVO DOS MEMBROS · PROIBIDO COMPARTILHAR, REDISTRIBUIR OU REVENDER
Metodologia · v1.0

A engenharia da Agent Factory.

4 frameworks documentados, pipeline de 7 etapas, arquitetura 6-level. A metodologia que transforma briefing em agente funcional, validado e pronto pra produção.

Os 4 frameworks aplicados

Cada decisão de design da fábrica é ancorada em pesquisa documentada. Sem invenção — só síntese de boas práticas comprovadas.

FRAMEWORK 01

ReAct (Shunyu Yao, ICLR 2023)

Reason + Act interleaved. Agente alterna entre raciocinar (gerar pensamento sobre o estado atual) e agir (executar ferramenta/tool call). Reduz alucinação em 40% comparado a chain-of-thought puro.

Aplicado em: estrutura do nível 4 (Behavior) de todo agente fabricado.

FRAMEWORK 02

Agentic Design Patterns (Andrew Ng)

4 padrões compostáveis: Reflection (auto-crítica), Tool Use (ferramentas externas), Planning (decompor objetivo em sub-tarefas), Multi-agent (coordenação entre agentes).

Aplicado em: create-squad usa Multi-agent Pattern; todo agente tem Reflection no nível 5.

FRAMEWORK 03

Building Effective Agents (Anthropic)

Composable patterns oficiais. Prompt chaining, routing, parallelization, orchestrator-workers, evaluator-optimizer. Documentação oficial da Anthropic, base do Claude Code.

Aplicado em: pipeline da fábrica usa Orchestrator-Workers (factory-chief = orchestrator, demais = workers).

FRAMEWORK 04

Agentic Engineering (Simon Willison)

Práticas pragmáticas. Prompt simples vence prompt complexo. Tools sempre testáveis. Eval scenarios obrigatórios. Quando em dúvida, leia o prompt de volta como se fosse o agente.

Aplicado em: regras do @qa-sentinel e checklists de validação.

A arquitetura 6-level

Todo agente fabricado sai com 6 níveis preenchidos. É a estrutura que diferencia agente "prompt num .md" de agente funcional. Baseada na Hybrid Loader Architecture do Squad Creator Pro.

NÍVEL 01 · LOADER

Como o agente é carregado

Frontmatter Anthropic (name, description, model, tools), trigger conditions (when to use), keywords de ativação, slash command associado. É a "porta de entrada" — sem isso, o Claude Code não sabe quando invocar o agente.

NÍVEL 02 · IDENTITY

Quem o agente É

Persona (background, valores, expertise), voice DNA (jeito de falar, vocabulário, gatilhos), pronouns, exemplos de tom. Agente sem identidade clara = agente que muda de personalidade no meio da conversa.

NÍVEL 03 · CAPABILITIES

O que o agente FAZ

Skills disponíveis, tools/MCPs integrados, slash commands acionáveis, fluxos de trabalho documentados. Cada capacidade tem trigger, input esperado, output garantido.

NÍVEL 04 · BEHAVIOR

Como o agente RACIOCINA

Padrões ReAct (reason → act → observe → reason), Reflection loop (auto-crítica antes de entregar), planning (decompor objetivos), tool use sequence. É aqui que o agente vira "pensante", não só "respondedor".

NÍVEL 05 · CONSTRAINTS

O que o agente NÃO faz

Vetos absolutos, palavras proibidas, situações de escalation, edge cases conhecidos, kill switches. Agente sem constraints = agente que vai inventar quando não souber.

NÍVEL 06 · EXAMPLES + VALIDATION

Como saber se o agente FUNCIONA

3-5 exemplos canônicos de input/output esperado, edge cases documentados, smoke tests rodáveis, eval scenarios mensuráveis. Agente sem examples = agente que ninguém consegue auditar.

O pipeline de 7 etapas

O fluxo end-to-end da fábrica. Cada etapa tem responsável, output e gate de qualidade. Pular etapa = entregar lixo.

#EtapaResponsávelOutputGate
1Briefing@factory-chiefSpec inicial (3 perguntas)Briefing completo? Não → reperguntar
2Research@factory-chiefNotas dos frameworks aplicáveisResearch feito? Não → web search
3Architecture@architect6-level structure preenchida6 níveis OK? Não → completar
4Persona@promptsmithVoice DNA + tom + exemplosVoice consistente? Não → reescrever
5Skill@skillforgerSKILL.md + commands + tasksFrontmatter OK? Não → ajustar
6QA@qa-sentinelScore 0-100 + checklistScore < 80? → REPROVADO
7Delivery@factory-chiefPacote final + instalaçãoQA aprovado? Sim → entregar

Regras absolutas

🚫 Sem briefing, sem fabricação

Pedido vago ("cria um agente legal", "faz um bot") é AUTOMATICAMENTE devolvido pra completar briefing. Não existe agente bom com briefing ruim.

🚫 Sem QA, sem entrega

Score do @qa-sentinel < 80/100 = pacote NÃO sai. Volta pra @architect ou @promptsmith ajustar até passar. Zero exceção.

🚫 Sem invenção de frameworks

Os 4 frameworks aplicados são documentados (papers, blogs oficiais, livros). Se a fábrica precisa aplicar um framework novo, ela faz research primeiro — nunca chuta.

✅ Sempre 6-level

Todo agente sai com os 6 níveis preenchidos. Nunca 4. Nunca 5. Nunca "preencho depois". Nível incompleto = agente reprovado no QA.

✅ Sempre 3+ examples

Mínimo 3 exemplos canônicos input/output em todo agente. Sem examples não dá pra auditar — e tudo que não dá pra auditar a fábrica não entrega.

O que esta fábrica NÃO é

❌ Não é gerador de prompt

Você não digita "quero um prompt sobre X" e ela cospe um parágrafo. Ela fabrica AGENTE — que é estrutura, comportamento, validação, integração. Prompt é nível 1 de 6.

❌ Não é wrapper de ChatGPT

Os agentes fabricados rodam dentro do Claude Code, com tools nativos (Bash, Read, Edit, MCPs). Não tem dependência de API externa. Roda local.

❌ Não inventa frameworks

Tudo que a fábrica aplica é documentado (Anthropic, Andrew Ng, Shunyu Yao, Simon Willison). Se um framework novo chega, ela faz research antes de aplicar.

❌ Não pula QA

Não importa quão urgente é o pedido — todo agente passa pelo @qa-sentinel. Score < 80 = volta pra reescrita. Sem exceção, nem pra mim.