O engenheiro de IA Akshay Pachaar publicou no X, a 10 de maio, um diagrama completo da arquitetura do Claude Code, mostrando como todo o sistema é decomposto em 6 níveis e destacando que «o modelo é apenas um dos nós no ciclo». A publicação de Pachaar cita o seu ensaio de longa extensão de 6 de abril, «The Anatomy of an Agent Harness», e a ideia central é que o Claude Code parece «magia» não por causa do próprio modelo, mas sim devido ao design meticuloso da engenharia do harness.
Arquitetura em 6 camadas: o modelo é apenas um dos nós
O Claude Code em 6 camadas organizado por Pachaar:
Input Layer (camada de entrada): responsável por gerir a sessão, o controlo de permissões e a definição de níveis de confiança em YAML. Qualquer instrução que entre no modelo passa primeiro por esta camada.
Knowledge Layer (camada de conhecimento): inclui um skill registry, um context compressor (compressão em 3 níveis, com disparo num limiar de 92%), um task graph e armazenamento de memória entre sessões. É aqui que existe a «inteligência» do harness, independente dos pesos do modelo.
Execution Layer (camada de execução): faz despachar chamadas de ferramentas via typed registry, com um handler por ferramenta — bash, read, write, grep, glob, revert. O runtime de streaming suporta execução paralela, o prompt cache reutiliza prefixos estáveis, reduzindo o custo para 10%.
Integration Layer (camada de integração): o MCP runtime liga-se a servidores externos (filesystem, git e ferramentas personalizadas). As ferramentas registam-se para dentro, e a memória é escrita para fora no agent_memory.md.
Multi-Agent Layer (camada multi-agente): inclui subagent spawner, teammate mailboxes que comunicam via redis pub/sub, um protocolo de máquina de estados finitos (IDLE→REQUEST→WAIT→RESPOND), um autonomous board com lock atómico e isolamento por worktree (cada tarefa em branch git independente).
Observability Layer (camada de observabilidade): envolve todas as camadas com uma event bus de agregação e lifecycle hooks; um executor em segundo plano opera em modo daemon thread, sem bloqueio.
No centro está o «master agent loop» (ciclo do agente principal): percecionar → agir → observar. A própria Anthropic posiciona este ciclo como um «dumb loop» (ciclo estúpido) — toda a inteligência está na inferência do modelo; o harness apenas faz a orquestração.
Design-chave: context compressor e isolamento por worktree
Alguns detalhes de design que valem a pena destacar:
Context compressor com compressão em 3 níveis e limiar de 92%: quando o contexto se aproxima de 92% da capacidade, dispara-se uma sumarização e compressão, preservando decisões de arquitetura e bugs ainda não resolvidos, e descartando saídas repetidas das ferramentas. Isto remete para as «context engineering guidelines» publicadas pela Anthropic: encontrar o conjunto mínimo de tokens com maior sinal, maximizando a probabilidade de atingir objetivos.
Isolamento por worktree: cada subagent trabalha num worktree git independente e numa branch independente, fazendo deteção de conflitos ao fazer merge. Esta arquitetura torna possível a modificação paralela da mesma base de código por vários agentes, sem se atropelarem. Entre os três modos de execução de subagentes — «Fork / Teammate / Worktree» — o Worktree é o nível de isolamento mais forte.
Custo de 10% no prompt cache: através de cache de prefixos estáveis (system prompt, definições de ferramentas, CLAUDE.md), chamadas repetidas com o mesmo prefixo pagam apenas 10% do custo padrão em tokens. É uma peça-chave para manter os custos controlados em tarefas longas em sessão.
Porque é que esta análise teve eco na comunidade
A publicação de Pachaar recebeu 522 gostos e 115 retweets; na secção de comentários surgiram respostas como «Achei que era só uma ferramenta CLI», «Achei que o Claude Code era igual a model + acesso ao terminal, não sabia que a multi-agent layer tinha tanta coisa a correr» e outras. Isto reflete que a maioria dos programadores ainda entende o Claude Code como «a API da Claude com uma camada CLI», subestimando a complexidade da engenharia do harness.
Pachaar usa como argumento principal uma frase de Vivek Trivedy, da LangChain: «Se não és o modelo, então és o harness.» Os testes da LangChain no TerminalBench 2.0 provam isto — com os mesmos pesos do modelo, mudando apenas o harness periférico, a classificação salta do 30.º lugar para o 5.º.
Para os leitores da abmedia, esta análise fornece um ponto de referência concreto: quando virem diferenças entre produtos de agentes como Claude Code, Codex, Gemini Code Assist, na verdade a maioria das diferenças não está no próprio modelo, mas sim no design do harness — estratégia de gestão de contexto, âmbito das ferramentas, ciclos de validação e modos de colaboração multi-agente. Quando a versão do modelo sobe, são as escolhas do harness que determinam o nível da experiência do produto.
Este artigo com a análise de Akshay sobre a arquitetura do Claude Code em 6 camadas: o modelo é apenas um nó no ciclo. Primeira aparição em Cadeia de Notícias ABMedia.
Related Articles
Augustus, apoiado por Peter Thiel, obtém aprovação da OCC para banco de IA e stablecoins
A B.AI anuncia uma parceria estratégica com a CoinAnk para melhorar as capacidades de negociação com agentes de IA
A Alibaba lança o agente de atendimento ao cliente com IA da Xiaomi, com conversão “IA+Humano” superior ao atendimento puramente humano pela primeira vez
Agente de IA conclui missão de recompensa, ganha 16,88 dólares após queimar 2.000 dólares em custos de computação
Executivos da Google Cloud e da PayPal: o comércio com agentes de IA vai funcionar numa via de pagamentos cripto
A Google Cloud e a PayPal lançam o protocolo AP2 com 120+ parceiros; executivos dizem que os agentes de IA vão operar em redes de pagamentos cripto