Akshay analyse l’architecture à 6 couches du code Claude : le modèle n’est qu’un nœud dans une boucle

ChainNewsAbmedia

L’ingénieur IA Akshay Pachaar a publié le 10 mai sur X un schéma complet de l’architecture de Claude Code, en décomposant l’ensemble du système en 6 niveaux et en soulignant que « le modèle n’est qu’un nœud parmi d’autres dans la boucle ». Le post de Pachaar cite son long essai du 6 avril, « The Anatomy of an Agent Harness », dont l’idée centrale est la suivante : si Claude Code « ressemble à de la magie », ce n’est pas le modèle en lui-même, mais la conception méticuleuse du harness.

6 niveaux d’architecture : le modèle n’est qu’un nœud

Les 6 niveaux de Claude Code listés par Pachaar :

Input Layer (couche d’entrée) : gère la gestion des sessions, le contrôle des autorisations et des niveaux de confiance définis via YAML. Tout ordre qui entre dans le modèle passe d’abord par cette couche.

Knowledge Layer (couche de connaissance) : inclut un skill registry, un context compressor (3 niveaux de compression, déclenchement avec un seuil à 92 %), un task graph et un stockage de mémoire inter-session. C’est l’endroit où « l’intelligence » du harness existe, en dehors des poids du modèle.

Execution Layer (couche d’exécution) : délègue l’appel d’outils via un typed registry ; chaque outil a un handler—bash, read, write, grep, glob, revert. Le runtime de streaming prend en charge l’exécution parallèle : le prompt cache réutilise les préfixes stables, et les coûts descendent à 10 %.

Integration Layer (couche d’intégration) : le MCP runtime connecte des serveurs externes (filesystem, git, outils personnalisés). Les outils s’enregistrent vers l’intérieur, tandis que la mémoire est écrite vers l’extérieur dans agent_memory.md.

Multi-Agent Layer (couche multi-agents) : contient un subagent spawner, des teammate mailboxes communiquant via redis pub/sub, un protocole de machine à états finis (IDLE→REQUEST→WAIT→RESPOND), un autonomous board à verrous atomiques, et l’isolation par worktree (chaque tâche dans un git branch indépendant).

Observability Layer (couche d’observabilité) : enveloppe tous les étages avec un bus d’événements et des lifecycle hooks ; un exécuteur en arrière-plan fonctionne de façon non bloquante via un daemon thread.

Au centre se trouve la « master agent loop » (boucle du maître) : perception → action → observation. Anthropic positionne cette boucle elle-même comme un « dumb loop »—toute l’intelligence se fait dans l’inférence du modèle, tandis que le harness ne fait que la planification.

Conception clé : context compressor et isolation worktree

Quelques détails de conception à surveiller :

Context compressor : 3 niveaux de compression, seuil à 92 % : lorsque le contexte se rapproche de 92 % de la capacité, déclenchement d’un résumé et d’une compression, en conservant les décisions d’architecture et les bugs non résolus, et en supprimant les sorties d’outils répétées. Cela fait écho aux « recommandations de context engineering » publiées par Anthropic : constituer le plus petit ensemble de token à plus forte densité d’information, et maximiser la probabilité d’atteindre l’objectif.

Isolation worktree : chaque subagent travaille sur un worktree git distinct et sur une branche indépendante ; lors de la fusion, détection de conflits. Ce design rend possible la modification parallèle de la même base de code par plusieurs agents sans qu’ils se marchent dessus. Parmi les trois modes d’exécution de sous-agents « Fork / Teammate / Worktree » de Claude Code, Worktree est le niveau d’isolation le plus fort.

Prompt cache : coût de 10 % : grâce au cache des préfixes stables (system prompt, définitions d’outils, CLAUDE.md), les appels répétés avec les mêmes préfixes ne coûtent que 10 % des frais standard en token. C’est la clé pour maintenir des coûts maîtrisés sur des tâches de longue durée.

Pourquoi cette analyse a résonné dans la communauté

Le post de Pachaar a obtenu 522 likes et 115 retweets ; dans les commentaires, on voit des retours du type « je croyais que c’était juste un outil CLI », « je pensais que Claude Code = model + accès terminal, je ne savais pas qu’il y avait autant de choses dans la multi-agent layer » et autres. Cela reflète le fait que, pour la plupart des développeurs, la compréhension de Claude Code reste au niveau « une couche CLI emballant l’API Claude », en sous-estimant la complexité du harness engineering.

Pachaar cite la phrase de Vivek Trivedy (de LangChain) comme argument central : « si tu n’es pas le modèle, alors tu es le harness ». Les tests de LangChain sur TerminalBench 2.0—preuve avec les mêmes poids de modèle, en modifiant seulement le harness externe—montrent que le classement passe de la 30e place à la 5e.

Pour les lecteurs d’abmedia, cette analyse fournit un point de référence concret : lorsque vous voyez les différences entre des produits d’agents comme Claude Code, Codex, Gemini Code Assist, la plupart des différences ne viennent pas du modèle lui-même, mais du design du harness : stratégies de gestion du contexte, étendue des outils, boucles de validation, et modes de collaboration multi-agents. La version du modèle une fois mise à niveau, les choix du harness engineering déterminent le niveau de l’expérience produit.

Cet article où Akshay analyse l’architecture en 6 couches de Claude Code : le modèle n’est qu’un nœud de la boucle apparaît pour la première fois sur 鏈新聞 ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Augustus, soutenu par Peter Thiel, obtient l’agrément de l’OCC pour une banque d’IA et de stablecoins

Le démarrage de paiements Augustus a obtenu une approbation conditionnelle de l’Office of the Comptroller of the Currency (OCC) américain pour établir une banque nationale axée sur l’IA et les paiements fondés sur des stablecoins. L’approbation permet à Augustus de s’étendre à son marché américain à partir de ses activités bancaires européennes existantes. La banque nationale proposée d’Augustus est conçue comme une banque de compensation pour l’ère de l’IA, construite pour interagir directement

GateNewsIl y a 4m

B.AI annonce un partenariat stratégique avec CoinAnk pour renforcer les capacités de trading des agents IA

D’après ChainCatcher, l’infrastructure financière d’agents IA B.AI a annoncé un partenariat stratégique avec CoinAnk afin d’offrir aux agents IA des capacités améliorées de prise de décision guidée par la donnée. La collaboration exploitera les analyses de produits dérivés et l’intelligence de marché de CoinAnk pour fournir des signaux de trading permettant des stratégies plus adaptatives et mieux informées, aidant les agents intelligents à prendre de meilleures décisions dans des marchés comple

GateNewsIl y a 7h

Alibaba lance un agent de service client basé sur l’IA pour Xiaomi, le taux de conversion « IA + humain » dépasse pour la première fois le service 100 % humain

Selon le groupe Taobao et Tmall d'Alibaba, l'entreprise a lancé AI Xiaomi le 11 mai, le premier agent de service client de l'industrie e-commerce doté de capacités à la fois avant-vente et après-vente. Des données issues du monde réel montrent qu’après que les marchands ont intégré AI Xiaomi, le taux moyen de transfert vers l’humain baisse de 45 %, tandis que les taux de conversion en collaboration « AI+human » dépassent de plus de 10 % le service client humain pur, marquant la première fois que

GateNewsIl y a 8h

L’agent IA termine une tâche de récompense et gagne 16,88 dollars après avoir brûlé 2 000 dollars de frais de calcul

D’après Beating, le développeur Chris a récemment demandé à son agent AI Codex de gagner 5 dollars. En 22 heures, l’agent a achevé de manière autonome l’ensemble du workflow — en identifiant des vulnérabilités dans le code, en corrigeant des bugs, en communiquant avec les mainteneurs et en vérifiant le paiement — pour finalement gagner 16,88 dollars. Toutefois, les développeurs ont rapidement critiqué l’économie : faire tourner en continu un agent IA haut de gamme pendant 22 heures a consommé en

GateNewsIl y a 12h

Des cadres de Google Cloud et de PayPal : les activités de l’agent IA tourneront sur une piste de paiements crypto

Lors de Consensus Miami, Widmann de Google Cloud et Zabaneh de PayPal ont indiqué que les agents IA ne peuvent pas utiliser des comptes bancaires traditionnels et qu’ils doivent passer par des paiements via la cryptographie. Google a lancé l’accord ouvert AP2, comme base de paiement pour les agents IA, et l’a fait don à la FIDO Foundation ; les agents doivent accéder aux données par fragmentation de clés et ne peuvent pas transférer des fonds seuls. Le PYUSD de PayPal est considéré comme une couche de paiement programmable, et les commerçants doivent disposer de catalogues lisibles par machine. Bien que le trafic des agents IA soit généralement présent, la proportion de commerçants ayant des catalogues lisibles par machine reste faible ; la définition des responsabilités et le problème de l’hébergement multi-parties restent à clarifier.

MarketWhisperIl y a 12h

Google Cloud et PayPal lancent le protocole AP2 avec plus de 120 partenaires ; des dirigeants déclarent que les agents IA fonctionneront sur les rails de paiement crypto

D’après CoinDesk, des dirigeants de Google Cloud et de PayPal ont déclaré aujourd’hui, lors de Consensus, que les agents d’IA fonctionneront sur des rails de paiements crypto en raison de limitations structurelles qui les empêchent d’accéder à des comptes bancaires traditionnels. Le responsable de la stratégie Web3 chez Google Cloud, Richard Widmann, a indiqué que les rails de paiements crypto offrent une « excellente interface de paiement lisible par machine ». Google a lancé le protocole Agent

GateNewsIl y a 16h
Commentaire
0/400
Aucun commentaire