tech 6 min • advanced

Les architectures Copilot et Agentic divergent : le contexte étendu de Claude Code face à la boucle d'exécution d'OpenHands

Une comparaison technique approfondie de l'association aux dépôts, des chaînes d'outils, de la vérification et des limites de performance entre deux systèmes contrastés

Par AI Research Team
Les architectures Copilot et Agentic divergent : le contexte étendu de Claude Code face à la boucle d'exécution d'OpenHands

La divergence des architectures Copilot et Agentic: Ancrage au long contexte de Claude Code versus Boucle d’exécution d’OpenHands

Une comparaison technique approfondie de l’ancrage des dépôts, des chaînes d’outils, de la vérification et des enveloppes de performance entre deux systèmes contrastés.

Deux modèles très différents pour le développement assisté par ordinateur se sont cristallisés: le copilote qui raisonne sur un large contexte de travail et propose des modifications sûres et vérifiables, et l’agent qui édite, exécute et vérifie dans un environnement d’exécution contrôlé. Claude Code incarne le premier avec un raisonnement au long contexte, un ancrage au dépôt grâce aux Projets, et un flux de travail d’application de diff au sein de l’IDE. OpenHands (anciennement OpenDevin) illustre le second avec des outils de premier plan pour l’éditeur, le shell, et le navigateur, pilotant les modifications multi‑fichiers et l’exécution de commandes dans des environnements sandboxés.

Cette divergence est importante car elle définit les limites du système, les garanties de vérification, et les responsabilités opérationnelles. Une approche s’ancre dans l’ergonomie de l’IDE, la révision humaine, et les capacités de modèle gérées; l’autre élève l’exécution comme une primitive de premier ordre, faisant de la validation en boucles et du choix du modèle une partie de la responsabilité du déployeur. Cet article cartographie les deux architectures à travers la gestion du contexte, l’invocation d’outils, les mécanismes de changement, les voies de vérification, les enveloppes de performance, et les implications de bancs d’essai.

Les lecteurs apprendront comment Claude Code ancre les modèles sur de grandes bases de code grâce aux Projets et Artefacts, pourquoi OpenHands traite l’exécution comme sa boucle principale, et comment la vérification, la collaboration, et la sécurité diffèrent en conséquence. L’analyse se termine par des conseils de bonnes pratiques pour sélectionner, combiner, et évaluer ces systèmes dans de véritables dépôts.

Détails d’Architecture et de Mise en Œuvre

Rôles et limites du système

  • Claude Code se positionne comme un workflow copilote assisté livré via une extension officielle de VS Code et une expérience web. Il fournit un chat en ligne, un raisonnement conscient des dépôts, et des diff suggérés que les développeurs appliquent explicitement. Le système propose l’Utilisation d’Outils via une API pour des appels de fonctions structurés, mais l’interaction utilisateur par défaut reste humaine‑dans‑la‑boucle.
  • OpenHands adopte une position agentique. Il expose un Éditeur pour les modifications multi‑fichiers, un Shell pour exécuter des commandes et des tests, et un Navigateur pour la collecte d’informations externes. Ces outils fonctionnent dans des environnements containerisés ou sandboxés où l’agent planifie, édite, exécute, et itère.

La ligne de démarcation est claire: Claude Code évite par défaut l’exécution autonome et se concentre sur les éditions et conseils médiatisés par l’IDE; OpenHands élève l’exécution comme une capacité centrale et suppose une action itérative sous un runtime contrôlé par le système.

Ancrer le modèle sur une base de code

  • Claude Code repose sur des entrées à long contexte et un ancrage de dépôt via les Projets. Les Projets organisent les dépôts et les documents connexes, créant ainsi de la continuité et une meilleure récupération à travers les sessions. Dans l’application web, les Artefacts agissent comme des surfaces de travail persistantes et visibles pour le code et les sorties structurées. Ensemble, les Projets et les Artefacts créent une mémoire transparente et inspectable: les développeurs voient l’état de travail du modèle au lieu de le supposer.
  • OpenHands maintient un état de travail interne et un mappage de fichiers tandis que l’agent édite et exécute le code. Le contexte est accumulé non seulement en tokens mais aussi en artefacts d’exécution—diffs de fichiers, sorties de commandes, et résultats de tests à l’intérieur du sandbox—informant les actions ultérieures.

Les deux systèmes visent à garder le modèle “sur les rails” du dépôt. Claude repose sur un ancrage style récupération plus des artefacts visibles; OpenHands repose sur les sorties d’outils et un état interne construit à travers l’exécution.

Chaînes d’outils et modèles d’action

  • L’API de Claude Code offre une Utilisation d’Outils structurée qui permet aux intégrateurs de définir des fonctions contrôlées que le modèle peut appeler. En pratique, l’expérience VS Code ou l’application web avec Artefacts reste l’interface principale, et les éditions sont proposées sous forme de diff pour approbation humaine.
  • OpenHands considère l’Éditeur, le Shell, et le Navigateur comme des outils de première classe. L’agent compose ces outils pour mettre en œuvre des plans: modifier des fichiers, exécuter des tests et des commandes, consulter le web lorsque cela est activé, et répéter jusqu’à ce que les critères soient satisfaits ou qu’une révision soit demandée.

La chaîne d’outils de Claude est façonnée par la gouvernance et l’ergonomie de l’IDE; la chaîne d’outils d’OpenHands est conçue pour l’autonomie et la composabilité à l’intérieur d’un sandbox.

Mécanismes d’application des changements

  • Claude Code présente les changements sous forme de diff suggérés. Le développeur les examine et les applique, maintenant un historique d’audit clair et s’assurant que les changements ne se concrétisent que par un consentement humain explicite.
  • OpenHands effectue des modifications multi-fichiers directement dans son sandbox, souvent sur une branche dédiée. Avec des identifiants configurés, il peut valider des changements et ouvrir des PRs de brouillon dans le cadre de l’exécution de l’agent, laissant des journaux et artefacts complets du processus.

Cette différence sous-tend deux expériences utilisateur distinctes: une UX de recommandation-et-application dans l’IDE versus un agent éditant et préparant une PR dans un runtime contrôlé.

Exécution, Vérification, et Collaboration

Voies de vérification

  • Claude Code met l’accent sur la révision humaine et l’itération guidée. L’assistant aide à générer des tests, expliquer les échecs, et esquisser des corrections, mais l’exécution reste typiquement sous le contrôle du développeur (dans l’IDE, le terminal, ou le CI). L’Utilisation d’Outils peut intégrer des actions contrôlées de manière programmatique, pourtant le workflow par défaut privilégie la sécurité et la supervision.
  • OpenHands adopte une itération test‑driven et commande‑driven. L’agent exécute des analyseurs statiques, des tests unitaires, ou d’autres commandes, inspecte les sorties, et affine les éditions. La validation est imposée par l’exécution réelle du programme, réduisant la dépendance à un raisonnement purement prédictif et permettant une correction en boucle fermée dans le sandbox.

L’histoire de la vérification découle naturellement de l’architecture: Claude Code priorise la validation humaine; OpenHands priorise des boucles autonomes qui culminent en étapes d’approbation humaine.

Primitives de collaboration au niveau du système

  • Claude Code aide dans les workflows Git existants. Il rédige les descriptions de PR, génère des commentaires de révision, et propose des messages de validation, tandis que les Projets conservent l’ancrage cross‑session. La collaboration reste centrée sur les branches possédées par des humains et les révisions.
  • OpenHands automatise les primitives de collaboration. Il peut créer des branches, valider des changements, et ouvrir des PRs de brouillon comme sorties d’une tâche d’agent. Ces actions présument une révision humaine avant intégration, mais optimisent la préparation en emballant les diffs, journaux, et justifications du cycle de l’agent.

Les deux systèmes visent à améliorer la collaboration, mais Claude fonctionne comme un copilote/relecteur; OpenHands agit comme une station de travail de développement sous contrôle d’agent qui vous remet une PR prête à être révisée.

Sécurité, Stratégie de Modèle, et Enveloppes de Performance

Sécurité et confinement de l’exécution

  • Claude Code fonctionne à l’intérieur de limites d’entreprise bien comprises. Les options d’utilisation des données et les contrôles de rétention sont documentés, et les organisations peuvent déployer via des partenaires cloud tels qu’Amazon Bedrock pour s’aligner sur les exigences régionales, réseaux, et de conformité. L’exécution est régie par l’environnement du développeur; l’assistant n’exécute pas couramment des commandes de manière autonome.
  • OpenHands est auto-hébergeable et open‑source (Apache‑2.0). Il isole l’exécution dans des conteneurs ou des VMs, aidant la reproductibilité et limitant les effets secondaires. Lorsqu’il est couplé avec des modèles locaux, le code et les invites restent sur l’infrastructure interne; lorsqu’il est couplé avec des APIs commerciales, le traitement des données respecte les politiques du fournisseur sélectionné.

Dans la pratique, Claude met l’accent sur une gouvernance gérée par le fournisseur et un contrôle à côté de l’IDE; OpenHands met l’accent sur une opération inspectable, containerisée et le contrôle du propriétaire de déploiement.

Stratégie de modèle et responsabilité de configuration

  • Claude Code est alimenté par des modèles de la série Claude 3 tels que Claude 3.5 Sonnet, mettant l’accent sur la qualité de codage et de raisonnement et soutenant des entrées à long contexte. Les Projets et pièces jointes fournissent un ancrage de style récupération, et les Artefacts exposent une mémoire de travail visible dans l’application web. La performance et la latence dépendent du niveau du modèle et de la taille du contexte, avec des SLA d’entreprise disponibles via la plateforme et les canaux partenaires.
  • OpenHands est indépendant du modèle. Le déployeur choisit un backend—APIs commerciales ou modèles ouverts auto-hébergés—déterminant la longueur du contexte, la latence, et la fiabilité. L’enveloppe de qualité du système repose donc sur la sélection et la configuration du modèle, plus comment la boucle d’outils est ajustée pour la base de code cible.

Le compromis est simple: Claude offre des modèles gérés avec des primordiaux d’ancrage intégrés; OpenHands offre de la flexibilité au coût de la responsabilité de configuration.

Considérations de performance et scalabilité

  • Claude Code exploite le long contexte pour raisonner sur des dépôts substantiels lorsqu’il est ancré via les Projets et la visibilité de l’espace de travail. Cela permet des refactoring multi-fichiers et des Q&A conscients du dépôt sans orchestration de runtime personnalisée. Des mesures précises de bout en bout ne sont pas disponibles ici, mais la latence et le débit évoluent typiquement avec le niveau du modèle choisi et la taille de la demande/contexte.
  • OpenHands évolue en distribuant les exécutions d’agent dans des environnements sandboxés qui peuvent être répliqués et audités. La performance dépend du backend du modèle et du coût de l’exécution des commandes et tests dans le conteneur. Encore une fois, des mesures précises ne sont pas disponibles; le débit et la latence dépendent de l’infrastructure, du choix du modèle, et de la complexité de la boucle de tâches.

En bref, Claude échange la complexité de l’orchestration pour le raisonnement au long contexte et la récupération; OpenHands échange le contexte lourd en tokens pour des cycles d’exécution vérifiables et des sandboxes reproductibles.

Implications de Bancs d’Essai et d’Évaluation

Les cultures d’évaluation publique diffèrent dans les deux approches:

  • Claude Code est généralement évalué sur des dépôts privés où les Projets et l’ancrage de l’espace de travail capturent le contexte spécifique au domaine et les workflows des développeurs. Ces essais sont spécifiques au dépôt et souvent non directement comparables entre les organisations. Mesures spécifiques non disponibles.
  • OpenHands et son prédécesseur OpenDevin sont régulièrement évalués sur SWE‑bench et SWE‑bench Verified, qui mesurent la capacité d’un agent à planifier des changements, éditer du code, et valider les résultats à travers de réels dépôts. Les résultats varient selon le backend LLM et la configuration des outils. Mesures comparables spécifiques non disponibles ici.

Pour des décisions comparables, les équipes devraient exécuter les deux systèmes contre leurs propres dépôts et pratiques CI. Les forces de Claude apparaissent lorsque les Projets et les Artefacts sont utilisés pour maintenir le contexte et exposer les surfaces de travail; les forces d’OpenHands émergent lorsque les boucles d’agent sont autorisées à exécuter des tests et itérer à l’intérieur d’un sandbox avec des passes d’approbation humaine claires.

Tableaux de Comparaison

Contrastes architecturaux

DimensionClaude CodeOpenHands
Rôle principalAssistant style copilote; éditions humaine‑dans‑la‑boucleDéveloppeur agentique; exécute, valide et itère
Ancrage des dépôtsEntrées à long contexte, récupération de Projets, Artefacts visiblesÉtat interne de l’agent, sorties d’outils (Éditeur/Shell/Navigateur) dans le sandbox
Modèle d’outillageAPI d’Utilisation d’Outil structurée; propositions de diff centrées sur l’IDEÉditeur/Shell/Navigateur première classe; composition autonome d’outils
Mécanique de changementDiff suggérés; à appliquer dans l’IDEÉditions multi‑fichiers dans sandbox; branche + automatisation de PR de brouillon
VérificationValidation par révision humaine; appels d’outil contrôlés optionnelsBoucles test‑driven et commande‑driven avec retour d’information
ExécutionEnvironnement détenu par le développeur; pas de commandes autonomes par défautIsolation de runtime containerisé avec exécution de programme
Position du modèleClaude série 3 géré, long‑contexte, récupérationIndépendant du modèle; le déployeur sélectionne le backend

Implications opérationnelles

DomaineClaude CodeOpenHands
CollaborationTexte de PR de brouillon, commentaires de révision, messages de validationCréation de branche, validations, PRs de brouillon
Sécurité/GouvernanceContrôles d’entreprise; options de déploiement partenaireAuto-hébergeable; isolation container; Apache‑2.0
Vue de performanceLatence/débit façonnés par niveau de modèle + contexte; mesures varientLatence/débit façonnés par backend + exécution sandbox; mesures varient
Bancs d’essaiEssais spécifiques au dépôt; évaluations privéesÉvaluations agentiques SWE‑bench/Verified; dépendant du backend

Meilleures Pratiques 🔧

  • Commencez avec des limites claires: utilisez Claude Code pour une assistance centrée sur l’IDE et des diff vérifiables; utilisez OpenHands lorsque vous avez besoin d’une boucle d’exécution qui exécute des tests et des commandes en isolation.
  • Ancrez efficacement: activez les Projets Claude pour maintenir le contexte du dépôt à travers les sessions et surveillez les Artefacts comme surface de travail visible; configurez les outils Éditeur/Shell/Navigateur d’OpenHands pour refléter votre régime CI/test.
  • Validez les fusions: quel que soit le système, conservez des étapes d’approbation humaine avant les fusions en production. Pour OpenHands, exigez des PRs de brouillon et des journaux de l’exécution du sandbox; pour Claude, maintenez les révisions de diff et les exécutions de test ciblées.
  • Choisissez les modèles délibérément: avec Claude, sélectionnez le niveau de série 3 approprié aligné sur la taille du contexte et les attentes en matière de latence; avec OpenHands, évaluez plusieurs backends LLM sous votre infrastructure pour équilibrer la confidentialité, la rapidité, et la fiabilité.
  • Évaluez sur vos dépôts: reproduisez des tâches de votre backlog dans les deux systèmes, capturant le temps jusqu’à la complétion, les taux de défaut, et l’effort de révision. Les benchmarks publics fournissent une base pour les systèmes agentiques, mais votre base de code et vos workflows sont décisifs.

Conclusion

Deux philosophies définissent désormais la frontière du développement assisté par l’IA. Claude Code optimise pour une assistance fiable, consciente des dépôts avec des surfaces de travail transparentes, des diff suggérés, et une invocation d’outils gouvernée. OpenHands optimise pour l’autonomie à travers l’exécution: il édite, exécute, valide, et présente des PRs de brouillon depuis des sandboxes reproductibles. La conséquence pratique n’est pas seulement stylistique; elle détermine comment vous ancrez le contexte, où la vérification vit, qui possède la configuration du modèle, et comment vous évoluez.

Points clés à retenir:

  • Claude Code: ancrage au long contexte via les Projets et Artefacts; diff suggérés; révision humaine en premier.
  • OpenHands: chaîne d’outils Éditeur/Shell/Navigateur; exécution sandboxée et boucles test‑driven; automatisation de PRs de brouillon.
  • Les postures de sécurité diffèrent: gouvernance à côté de l’IDE versus isolation containerisée sous votre contrôle.
  • La performance dépend du modèle et du contexte (Claude) versus le modèle et la boucle runtime (OpenHands); mesures spécifiques indisponibles.
  • Les cultures de benchmarking divergent: essais spécifiques au dépôt versus évaluations SWE‑bench/Verified publiques.

Prochaines étapes: pilotez les deux systèmes contre des tâches représentatives dans votre dépôt, connectez les Projets et Artefacts Claude pour un ancrage profond, et configurez le sandbox et la chaîne d’outils d’OpenHands pour refléter votre CI. Appliquez des étapes de révision strictes dans les deux cas. À l’avenir, attendez-vous à une convergence dans les flux de travail hybrides: un copilote gouverné pour les itérations quotidiennes augmenté par des exécutions agentiques dans des sandboxes pour des refactorisations par lots et des changements test‑driven — chacun évalué là où il performe le mieux. 🚀

Sources & Références

docs.anthropic.com
Claude for VS Code Documents the IDE integration, repo‑aware assistance, and apply‑diff workflow central to Claude Code’s copilot architecture.
www.anthropic.com
Claude 3.5 Sonnet and Artifacts Introduces Claude 3.5 Sonnet and Artifacts, supporting claims about long‑context reasoning and visible working surfaces.
docs.anthropic.com
Tool Use (Anthropic API Docs) Details structured function calling that underpins Claude’s controlled tool invocation model.
docs.anthropic.com
Projects (Anthropic Docs) Explains repository grounding via Projects and context continuity across sessions for Claude Code.
docs.anthropic.com
Data Usage and Privacy Supports statements on Claude’s data usage defaults, retention controls, and enterprise governance.
aws.amazon.com
Amazon Bedrock (Anthropic Models on AWS) Substantiates deployment via a cloud partner for governance, regionality, and enterprise alignment.
openhands.dev
OpenHands Website Provides an overview of OpenHands’ architecture, tools (Editor, Shell, Browser), and agentic workflows.
github.com
OpenHands GitHub (README) Details model‑agnostic design, sandboxed execution, and capabilities like branching and draft PR creation.
github.com
OpenHands License (Apache‑2.0) Confirms OpenHands’ open‑source license for claims about self‑hosting and auditability.
github.com
OpenDevin GitHub Establishes lineage from OpenDevin to OpenHands for context on the project’s evolution and focus.
www.swebench.com
SWE‑bench Leaderboard Supports references to public evaluations of agentic systems like OpenHands on SWE‑bench and SWE‑bench Verified.

Advertisement