
Anthropic est le seul grand laboratoire d'IA à publier ouvertement les system prompts de ses modèles en production. Une transparence rare qui permet à chaque développeur et utilisateur avancé de comprendre exactement quelles instructions guident le comportement du modèle. Le 16 avril 2026, Claude Opus 4.7 a été publié avec une mise à jour significative du system prompt par rapport à Opus 4.6 (sorti le 5 février 2026). Simon Willison — un des observateurs les plus rigoureux de l'écosystème IA — a reconstitué un historique Git des system prompts d'Anthropic depuis Claude 3, et publié son diff entre 4.6 et 4.7. Voici ce qui a vraiment changé et pourquoi ça compte.
Le changement le plus notable : plus de clause Trump
Opus 4.6 contenait un élément inhabituel dans son system prompt : une clarification explicite indiquant que « Donald Trump est le président actuel des États-Unis et a été inauguré le 20 janvier 2025 ». Cette précision était nécessaire car, sans elle, la date de coupure de connaissance du modèle combinée à sa connaissance de la précédente élection pouvait générer des confusions.
Cette clause a disparu dans Opus 4.7 — et ce n'est pas un oubli. C'est le signe que le modèle a une date de coupure de connaissance fiable post-janvier 2026, donc il sait de lui-même qui est président sans avoir besoin d'une correction manuelle dans le prompt. Un changement technique en apparence anodin, mais qui illustre comment Anthropic calibre ses modèles et corrige leurs angles morts via le system prompt.
La plateforme s'appelle maintenant "Claude Platform"
Le system prompt d'Opus 4.7 remplace l'appellation "developer platform" par "Claude Platform" — une harmonisation de la marque qui coïncide avec les annonces produit d'Anthropic ce mois d'avril 2026. La liste des outils Claude mentionnés dans le prompt s'étend également pour inclure de nouveaux produits lancés depuis février.
Ce que le system prompt ne dit pas
Simon Willison lève un point crucial : les system prompts publiés par Anthropic ne sont pas la totalité de l'histoire. Les descriptions d'outils fournies au modèle — qui constituent possiblement la partie la plus déterminante du comportement de l'agent — ne sont pas incluses dans ces publications. Ce que vous lisez dans l'archive Anthropic est nécessaire mais pas suffisant pour comprendre intégralement comment le modèle se comporte.
C'est une limite importante à garder à l'esprit. La transparence d'Anthropic est réelle et supérieure à celle de ses concurrents, mais elle reste partielle. Les développeurs qui cherchent à anticiper précisément le comportement du modèle doivent compléter leur lecture du system prompt par des tests empiriques.
Claude Opus 4.7 : ce qui change vraiment dans les performances
Au-delà du system prompt, Opus 4.7 apporte des améliorations de fond documentées par Anthropic. Le score SWE-bench Verified passe de 80,8 % (Opus 4.6) à 87,6 % — une progression significative sur les tâches de coding réelles. Sur CursorBench, le benchmark qui évalue les tâches de coding en conditions IDE réelles, Opus 4.7 passe de 58 % à 70 %, soit 12 points de progression.
La résolution d'image maximale triple presque : de 1568 pixels à 2576 pixels sur le grand côté, ce qui change radicalement les capacités d'analyse visuelle pour les documents, plans, et captures d'écran haute résolution.
Le changement qui va casser vos prompts existants
C'est le point le plus pratique et le moins médiatisé : Opus 4.7 suit les instructions beaucoup plus littéralement que 4.6. Là où 4.6 interprétait les directives vagues et comblait les lacunes, 4.7 prend vos instructions exactement au pied de la lettre. Anthropic documente cette rupture explicitement : « le modèle ne généralisera pas silencieusement une instruction d'un élément à un autre, et n'inférera pas les demandes que vous n'avez pas faites. »
En pratique, si vous avez des prompts de production buildés pour Opus 4.6 qui comptaient sur une interprétation souple ou sur des généralisations implicites, ces prompts peuvent donner des résultats différents ou inattendus sous 4.7. Des développeurs sur HN et Reddit ont reporté ce pattern dans les 48 heures suivant la sortie : agents qui font moins d'appels d'outils, réponses plus directes et parfois trop laconiques, et certaines requêtes qui retournent des erreurs 400. La recommandation : tester vos prompts de production avant de migrer vers 4.7.
Le nouveau niveau d'effort : xhigh par défaut dans Claude Code
Opus 4.7 introduit le niveau d'effort xhigh qui alloue jusqu'à 100 000 tokens de réflexion. Anthropic indique que xhigh à 100k tokens sur Opus 4.7 dépasse déjà les performances d'Opus 4.6 au maximum de 200k tokens. Dans Claude Code, le niveau par défaut a été relevé à xhigh pour tous les plans. La contrepartie directe : cela coûte plus cher à l'usage. Un nouveau tokenizer fait par ailleurs que le même texte peut coûter jusqu'à 35 % de tokens supplémentaires. À intégrer dans vos estimations de coût si vous migrez des workloads existants.