Anthropic a lancé Claude Sonnet 5, un nouveau modèle d'IA qui, selon la société, rapproche les systèmes de niveau Sonnet de Claude Opus 4.8 dans les tâches d'agents.
Anthropic a décrit Claude Sonnet 5 comme son « modèle Sonnet le plus agentique à ce jour », indiquant qu'il peut planifier, utiliser des navigateurs et des terminaux, et travailler avec plus d'autonomie que les versions Sonnet précédentes.
La société a indiqué que le modèle réduit l'écart avec Claude Opus 4.8 tout en maintenant un prix affiché plus bas. Sonnet 5 est tarifé à 3 $ par million de tokens en entrée et 15 $ par million de tokens en sortie, contre 5 $ et 25 $ pour Opus 4.8.
Anthropic propose un tarif d'introduction jusqu'au 31 août 2026, avec une entrée à 2 $ par million de tokens et une sortie à 10 $ par million de tokens. La tarification standard reprendra après cette date.
La société a également indiqué qu'elle a augmenté les limites de débit pour Chat, Cowork, Claude Code et la plateforme Claude, car les modes à « niveau d'effort » plus élevé peuvent consommer davantage de tokens.
À lire également : OpenAI corrige Codex après que des développeurs ont épuisé leurs limites hebdomadaires en 2 jours
La question du prix n'est pas simple. Anthropic a indiqué que Sonnet 5 utilise un nouveau tokenizer, similaire au changement introduit avec Claude Opus 4.7, et que la même entrée peut correspondre à environ 1,0 à 1,35 fois plus de tokens.
Ce changement aide à expliquer pourquoi certains développeurs ont remis en question le fait que Sonnet 5 soit moins cher en pratique. Artificial Analysis a estimé le coût de fonctionnement du modèle à 2,29 $ par tâche, soit environ deux fois celui de Sonnet 4.6 et environ 15 % au-dessus d'Opus 4.8.
L'examen de sécurité d'Anthropic a révélé des taux d'hallucination et de comportement obséquieux inférieurs à ceux de Sonnet 4.6. La société a également indiqué que Sonnet 5 rejetait les requêtes malveillantes plus efficacement et résistait mieux aux attaques par injection de prompt dans les environnements d'Agents d'IA autonomes.
Le modèle a tout de même affiché un taux de comportement inapproprié plus élevé qu'Opus 4.8 et Claude Mythos Preview lors de l'audit de comportement automatisé d'Anthropic. Anthropic a précisé qu'il n'avait pas spécifiquement entraîné Sonnet 5 pour des travaux de cybersécurité et a activé les protections de sécurité réseau par défaut.
Les modèles Sonnet ont contribué à définir le marché naissant des Agents d'IA, notamment à travers Claude Sonnet 3.5, 3.6 et 3.7. Les progrès plus récents s'étaient orientés vers les systèmes de niveau Opus, ce qui rend le rôle principal de Sonnet 5 clair : ramener un comportement d'agent plus performant dans une classe de modèles plus légère.
Lire ensuite : Les marchés baissiers crypto prennent fin lorsque 5 forces s'alignent, selon Fidelity

