Brief quotidien · Coût token · Workflow agent

L’économie des tokens IA, racontée comme un briefing terrain.

Un guide clair et lisible sur le vrai coût de l’IA : prix des modèles, workflows de coding agents, signaux de benchmark et façons concrètes d’utiliser moins de tokens.

Pensé d’abord pour les humains, mais structuré pour que les agents puissent lire, citer et réutiliser en sécurité.

Commencer par 15 angles JSON agent llms.txt

Veille prixEntrée, sortie, cache, batch, contexte, retry.

Coût agentClaude Code, Codex, Cursor, Aider, OpenCode.

Économie de tokensPrompt caching, routage, compression, discipline de contexte.

Angles de départ

De haut en bas, chaque carte donne le titre, la date, le résumé et le signal d’ouverture pour décider vite.

2026-07-03·Simon Willison

Le jugement de Fable

Les économies viennent aussi de moins de mauvais loops, pas seulement de tokens moins chers.

Une leçon de l’équipe Claude Code : un meilleur jugement réduit les reprises, les interventions et les boucles coûteuses.

Claude Codejugement agentworkflow

Lire la source →

2026-07-02·Simon Willison

Sortie : llm-coding-agent 0.1a0

Un agent de code minimal montre où les tokens sont dépensés.

Cet agent LLM cartographie la planification, la lecture de fichiers, l’édition et la vérification comme étapes consommatrices de tokens.

coding agentLLMPython

Lire la source →

2026-07-02·Simon Willison

Utiliser DSPy pour améliorer les prompts SQL de Datasette Agent

L’optimisation de prompts doit être évaluée, pas ressentie.

Le projet utilise DSPy pour tester et raffiner les prompts système d’un agent SQL en lecture seule.

DSPyprompt systèmeévaluation

Lire la source →

2026-07-03·Latent Space

Andrew Qu de Vercel : les agents comme nouveau logiciel

Les sites lisibles par agents deviennent une surface produit.

Vercel explique son framework eve et l’importance des skills, sandboxes et sites lisibles par agents.

agentsVercelsites pour agents

Lire la source →

2026-07-01·Latent Space

Comment Cursor déploie l’IA en entreprise

À l’échelle, le vibe coding devient un sujet de budget d’équipe.

Les équipes terrain de Cursor aident les entreprises à créer des usines logicielles basées sur des agents.

Cursorusine logicielleIA entreprise

Lire la source →

2026-06-30·Simon Willison

Nouveautés de Claude Sonnet 5

Un nouveau modèle change les choix par défaut, les coûts agent et les taux d’échec.

Après une mise à jour, les docs développeur sont plus utiles que le marketing pour décider du modèle par défaut.

ClaudeSonnetmise à jour modèle

Lire la source →

2026-06-30·Hugging Face / IBM Research

ScarfBench : benchmark d’agents pour migration Java entreprise

Les benchmarks agent se rapprochent de vraies migrations d’entreprise.

IBM Research teste les agents sur des migrations de frameworks Java, plus proches des tâches réelles.

benchmarkAI agentsmigration Java

Lire la source →

2026-06-29·Simon Willison

Ornith-1.0 : LLM auto-scaffold pour agentic coding

Les modèles de code open-weight peuvent changer l’équation de coût API.

Le modèle MIT de DeepReinforce propose plusieurs variantes dense et MoE pour le codage agentique.

open weightsagentic codingmodèle code

Lire la source →

2026-06-26·Latent Space / AINews

OpenAI signale une forte hausse des tokens de sortie Codex

La croissance des tokens de sortie est un coût caché majeur des workflows agent.

À l’ère des agents, le coût peut venir moins de l’input que de l’output, des retries et des loops.

Codextokens sortieusage agent

Lire la source →

2026-06-22·Interconnects

GLM-5.2 marque un saut pour les agents ouverts

Les modèles chinois et ouverts comptent dans la comparaison coût/performance mondiale.

Le seuil de capacité des modèles ouverts évolue, et GLM-5.2 mérite d’entrer dans la carte des coûts.

GLMagents ouvertsmodèles chinois

Lire la source →

2026-06-18·Hugging Face

Assez agentique ? Évaluer les modèles ouverts sur vos outils

Votre propre stack peut compter plus qu’un rang public.

La bonne question : quel modèle réussit au moindre coût dans votre stack agent ?

benchmark agentmodèles ouvertsoutillage

Lire la source →

2025-05-08·Aider

Résultats de benchmark Qwen3

Un pont durable entre modèles chinois et évaluation coding-agent.

Le benchmark polyglotte d’Aider fournit des preuves concrètes pour discuter Qwen3 en coding agent.

QwenAiderbenchmark code

Lire la source →

2026-07-04·Claude Code Docs

Comment Claude Code utilise le prompt caching

Le prompt caching modifie directement vitesse et coût token.

Claude Code gère le cache ; changement de modèle, /compact, CLAUDE.md et hit rate influencent coût et latence.

Claude Codeprompt cachingéconomie tokens

Lire la source →

2026-07-01·Ian Wootten

Quitter Claude pour OpenCode et OpenRouter

Un cas réel de passage des outils par défaut vers des routeurs et modèles ouverts.

Un retour d’expérience sur un mois avec OpenCode, OpenRouter et des modèles open-weight à la place de Claude Code.

OpenCodeOpenRoutercoût

Lire la source →

2026-07-04·Contextify

Contextify : historique recherchable pour Claude Code et Codex

L’historique agent et le contexte réutilisable réduisent les tokens répétés.

Si l’agent oublie le contexte à chaque session, vous repayez les mêmes tokens ; Contextify conserve un historique recherchable.

Claude CodeCodexmémoire agent

Lire la source →

Lisible par les humains et les agents

HTML statique d’abord, avec des endpoints lisibles par machine pour l’automatisation et la recherche.

/llms.txt
objectif du site et politique de lecture
/feed.xml
RSS des briefs et angles
/data/hooks.fr.json
cartes d’articles structurées
/sources/
politique de sources et citations