デイリーブリーフ · トークンコスト · エージェント運用

AIトークン経済を、現場ブリーフのように読む。

AIの本当のコストを読みやすく整理するガイド。モデル価格、コーディングエージェントの運用、ベンチマークの兆候、トークンを節約する実践策を扱います。

まず人間が読みやすく、同時にエージェントが安全に読み、引用し、再利用できる構造にしています。

15本のフックから始めるエージェントJSON llms.txt

価格ウォッチ入力、出力、キャッシュ、バッチ、コンテキスト、リトライ。

エージェントコストClaude Code、Codex、Cursor、Aider、OpenCode。

トークン節約プロンプトキャッシュ、ルーティング、圧縮、コンテキスト管理。

出発点となるフック

各カードはタイトル、日付、要約、冒頭のシグナルを示し、素早く判断できるようにします。

2026-07-03·Simon Willison

Fableの判断力

節約は安いトークンだけでなく、悪いループを減らすことから生まれます。

Claude Codeチームの示唆は、判断の質が手戻り、介入、高価なループを減らすということです。

Claude Codeエージェント判断ワークフロー

元記事を読む →

2026-07-02·Simon Willison

リリース：llm-coding-agent 0.1a0

最小構成のcoding agentは、どこでトークンが使われるかを示します。

LLMベースのエージェントが、計画、ファイル読解、編集、検証という消費ポイントを見せます。

coding agentLLMPython

元記事を読む →

2026-07-02·Simon Willison

DSPyでDatasette AgentのSQLプロンプトを評価・改善

プロンプト改善は雰囲気ではなく評価ハーネスで測れます。

DSPyを使い、読み取り専用SQLエージェントの本番システムプロンプトを評価・改良します。

DSPyシステムプロンプト評価

元記事を読む →

2026-07-03·Latent Space

VercelのAndrew Qu：エージェントは新しいソフトウェア

エージェントが読めるWebサイトは製品表面になりつつあります。

Vercelはeve、skills、sandboxes、agent-readable websitesの重要性を説明します。

エージェントVercelagent-readableサイト

元記事を読む →

2026-07-01·Latent Space

Cursorは企業内でAIをどう展開するか

規模が大きくなると、vibe codingはチーム予算の問題になります。

Cursorの現場チームは、企業にエージェント型ソフトウェア工場を構築します。

Cursorソフトウェア工場企業AI

元記事を読む →

2026-06-30·Simon Willison

Claude Sonnet 5の新機能

新モデルはデフォルト、エージェントコスト、失敗率を変えます。

モデル更新後はマーケ資料より開発者ドキュメントを見て、デフォルト変更を判断すべきです。

ClaudeSonnetモデル更新

元記事を読む →

2026-06-30·Hugging Face / IBM Research

ScarfBench：企業Java移行向けAIエージェントベンチマーク

エージェントベンチマークは実企業の移行タスクへ向かっています。

IBM ResearchはJavaフレームワーク移行でエージェントを評価します。

ベンチマークAI agentsJava移行

元記事を読む →

2026-06-29·Simon Willison

Ornith-1.0：Agentic Coding向け自己足場化LLM

オープンウェイトのコードモデルはAPIコスト構造を変え得ます。

DeepReinforceのMITモデルはdense/MoEの複数サイズでagentic codingを狙います。

オープンウェイトagentic codingコードモデル

元記事を読む →

2026-06-26·Latent Space / AINews

OpenAI、Codex内部出力トークン中央値の急増を報告

出力トークンの増加はエージェント運用の大きな隠れコストです。

エージェント時代の高コストは入力ではなく、出力、リトライ、ループかもしれません。

Codex出力トークンエージェント利用

元記事を読む →

2026-06-22·Interconnects

GLM-5.2はオープンエージェントの転換点

中国/オープンモデルは世界のコスト性能比較に入ります。

オープンモデルの能力閾値が変わり、GLM-5.2はコスト地図に入れるべき信号です。

GLMオープンエージェント中国モデル

元記事を読む →

2026-06-18·Hugging Face

十分にagenticか？自分のツールでオープンモデルを評価

公開ランキングより自分のツールチェーンが重要な場合があります。

最良モデルではなく、自分のagent stackで最安に成功するモデルを問うべきです。

エージェントベンチマークオープンモデルツール

元記事を読む →

2025-05-08·Aider

Qwen3ベンチマーク結果

中国モデルとcoding-agent評価をつなぐ持続的な橋です。

Aiderのpolyglot coding benchmarkはQwen3を議論する実証材料になります。

QwenAiderコードベンチマーク

元記事を読む →

2026-07-04·Claude Code Docs

Claude Codeはprompt cachingをどう使うか

Prompt cachingは速度とトークンコストを直接変えます。

モデル切替、/compact、CLAUDE.md、cache hit rateがClaude Codeのコストと遅延に影響します。

Claude Codeprompt cachingトークン節約

元記事を読む →

2026-07-01·Ian Wootten

ClaudeからOpenCodeとOpenRouterへ移る

デフォルトツールからオープンなルーター/モデルへ移る実例です。

Claude Codeの代わりにOpenCode、OpenRouter、オープンウェイトモデルを使った1か月の記録です。

OpenCodeOpenRouterコスト

元記事を読む →

2026-07-04·Contextify

Contextify：Claude CodeとCodexの検索可能な履歴

履歴と再利用可能なコンテキストは重複トークンを減らします。

エージェントが毎回文脈を忘れるなら、同じトークンを払い続けています。Contextifyは履歴を検索可能にします。

Claude CodeCodexエージェント記憶

元記事を読む →

人間にもエージェントにも読みやすく

まず静的HTML。自動化と検索のために機械可読エンドポイントも用意しています。

/llms.txt
サイトの目的と読解ポリシー
/feed.xml
ブリーフとフックのRSS
/data/hooks.ja.json
構造化された記事カード
/sources/
情報源と引用ポリシー