[
  {
    "title": "Fableの判断力",
    "source": "Simon Willison",
    "url": "https://simonwillison.net/2026/Jul/3/judgement/",
    "date": "2026-07-03",
    "type": "agent-workflow",
    "tags": [
      "Claude Code",
      "エージェント判断",
      "ワークフロー"
    ],
    "why_it_matters": "節約は安いトークンだけでなく、悪いループを減らすことから生まれます。",
    "hook_angle": "Agent 省钱不只是少 token，而是少干预、少返工、少错误 loop。",
    "intro": "Claude Codeチームの示唆は、判断の質が手戻り、介入、高価なループを減らすということです。",
    "locale": "ja"
  },
  {
    "title": "リリース：llm-coding-agent 0.1a0",
    "source": "Simon Willison",
    "url": "https://simonwillison.net/2026/Jul/2/llm-coding-agent/",
    "date": "2026-07-02",
    "type": "coding-agent",
    "tags": [
      "coding agent",
      "LLM",
      "Python"
    ],
    "why_it_matters": "最小構成のcoding agentは、どこでトークンが使われるかを示します。",
    "hook_angle": "一个 coding agent 到底由哪些 token-consuming steps 组成？",
    "intro": "LLMベースのエージェントが、計画、ファイル読解、編集、検証という消費ポイントを見せます。",
    "locale": "ja"
  },
  {
    "title": "DSPyでDatasette AgentのSQLプロンプトを評価・改善",
    "source": "Simon Willison",
    "url": "https://simonwillison.net/2026/Jul/2/dspy-datasette-agent-prompts/",
    "date": "2026-07-02",
    "type": "prompt-evaluation",
    "tags": [
      "DSPy",
      "システムプロンプト",
      "評価"
    ],
    "why_it_matters": "プロンプト改善は雰囲気ではなく評価ハーネスで測れます。",
    "hook_angle": "少花 token 的第一步：知道你的 system prompt 是否真的有效。",
    "intro": "DSPyを使い、読み取り専用SQLエージェントの本番システムプロンプトを評価・改良します。",
    "locale": "ja"
  },
  {
    "title": "VercelのAndrew Qu：エージェントは新しいソフトウェア",
    "source": "Latent Space",
    "url": "https://www.latent.space/p/vercel-agents-new-software",
    "date": "2026-07-03",
    "type": "agent-infrastructure",
    "tags": [
      "エージェント",
      "Vercel",
      "agent-readableサイト"
    ],
    "why_it_matters": "エージェントが読めるWebサイトは製品表面になりつつあります。",
    "hook_angle": "未来网站不只是给人看，也要给 agent 读。",
    "intro": "Vercelはeve、skills、sandboxes、agent-readable websitesの重要性を説明します。",
    "locale": "ja"
  },
  {
    "title": "Cursorは企業内でAIをどう展開するか",
    "source": "Latent Space",
    "url": "https://www.latent.space/p/cursor-forward-deployed-engineers",
    "date": "2026-07-01",
    "type": "enterprise-agent-workflow",
    "tags": [
      "Cursor",
      "ソフトウェア工場",
      "企業AI"
    ],
    "why_it_matters": "規模が大きくなると、vibe codingはチーム予算の問題になります。",
    "hook_angle": "Cursor 的真正成本不是订阅费，而是整个软件工厂的 token burn。",
    "intro": "Cursorの現場チームは、企業にエージェント型ソフトウェア工場を構築します。",
    "locale": "ja"
  },
  {
    "title": "Claude Sonnet 5の新機能",
    "source": "Simon Willison",
    "url": "https://simonwillison.net/2026/Jun/30/claude-sonnet-5/",
    "date": "2026-06-30",
    "type": "model-update",
    "tags": [
      "Claude",
      "Sonnet",
      "モデル更新"
    ],
    "why_it_matters": "新モデルはデフォルト、エージェントコスト、失敗率を変えます。",
    "hook_angle": "模型升级后，是否应该切默认模型？看 docs，不看营销。",
    "intro": "モデル更新後はマーケ資料より開発者ドキュメントを見て、デフォルト変更を判断すべきです。",
    "locale": "ja"
  },
  {
    "title": "ScarfBench：企業Java移行向けAIエージェントベンチマーク",
    "source": "Hugging Face / IBM Research",
    "url": "https://huggingface.co/blog/ibm-research/scarfbench",
    "date": "2026-06-30",
    "type": "benchmark",
    "tags": [
      "ベンチマーク",
      "AI agents",
      "Java移行"
    ],
    "why_it_matters": "エージェントベンチマークは実企業の移行タスクへ向かっています。",
    "hook_angle": "真正有用的 agent benchmark 应该衡量任务完成成本。",
    "intro": "IBM ResearchはJavaフレームワーク移行でエージェントを評価します。",
    "locale": "ja"
  },
  {
    "title": "Ornith-1.0：Agentic Coding向け自己足場化LLM",
    "source": "Simon Willison",
    "url": "https://simonwillison.net/2026/Jun/29/ornith/",
    "date": "2026-06-29",
    "type": "open-model",
    "tags": [
      "オープンウェイト",
      "agentic coding",
      "コードモデル"
    ],
    "why_it_matters": "オープンウェイトのコードモデルはAPIコスト構造を変え得ます。",
    "hook_angle": "如果 open models 足够会写代码，个人 agent 成本结构会变。",
    "intro": "DeepReinforceのMITモデルはdense/MoEの複数サイズでagentic codingを狙います。",
    "locale": "ja"
  },
  {
    "title": "OpenAI、Codex内部出力トークン中央値の急増を報告",
    "source": "Latent Space / AINews",
    "url": "https://www.latent.space/p/ainews-openai-reports-median-internal",
    "date": "2026-06-26",
    "type": "token-usage-signal",
    "tags": [
      "Codex",
      "出力トークン",
      "エージェント利用"
    ],
    "why_it_matters": "出力トークンの増加はエージェント運用の大きな隠れコストです。",
    "hook_angle": "Agent 时代，贵的不一定是 input，可能是 output 和 loop。",
    "intro": "エージェント時代の高コストは入力ではなく、出力、リトライ、ループかもしれません。",
    "locale": "ja"
  },
  {
    "title": "GLM-5.2はオープンエージェントの転換点",
    "source": "Interconnects",
    "url": "https://www.interconnects.ai/p/glm-52-is-the-step-change-for-open",
    "date": "2026-06-22",
    "type": "open-model-analysis",
    "tags": [
      "GLM",
      "オープンエージェント",
      "中国モデル"
    ],
    "why_it_matters": "中国/オープンモデルは世界のコスト性能比較に入ります。",
    "hook_angle": "中国模型不是边缘信息，而是全球 agent cost/performance 版图的一部分。",
    "intro": "オープンモデルの能力閾値が変わり、GLM-5.2はコスト地図に入れるべき信号です。",
    "locale": "ja"
  },
  {
    "title": "十分にagenticか？自分のツールでオープンモデルを評価",
    "source": "Hugging Face",
    "url": "https://huggingface.co/blog/is-it-agentic-enough",
    "date": "2026-06-18",
    "type": "benchmark",
    "tags": [
      "エージェントベンチマーク",
      "オープンモデル",
      "ツール"
    ],
    "why_it_matters": "公開ランキングより自分のツールチェーンが重要な場合があります。",
    "hook_angle": "别问哪个模型最好，问哪个模型在你的 agent stack 上最便宜地成功。",
    "intro": "最良モデルではなく、自分のagent stackで最安に成功するモデルを問うべきです。",
    "locale": "ja"
  },
  {
    "title": "Qwen3ベンチマーク結果",
    "source": "Aider",
    "url": "https://aider.chat/2025/05/08/qwen3.html",
    "date": "2025-05-08",
    "type": "coding-benchmark",
    "tags": [
      "Qwen",
      "Aider",
      "コードベンチマーク"
    ],
    "why_it_matters": "中国モデルとcoding-agent評価をつなぐ持続的な橋です。",
    "hook_angle": "中文/中国模型在 coding agent 里的位置，应该用实际 coding benchmark 讨论。",
    "intro": "Aiderのpolyglot coding benchmarkはQwen3を議論する実証材料になります。",
    "locale": "ja"
  },
  {
    "title": "Claude Codeはprompt cachingをどう使うか",
    "source": "Claude Code Docs",
    "url": "https://code.claude.com/docs/en/prompt-caching",
    "date": "2026-07-04",
    "type": "official-docs",
    "tags": [
      "Claude Code",
      "prompt caching",
      "トークン節約"
    ],
    "why_it_matters": "Prompt cachingは速度とトークンコストを直接変えます。",
    "hook_angle": "你以为 Claude Code 慢/贵，其实可能是 cache miss。",
    "intro": "モデル切替、/compact、CLAUDE.md、cache hit rateがClaude Codeのコストと遅延に影響します。",
    "locale": "ja"
  },
  {
    "title": "ClaudeからOpenCodeとOpenRouterへ移る",
    "source": "Ian Wootten",
    "url": "https://www.ianwootten.co.uk/2026/07/01/ditching-claude-for-opencode-and-openrouter/",
    "date": "2026-07-01",
    "type": "field-report",
    "tags": [
      "OpenCode",
      "OpenRouter",
      "コスト"
    ],
    "why_it_matters": "デフォルトツールからオープンなルーター/モデルへ移る実例です。",
    "hook_angle": "什么时候值得离开默认工具，改用开放 router 和开源模型？",
    "intro": "Claude Codeの代わりにOpenCode、OpenRouter、オープンウェイトモデルを使った1か月の記録です。",
    "locale": "ja"
  },
  {
    "title": "Contextify：Claude CodeとCodexの検索可能な履歴",
    "source": "Contextify",
    "url": "https://contextify.sh/",
    "date": "2026-07-04",
    "type": "tool",
    "tags": [
      "Claude Code",
      "Codex",
      "エージェント記憶"
    ],
    "why_it_matters": "履歴と再利用可能なコンテキストは重複トークンを減らします。",
    "hook_angle": "如果每次 agent 都忘记上下文，你就在重复烧 token。",
    "intro": "エージェントが毎回文脈を忘れるなら、同じトークンを払い続けています。Contextifyは履歴を検索可能にします。",
    "locale": "ja"
  }
]
