데일리 브리프 · 토큰 비용 · 에이전트 워크플로

AI 토큰 경제를 현장 브리프처럼 읽습니다.

AI의 실제 비용을 밝고 읽기 쉽게 정리합니다. 모델 가격, 코딩 에이전트 워크플로, 벤치마크 신호, 토큰을 덜 쓰는 실전 방법을 다룹니다.

사람이 먼저 읽기 좋게 만들고, 에이전트도 안전하게 읽고 인용하고 재사용할 수 있게 구조화합니다.

15개 후크부터 보기 에이전트 JSON llms.txt

가격 감시입력, 출력, 캐시, 배치, 컨텍스트, 재시도.

에이전트 비용Claude Code, Codex, Cursor, Aider, OpenCode.

토큰 절약프롬프트 캐싱, 라우팅, 압축, 컨텍스트 규율.

시작 후크

각 카드는 제목, 날짜, 요약, 시작 신호를 제공해 빠르게 판단할 수 있게 합니다.

2026-07-03·Simon Willison

Fable의 판단력

에이전트 비용 절감은 싼 토큰뿐 아니라 나쁜 루프를 줄이는 데서 옵니다.

Claude Code 팀의 핵심은 더 나은 판단이 재작업, 개입, 비싼 루프를 줄인다는 점입니다.

Claude Code에이전트 판단워크플로

원문 읽기 →

2026-07-02·Simon Willison

릴리스: llm-coding-agent 0.1a0

최소 코딩 에이전트는 토큰이 어디서 쓰이는지 보여줍니다.

LLM 기반 에이전트가 계획, 파일 읽기, 코드 수정, 검증 단계의 토큰 소비를 드러냅니다.

coding agentLLMPython

원문 읽기 →

2026-07-02·Simon Willison

DSPy로 Datasette Agent의 SQL 시스템 프롬프트 평가 및 개선

프롬프트 최적화는 감이 아니라 평가 harness로 검증할 수 있습니다.

DSPy로 읽기 전용 SQL 에이전트의 프로덕션 시스템 프롬프트를 평가하고 다듬습니다.

DSPy시스템 프롬프트평가

원문 읽기 →

2026-07-03·Latent Space

Vercel의 Andrew Qu: 에이전트는 새로운 종류의 소프트웨어

에이전트가 읽을 수 있는 웹사이트가 제품 표면이 되고 있습니다.

Vercel은 eve 프레임워크와 skills, sandboxes, agent-readable websites의 중요성을 설명합니다.

에이전트Vercelagent-readable 웹사이트

원문 읽기 →

2026-07-01·Latent Space

Cursor가 기업 안에 AI를 배포하는 방법

워크플로가 커지면 vibe coding은 팀 예산 문제가 됩니다.

Cursor의 현장 엔지니어들은 기업에 에이전트 기반 소프트웨어 공장을 구축합니다.

Cursor소프트웨어 공장기업 AI

원문 읽기 →

2026-06-30·Simon Willison

Claude Sonnet 5의 새로운 점

새 모델은 기본값, 에이전트 비용, 실패율을 바꿉니다.

모델 업그레이드 후에는 마케팅보다 개발자 문서를 보고 기본 모델 전환을 판단해야 합니다.

ClaudeSonnet모델 업데이트

원문 읽기 →

2026-06-30·Hugging Face / IBM Research

ScarfBench: 기업 Java 마이그레이션용 AI 에이전트 벤치마크

에이전트 벤치마크가 실제 기업 마이그레이션 작업으로 이동하고 있습니다.

IBM Research는 Java 프레임워크 마이그레이션에서 에이전트를 평가합니다.

벤치마크AI agentsJava 마이그레이션

원문 읽기 →

2026-06-29·Simon Willison

Ornith-1.0: Agentic Coding을 위한 Self-Scaffolding LLM

오픈웨이트 코딩 모델은 API 비용 방정식을 바꿀 수 있습니다.

DeepReinforce의 MIT 모델은 dense와 MoE 여러 크기로 agentic coding을 겨냥합니다.

오픈웨이트agentic coding코딩 모델

원문 읽기 →

2026-06-26·Latent Space / AINews

OpenAI, 내부 Codex 출력 토큰 중앙값 급증 보고

출력 토큰 증가는 에이전트 워크플로의 큰 숨은 비용입니다.

에이전트 시대에는 입력보다 출력, 재시도, 루프가 더 비쌀 수 있습니다.

Codex출력 토큰에이전트 사용

원문 읽기 →

2026-06-22·Interconnects

GLM-5.2는 오픈 에이전트의 전환점

중국/오픈 모델은 글로벌 에이전트 비용/성능 비교의 일부입니다.

오픈 모델의 능력 임계점이 바뀌고 있으며 GLM-5.2는 비용 지도에 넣을 신호입니다.

GLM오픈 에이전트중국 모델

원문 읽기 →

2026-06-18·Hugging Face

충분히 agentic한가? 자신의 도구에서 오픈 모델 평가하기

공개 리더보드보다 자신의 도구 스택이 더 중요할 수 있습니다.

최고 모델을 묻기보다 내 agent stack에서 가장 싸게 성공하는 모델을 물어야 합니다.

에이전트 벤치마크오픈 모델도구

원문 읽기 →

2025-05-08·Aider

Qwen3 벤치마크 결과

중국 모델과 coding-agent 평가를 잇는 지속적인 다리입니다.

Aider polyglot coding benchmark는 Qwen3를 coding agent 맥락에서 논의할 근거를 제공합니다.

QwenAider코딩 벤치마크

원문 읽기 →

2026-07-04·Claude Code Docs

Claude Code가 prompt caching을 사용하는 방법

Prompt caching은 속도와 토큰 비용을 직접 바꿉니다.

모델 전환, /compact, CLAUDE.md, cache hit rate가 Claude Code의 비용과 지연에 영향을 줍니다.

Claude Codeprompt caching토큰 절약

원문 읽기 →

2026-07-01·Ian Wootten

Claude에서 OpenCode와 OpenRouter로 전환하기

기본 도구에서 오픈 라우터/모델 워크플로로 옮긴 실제 사례입니다.

한 달 동안 Claude Code 대신 OpenCode, OpenRouter, 오픈웨이트 모델을 사용한 전환 기록입니다.

OpenCodeOpenRouter비용

원문 읽기 →

2026-07-04·Contextify

Contextify: Claude Code와 Codex를 위한 검색 가능한 기록

에이전트 기록과 재사용 가능한 컨텍스트는 반복 토큰 지출을 줄입니다.

에이전트가 매번 컨텍스트를 잊으면 토큰을 반복해서 태우는 것입니다. Contextify는 기록을 검색 가능하게 보존합니다.

Claude CodeCodex에이전트 메모리

원문 읽기 →

사람과 에이전트 모두 읽기 쉽게

정적 HTML을 우선하고, 자동화와 검색을 위한 기계 판독 엔드포인트를 제공합니다.

/llms.txt
사이트 목적과 읽기 정책
/feed.xml
브리프와 후크용 RSS
/data/hooks.ko.json
구조화된 기사 카드
/sources/
출처와 인용 정책