LLM 101

01

本期重点

LATEST FIELD NOTES

LLM 101 2026.07.26 9 分钟

Agent Context Economics 101｜00｜Reading Guide：Agent 为什么需要上下文经济学

Agent 的上下文不是免费的聊天记录，而是一份每轮都要重新处理、缓存和计费的运行时资产。这份阅读指南给出从机制、架构到成本与运维的完整路线。

开始阅读

02

LLM 101 16 分钟

Agent Context Economics 101｜01｜The Context Bill：Agent 每一轮到底在为什么付费

一句 continue 为什么也可能很贵？拆开 Agent 每轮请求里的未缓存输入、缓存写入、缓存读取、输出 token 与首 token 延迟。

03

LLM 101 16 分钟

Agent Context Economics 101｜02｜Stable Prefix：缓存命中首先是一个架构问题

Prompt Cache 依赖的不是语义相似，而是稳定的 token 前缀。缓存友好性因此首先是一份确定性的上下文组装契约。

02

选择一条学习路径

LEARNING PATHS

P / 01

AI 产品

从用户任务、原型证据到增长与商业化。

E / 02

Agent Engineering

运行时、工具、上下文、评估与可观测性。

A / 03

AI Agent

理解自主系统如何计划、行动与交付结果。

G / 04

GEO

让内容被答案系统发现、理解、信任与引用。

03

Agent Context Economics 101｜00｜Reading Guide：Agent 为什么需要上下文经济学

Agent 的上下文不是免费的聊天记录，而是一份每轮都要重新处理、缓存和计费的运行时资产。这份阅读指南给出从机制、架构到成本与运维的完整路线。

阅读全文

LLM 101 2026.07.26 16 分钟

Agent Context Economics 101｜01｜The Context Bill：Agent 每一轮到底在为什么付费

一句 continue 为什么也可能很贵？拆开 Agent 每轮请求里的未缓存输入、缓存写入、缓存读取、输出 token 与首 token 延迟。

阅读全文

LLM
101

LLM 101 2026.07.26 16 分钟

Agent Context Economics 101｜02｜Stable Prefix：缓存命中首先是一个架构问题

Prompt Cache 依赖的不是语义相似，而是稳定的 token 前缀。缓存友好性因此首先是一份确定性的上下文组装契约。

阅读全文

LLM
101

LLM 101 2026.07.26 15 分钟

Agent Context Economics 101｜03｜Tool Loadouts：为什么多加一个工具可能更贵

工具 schema 位于上下文前部时，动态增删一个工具可能让后面的长会话重新 prefill。省下少量定义 token，不一定省下完整任务成本。

阅读全文

LLM
101

LLM 101 2026.07.26 14 分钟

Agent Context Economics 101｜04｜Sessions Are Trees：会话、分支与缓存并不是一回事

Session ID 只是产品状态和路由线索；真正决定缓存复用的是 token prefix。分支、回退、fork 与 resume 因此会产生不同结果。

阅读全文

LLM
101

LLM 101 2026.07.26 14 分钟

Agent Context Economics 101｜05｜The Price of a Miss：TTL、路由与模型切换的隐藏成本

缓存内容完全相同也可能 miss：TTL 会过期，模型会切换，路由会变化，worker 会淘汰状态。一次短请求可能因此重算整段长上下文。

阅读全文

LLM
101

LLM 101 2026.07.26 16 分钟

Agent Context Economics 101｜06｜Append, Prune, or Compact：上下文不是越短越便宜

删除旧上下文会缩短未来请求，也会让删除点之后的前缀重新计算。追加、裁剪和压缩必须按完整任务的质量与成本共同决策。

阅读全文

LLM
101

LLM 101 2026.07.26 15 分钟

Agent Context Economics 101｜07｜Context Budgeting：在质量、延迟与成本之间做决策

上下文预算不是一个 token 上限，而是一组任务级决策：质量、延迟、缓存复用、成功率与 Provider 灵活性要一起衡量。

阅读全文

LLM
101

LLM 101 2026.07.26 17 分钟

Agent Context Economics 101｜08｜Cache Observability：如何发现并解释缓存失效

缓存健康不能靠账单猜。把缓存读写、未缓存输入、TTFT、请求变化与路由线索放到同一条时间线上，才能解释一次 miss。

阅读全文

AI Coding 2026.07.12 16 分钟

AI Coding Productivity 101｜Agent 写得更快，团队为什么没有更快

Codex、Claude Code 和 Cursor 正在把代码生产变成可并行的 Agent 工作。问题也随之改变：我们不再只需要测开发者写得多快，而要判断更多变更是否真正穿过评审、测试、部署，最终转化为产品价值。

阅读全文

LLM 101 2026.07.12 3 分钟

AI Product Growth 101｜00｜Reading Guide：从 AI 能力到可持续产品

会调用模型，只是 AI 产品的起点。这个系列讨论怎样选切口、验证需求、设计开发闭环，并让用户持续使用和付费。

阅读全文

LLM 101 2026.07.12 6 分钟

AI Product Growth 101｜02｜Evidence Prototype：原型不是缩小版产品

AI 原型最重要的产物不是 Demo，而是证据：能力是否可行、用户是否愿意委托、结果是否进入真实工作流。

阅读全文

FIELD NOTES / EMAIL

深入拆解模型、Agent 与 AI 产品，关注产品设计、工程实现和真实工作流。

新文章直接送到邮箱。没有信息流焦虑，只有值得保留的工程与产品方法。

免费订阅

把 AI 能力，变成真正可用的产品与系统。

本期重点

Agent Context Economics 101｜00｜Reading Guide：Agent 为什么需要上下文经济学

Agent Context Economics 101｜01｜The Context Bill：Agent 每一轮到底在为什么付费

Agent Context Economics 101｜02｜Stable Prefix：缓存命中首先是一个架构问题

选择一条学习路径

AI 产品

Agent Engineering

AI Agent

GEO

最新文章

Agent Context Economics 101｜00｜Reading Guide：Agent 为什么需要上下文经济学

Agent Context Economics 101｜01｜The Context Bill：Agent 每一轮到底在为什么付费

Agent Context Economics 101｜02｜Stable Prefix：缓存命中首先是一个架构问题

Agent Context Economics 101｜03｜Tool Loadouts：为什么多加一个工具可能更贵

Agent Context Economics 101｜04｜Sessions Are Trees：会话、分支与缓存并不是一回事

Agent Context Economics 101｜05｜The Price of a Miss：TTL、路由与模型切换的隐藏成本

Agent Context Economics 101｜06｜Append, Prune, or Compact：上下文不是越短越便宜

Agent Context Economics 101｜07｜Context Budgeting：在质量、延迟与成本之间做决策

Agent Context Economics 101｜08｜Cache Observability：如何发现并解释缓存失效

AI Coding Productivity 101｜Agent 写得更快，团队为什么没有更快

AI Product Growth 101｜00｜Reading Guide：从 AI 能力到可持续产品

AI Product Growth 101｜02｜Evidence Prototype：原型不是缩小版产品