LLM 101
为什么 Claude Code 和 Codex 这么吃额度:从 KV Cache 到 Prompt Cache
为什么 Claude Code、Codex 这类 coding agent 在长任务里容易吃额度、首 token 变慢?原因之一是长上下文反复 prefill。KV Cache 和 Prompt Cache,分别解决了两层重复计算问题。
为什么 Claude Code、Codex 这类 coding agent 在长任务里容易吃额度、首 token 变慢?原因之一是长上下文反复 prefill。KV Cache 和 Prompt Cache,分别解决了两层重复计算问题。
GEO 不是 SEO 的替代品,也不是 AI 黑魔法。它关注的是:当搜索开始直接生成答案,内容如何被发现、理解、信任、引用,并带来有效访问。
SEO 解决的是内容能不能进入搜索系统;GEO 解决的是内容进入系统后,能不能被答案采用。两者不是替代关系,而是前后关系。
从 Lovable、Bolt.new、Replit Agent 与 v0 的公开形态出发,拆解 AI app builder 应该如何建立北极星指标、事件模型、质量评测、发布治理与成本看板。
用一张总图把 Pi Agent 101 串起来:模型、工具、消息、会话、上下文、扩展、UI 和可观测性如何组成一个 Agent Harness。