最新文章
做 AI agent 的那套闭环——读 trace、攒数据集、跑实验、做 eval——现在每一步都能交给另一个 agent 去做。但真把整条链路全自动化,你只会得到 agent slop:被别的 agent 批量生产出来的低质量 agent。唯一不该外包的那一步,是自己动手读 trace。
单个 token 的价格自 2024 年初已经跌了约 98%,企业的 AI Agent 账单却不降反升。因为 Agent 不是聊天机器人:完成一个任务要反复推理、调工具、自我纠错,消耗的 token 是普通对话的 5 到 30 倍。这篇拆一下 Agent 大规模上线后真正烧钱的几块:重复上下文、Context Rot、RAG 和失控循环,以及最划算的省钱办法 prompt caching。
OpenAI Codex 现在能用三种方式操控电脑:Computer Use(@Computer)、Chrome 扩展(@Chrome)和应用内浏览器(@Browser)。三者功能有重叠,很容易混淆。本文按「适用场景 + 安装触发 + 信任边界」逐一拆开,并给出一个简单的选择原则:能用插件 / MCP 就别用可视化操控。
系统讲清 IP 地址、子网掩码与 CIDR 的关系,覆盖 IPv4、IPv6、VLSM、私有地址范围、主机数计算与实际网络规划方法。
Anthropic 内部积累了数百个 Claude Code Skill,本文整理了他们在官方博客中公布的九大类型:从库 & API 参考、产品验证,到 Runbook 和基础设施操作。同时归纳了让 Skill 真正好用的七条写法原则:描述即触发、避免显而易见的内容、把"踩坑集"当成最高信号内容。
Claude Fable 5 于 2026 年 6 月 9 日正式 GA,它引入了三个 API 层面的破坏性变更:Refusal 以 HTTP 200 + stop_reason: "refusal" 返回、Adaptive Thinking 默认开启且无法关闭、以及新的 effort 参数替代 thinking 深度控制。本文逐条拆解这些变更,并给出可复用的迁移检查清单。
循环工程(Loop Engineering)是指不再亲自给智能体写提示词,而是去设计那个替你写提示词的系统。它由五块积木加一份外部记忆组成,Claude Code 和 Codex 如今都已凑齐这五块。本文逐块讲清自动化、worktree、技能、插件与连接器、子智能体各自的作用,一个真实循环长什么样,以及循环替代不了你的那三件事。
说明网站安全验证页的作用、典型提示信息含义,以及请求在机器人校验成功后为何仍需等待源站响应。
记录一下通过 API 给微信公众号发草稿时,列表项里的行内代码后面的文字总被挤到下一行。本文记录完整排查过程与实测结论:微信编辑器会把行内 code 块级化、会剥掉无属性的 span、会把以元素开头的 li 里的裸文本包成块级 section。最终修法是把行内代码转成带 style 的 span,并给 li 内裸文本预先包上带 style 属性的 span。
Ultracode 是 Claude Code 里最高一档的 /effort 设置:它把推理努力固定在 xhigh,并自动为实质性任务编排动态工作流。本文讲清它和 xhigh、max、ultrathink 的区别,三种有效与三种无效的开启方式,各订阅档位的可用性,真实的 token 成本,以及什么时候该用、什么时候别用。