最新文章
Z.ai 的开源模型 GLM-5.2 又一次喊出了「对标闭源旗舰」。但这次真正的看点不是跑分,而是 Unsloth 的动态量化把 1.51TB 的权重压到了 239GB,一台 256GB 内存的 Mac 就能在本地跑起来。本文梳理它的定位、量化方案,以及在本地把它跑起来的关键命令。
OpenAI 在 macOS 版 Codex 上线了「录制回放」(record and replay):在 Mac 上把一个流程演示一遍,Codex 会把它理解成一份可编辑、可复用的技能,下次换组参数就能重跑。它不是录宏,而是一份讲清意图的技能描述。本文讲清它怎么录、怎么放、和 session replay 的区别,以及上线时的平台与地区限制。
Anthropic 分析了 23.5 万用户的近 40 万份 Claude Code 会话,发现决定 AI 编程生产力的不再是编程背景,而是领域专长:非程序员的成功率与工程师几乎持平,真正拉开差距的是你对问题本身理解多深。但 Anthropic 也提醒,这种“专业红利”未必长期持续。
做 AI agent 的那套闭环——读 trace、攒数据集、跑实验、做 eval——现在每一步都能交给另一个 agent 去做。但真把整条链路全自动化,你只会得到 agent slop:被别的 agent 批量生产出来的低质量 agent。唯一不该外包的那一步,是自己动手读 trace。
单个 token 的价格自 2024 年初已经跌了约 98%,企业的 AI Agent 账单却不降反升。因为 Agent 不是聊天机器人:完成一个任务要反复推理、调工具、自我纠错,消耗的 token 是普通对话的 5 到 30 倍。这篇拆一下 Agent 大规模上线后真正烧钱的几块:重复上下文、Context Rot、RAG 和失控循环,以及最划算的省钱办法 prompt caching。
OpenAI Codex 现在能用三种方式操控电脑:Computer Use(@Computer)、Chrome 扩展(@Chrome)和应用内浏览器(@Browser)。三者功能有重叠,很容易混淆。本文按「适用场景 + 安装触发 + 信任边界」逐一拆开,并给出一个简单的选择原则:能用插件 / MCP 就别用可视化操控。
系统讲清 IP 地址、子网掩码与 CIDR 的关系,覆盖 IPv4、IPv6、VLSM、私有地址范围、主机数计算与实际网络规划方法。
Anthropic 内部积累了数百个 Claude Code Skill,本文整理了他们在官方博客中公布的九大类型:从库 & API 参考、产品验证,到 Runbook 和基础设施操作。同时归纳了让 Skill 真正好用的七条写法原则:描述即触发、避免显而易见的内容、把"踩坑集"当成最高信号内容。
Claude Fable 5 于 2026 年 6 月 9 日正式 GA,它引入了三个 API 层面的破坏性变更:Refusal 以 HTTP 200 + stop_reason: "refusal" 返回、Adaptive Thinking 默认开启且无法关闭、以及新的 effort 参数替代 thinking 深度控制。本文逐条拆解这些变更,并给出可复用的迁移检查清单。
循环工程(Loop Engineering)是指不再亲自给智能体写提示词,而是去设计那个替你写提示词的系统。它由五块积木加一份外部记忆组成,Claude Code 和 Codex 如今都已凑齐这五块。本文逐块讲清自动化、worktree、技能、插件与连接器、子智能体各自的作用,一个真实循环长什么样,以及循环替代不了你的那三件事。