最新文章
Anthropic Institute 于 2026 年 6 月 4 日发布研究报告《当 AI 构建自身》:截至 2026 年 5 月,Anthropic 内部超过 80% 的合并代码由 Claude 撰写,工程师代码产出提升 8 倍;代码优化能力一年内从 3× 跳升至 52×;研究判断准确率已超人类 64%。Anthropic 据此公开呼吁建立可触发的全球 AI 减速机制。
讲清 Let’s Encrypt 通配符证书为何必须走 DNS-01,以及如何用 Certbot 完成签发、校验、Nginx/Apache 配置和自动续期。
拆解一种新的 Instagram 账号接管方式:攻击者不破解密码、不钓鱼,而是用 Prompt Injection 诱导 AI 客服走官方流程改邮箱、重置密码,连 2FA 都绕了过去。附原理分析与防护建议。
本文基于 Cobus Greyling 对 LIFE-Harness 论文的解读,重新梳理 AI Agent 失败的四层分类:环境契约、操作技能、动作落地和轨迹调节。文章重点说明,很多 Agent 失败并不是模型本身不够聪明,而是模型和运行环境之间缺少稳定、可验证、可修复的接口层。
OpenAI 开源了 Symphony——一份用 SPEC.md 写成的 Codex Agent 编排规范。它的核心思路只有一句话:每一个打开的 Issue,都配一个 Agent 去跑。本文拆解它的架构设计、WORKFLOW.md 机制、安全不变量,以及 500% PR 增长数字背后的工程逻辑。
Anthropic 发布研究报告《Teaching Claude Why》,披露早期 Claude 模型在某些测试场景下勒索行为发生率高达 96%,并详解了如何通过"教它理解原因"而非"只教行为示范"来将这个数字归零——值观对齐比行为训练泛化能力更强。
深入的 Claude Code 实战指南:从 .claude 目录的分层配置、Boris 写 CLAUDE.md 的方式、Skills 与 Subagent 的写法,到 Plugin、被低估的命令、MCP 工作流和并行会话——把 Claude Code 从"终端里的聊天框"用成一个真正的可编程编码 Agent。
Claude Code v2.1.154 正式引入 Dynamic Workflows:Claude 为你动态写一个 JavaScript 编排脚本,后台运行数十到上千个子代理,把"上下文溢出"的上限直接从对话里搬走。本文从核心概念、触发方式、运行机制到成本控制,逐一拆解这个新功能。
讲清 Gemini Managed Agents 的运行方式、计费结构与 Python 接入流程,并通过一个可分析 CSV、执行脚本和导出结果的数据分析 Agent 完成完整示例。
OpenAI Codex 怎么用才靠谱?本文改写自官方 best-practices——好提示的四要素(目标/上下文/约束/完成标准)、难任务先规划、用 AGENTS.md 沉淀规则、按层级配置、测试与 /review 把关、用 MCP 接外部上下文、把重复活儿做成 skill 与 automation、用会话控制管理长任务,以及八个常见误区。文末附与 Claude Code 的对照。