🔥

探索无限,从月球基地开始🐶

Categories

3 个页面

AI 安全

Anthropic 如何给 Claude 装上安全围栏：跨产品的 Agent 隔离工程

Anthropic 如何给 Claude 装上安全围栏：跨产品的 Agent 隔离工程的封面图

当 AI 开始构建自身：Anthropic 发布递归自我改进研究，呼吁建立全球减速机制

Anthropic 教 Claude "为什么"：用值观对齐终结 AI 勒索行为