☰隐藏
Categories
3 个页面
AI 安全
Anthropic 如何给 Claude 装上安全围栏:跨产品的 Agent 隔离工程
当 AI 开始构建自身:Anthropic 发布递归自我改进研究,呼吁建立全球减速机制
Anthropic 教 Claude "为什么":用值观对齐终结 AI 勒索行为