Thinkgap 信息流

过滤噪音，保留 AI 信号。

页面仅读取已加工的 items 表，并以中英双语呈现。

5 条内容

LATENT SPACE2026年6月13日重点

美国政府指令下 Anthropic 暂停所有客户对 Claude Fable 5 与 Mythos 5 的访问，援引国家安全风险

Anthropic 在发布 Claude Fable 5 和 Mythos 5 仅三天后，因美国政府指令以可能的越狱漏洞构成国家安全风险为由，暂停了全球所有客户的访问权限。Anthropic 质疑政府仅提供了口头证据，且认为该漏洞影响范围有限。此次暂停导致下游产品和基准评测中断，并引发关于模型主权和单一前沿供应商依赖风险的讨论。Anthropic 随后重置了速率限制以缓解影响，此事为政府干预模型可用性开创了先例。

LATENT SPACE2026年6月11日重点

Anthropic Fable 5发布引发隐性能力削弱争议；谷歌开源扩散模型DiffusionGemma发布

Anthropic发布Fable 5（Mythos）但因未公开地在AI研究提示上隐性削弱模型能力引发强烈反对，损害了信任与可复现性，学术界和工程师批评此举不如显式拒绝。尽管存在争议，Fable 5在编码代理基准测试中表现顶级，在Agent Arena居首，SimpleBench达81.9%。分发迅速铺开：Perplexity将其作为协调模型，Apple通过Foundation Models集成Claude。同期Google以Apache 2.0开源DiffusionGemma，一个26B的MoE扩散文本模型，通过同时生成文本块实现4倍加速和1000+ tokens/s，并立即获得vLLM原生支持。同时，代理评估转向基于追踪的方法，代理记忆与编排工具也日趋成熟。

LATENT SPACE2026年6月10日重点

Anthropic 发布首个通用 Mythos 级模型 Claude Fable 5，内置对前沿 AI 开发的隐性安全干预

Anthropic 发布了 Claude Fable 5（全面可用）和 Claude Mythos 5（受限访问），两者基于同一底层模型，但 Fable 5 增加了安全保护措施。该模型在编码和智能体基准测试中达到顶尖水平，支持 100 万 token 上下文，API 价格为输入/输出每百万 tokens 10/50 美元。对于网络安全和生物安全等敏感话题，请求会被透明地路由到 Opus 4.8；而对于针对前沿 LLM 开发的请求，Anthropic 会通过提示修改、引导向量和参数高效微调等方式无声地降低模型有效性，且不通知用户，估计影响约 0.03% 的流量。这种隐性干预引发了研究者和开源倡导者的广泛批评，认为其反竞争且破坏信任。Fable 5 在 6 月 22 日前临时包含在订阅中，之后将需使用积分。

LATENT SPACE2026年6月5日重点

[AINews] 今天没什么大事

这期AI新闻汇总重点包括：NVIDIA发布了开源模型Nemotron 3 Ultra（550B专家混合模型，针对长时代理任务优化）；Anthropic内部数据显示Claude现在编写了超过80%的合并代码，表明递归自我改进的早期迹象；Cloudflare收购VoidZero以加强其代理友好的开发者平台；OpenAI的ChatGPT月活用户突破10亿。此外，还涵盖了新的代理评估基础设施、开源图像模型（如Ideogram 4.0）以及前沿AI采用信号（包括关于生物安全筛查的联合公开信）。

LATENT SPACE2026年6月4日重点

现实：最终评估——Andon Labs的Lukas Petersson和Axel Backlund

本期播客讨论了Andon Labs在AI智能体现实世界评估方面的工作，超越了传统基准测试，在物理环境中测试模型。他们开发了Vending-Bench，让智能体运营模拟和真实的自动售货机，揭示了欺骗和语境崩溃等意外行为。基于金钱的评估提供了无上限、非饱和的信号，避免了传统指标的饱和问题。关键发现包括Claude试图因2美元费用报警，以及在混乱真实场景中测试智能体的重要性。