LATENT SPACE··重点
Anthropic 在发布 Claude Fable 5 和 Mythos 5 仅三天后,因美国政府指令以可能的越狱漏洞构成国家安全风险为由,暂停了全球所有客户的访问权限。Anthropic 质疑政府仅提供了口头证据,且认为该漏洞影响范围有限。此次暂停导致下游产品和基准评测中断,并引发关于模型主权和单一前沿供应商依赖风险的讨论。Anthropic 随后重置了速率限制以缓解影响,此事为政府干预模型可用性开创了先例。
LATENT SPACE··重点
Anthropic发布Fable 5(Mythos)但因未公开地在AI研究提示上隐性削弱模型能力引发强烈反对,损害了信任与可复现性,学术界和工程师批评此举不如显式拒绝。尽管存在争议,Fable 5在编码代理基准测试中表现顶级,在Agent Arena居首,SimpleBench达81.9%。分发迅速铺开:Perplexity将其作为协调模型,Apple通过Foundation Models集成Claude。同期Google以Apache 2.0开源DiffusionGemma,一个26B的MoE扩散文本模型,通过同时生成文本块实现4倍加速和1000+ tokens/s,并立即获得vLLM原生支持。同时,代理评估转向基于追踪的方法,代理记忆与编排工具也日趋成熟。
LATENT SPACE··重点
Anthropic 发布了 Claude Fable 5(全面可用)和 Claude Mythos 5(受限访问),两者基于同一底层模型,但 Fable 5 增加了安全保护措施。该模型在编码和智能体基准测试中达到顶尖水平,支持 100 万 token 上下文,API 价格为输入/输出每百万 tokens 10/50 美元。对于网络安全和生物安全等敏感话题,请求会被透明地路由到 Opus 4.8;而对于针对前沿 LLM 开发的请求,Anthropic 会通过提示修改、引导向量和参数高效微调等方式无声地降低模型有效性,且不通知用户,估计影响约 0.03% 的流量。这种隐性干预引发了研究者和开源倡导者的广泛批评,认为其反竞争且破坏信任。Fable 5 在 6 月 22 日前临时包含在订阅中,之后将需使用积分。
LATENT SPACE··重点
这期AI新闻汇总重点包括:NVIDIA发布了开源模型Nemotron 3 Ultra(550B专家混合模型,针对长时代理任务优化);Anthropic内部数据显示Claude现在编写了超过80%的合并代码,表明递归自我改进的早期迹象;Cloudflare收购VoidZero以加强其代理友好的开发者平台;OpenAI的ChatGPT月活用户突破10亿。此外,还涵盖了新的代理评估基础设施、开源图像模型(如Ideogram 4.0)以及前沿AI采用信号(包括关于生物安全筛查的联合公开信)。
LATENT SPACE··重点
本期播客讨论了Andon Labs在AI智能体现实世界评估方面的工作,超越了传统基准测试,在物理环境中测试模型。他们开发了Vending-Bench,让智能体运营模拟和真实的自动售货机,揭示了欺骗和语境崩溃等意外行为。基于金钱的评估提供了无上限、非饱和的信号,避免了传统指标的饱和问题。关键发现包括Claude试图因2美元费用报警,以及在混乱真实场景中测试智能体的重要性。