智能体AI爆发:Anthropic Fable 5引发信任争议,Visa集成AI支付,开源扩散模型重新定义速度
Agentic AI Surge: Anthropic’s Fable 5 Sparks Trust Controversy, Visa Integrates AI Payments, and Open-Source Diffusion Models Redefine Speed
英文综述
Anthropic's release of the Fable 5 agentic model drew sharp criticism for silently degrading performance on research prompts, raising urgent questions about transparency in AI safety. Meanwhile, Visa partnered with OpenAI to let AI agents make purchases, and Google open-sourced DiffusionGemma, a diffusion LLM delivering token generation speeds over 1000 tokens/s. Research advances included a manifold-aligned MoE router, a teacher-student reward framework for image generation, and a comprehensive survey on agentic environment engineering. Autonomous scientific research took a step forward with Arbor’s hypothesis-tree refinement, while Meshy introduced a 3D AI agent aimed at transforming content creation. The common thread: agentic capabilities are accelerating across domains, but the need for reliable evaluation, safety guardrails, and clear communication is more critical than ever.
中文综述
Anthropic发布Fable 5智能体模型,但因隐性削弱研究类提示能力而招致批评,凸显AI安全须兼顾透明度。同期,Visa与OpenAI合作实现AI代理购物,谷歌开源扩散语言模型DiffusionGemma,以超1000 tokens/s的速度生成文本。研究方面,流形对齐的MoE路由器、图像生成的师生奖励框架和智能体环境工程综述推动了技术进展;Arbor的假设树精炼框架则助力自主科研。此外,Meshy推出3D AI代理,欲重塑内容生产。贯穿全天的主题是:智能体能力正跨域提速,但可靠的评估、安全护栏与清晰沟通比以往更为迫切。
收录条目
Anthropic Fable 5发布引发隐性能力削弱争议;谷歌开源扩散模型DiffusionGemma发布
Anthropic发布Fable 5(Mythos)但因未公开地在AI研究提示上隐性削弱模型能力引发强烈反对,损害了信任与可复现性,学术界和工程师批评此举不如显式拒绝。尽管存在争议,Fable 5在编码代理基准测试中表现顶级,在Agent Arena居首,SimpleBench达81.9%。分发迅速铺开:Perplexity将其作为协调模型,Apple通过Foundation Models集成Claude。同期Google以Apache 2.0开源DiffusionGemma,一个26B的MoE扩散文本模型,通过同时生成文本块实现4倍加速和1000+ tokens/s,并立即获得vLLM原生支持。同时,代理评估转向基于追踪的方法,代理记忆与编排工具也日趋成熟。
查看条目Visa支付网络集成ChatGPT,实现AI智能体代购
Visa正在其支付网络中集成ChatGPT,使AI智能体能够代表用户在任何接受Visa的商家购物并完成购买。OpenAI提供技术,让智能体通过ChatGPT进行互动、决策和发起购买。为保障安全,将设置消费限额、需要批准的步骤以及仅限授权商家等措施。双方未透露合作的财务条款。
查看条目研究人员提出一种新的混合专家(MoE)路由器设计,利用流形幂迭代(MPI)将路由器行对齐到专家矩阵的主奇异方向。"先幂后收缩"的范式引导路由器行向关联专家的主奇异方向靠近,从而改善词元-专家亲和度的表示。实验表明,该对齐方法能产生更高效的MoE模型,在不同规模的预训练中均提升性能。这项工作直接针对稀疏模型的核心路由机制。
论文提出Z-Reward框架,通过教师-学生模型将复杂推理与高效奖励部署解耦,用于文本到图像训练。教师模型(大型视觉语言模型)通过推理推断与评分标准对齐的评分分布,并采用GDSO方法(结合策略梯度奖励与评分监督)进行训练。学生模型通过RISD训练,无需显式推理即可迁移教师的评分分布,达到88.6%的人类偏好准确率(教师为89.6%)。Z-Reward作为可微分奖励信号,相对基线实现了41.3%的净人类偏好提升。
该论文系统综述了用于训练和评估大语言模型智能体(LLM agents)的专用环境工程。研究根据生命周期阶段和范式对环境进行分类,区分了基于符号和神经方法的环境建模与自动合成。综述回顾了环境的评估方法,并梳理了神经驱动、难度驱动和规模驱动等环境演化路径。未来方向包括环境即服务、多智能体环境和神经-符号集成。
该论文提出Arbor,一个面向自主科学研究的AI框架,通过战略协调、隔离式假设检验和知识累积,将探索、实验与抽象整合为迭代过程。框架包含长期协调器、短期执行器以及假设树精炼(HTR)系统,持续连接假设、工件、证据和洞察。在多项研究任务中,Arbor的表现优于其他AI代理,无需持续人工干预即可实现自主研究的累积性提升。
Anthropic发布了Fable 5模型,这是此前仅在Project Glasswing中向特定合作伙伴提供的Mythos模型的公开版本。该模型可在Pro、Max和Team计划上使用,6月22日前免费,之后需消耗使用额度。它专为长时间智能体任务设计,能自主启动子模型、收集数据,并自写自测代码,支持数小时的连续运行。模型在网络安全、生物和化学等领域设有硬安全限制,触发后回退至Opus 4.8。一位Reddit用户正征集社区的实际使用反馈,探讨优缺点。
Meshy 宣布推出其声称的全球首个3D AI Agent。该代理旨在自主完成复杂的3D创作任务,简化设计师和开发者的工作流程。公司将其定位为3D内容生成的ChatGPT时刻,预示创作方式的变革。简短公告未透露更多技术细节或可用性信息。