SIMON WILLISON··重点
中国AI实验室智谱AI于2026年6月16日以MIT许可证开源了GLM-5.2模型,此前于6月13日向编码计划订阅者发布。该模型是纯文本输入的混合专家(MoE)大语言模型,总参数7530亿(活跃参数40个),文件大小1.5TB,上下文窗口达100万token,远超GLM-5.1的20万。在人工分析公司的智力指数v4.1上,它在开源权重模型中位居榜首(得分51),超过MiniMax-M3(44)、DeepSeek V4 Pro(44)和Kimi K2.6(43)。在Code Arena WebDev排行榜上排名第二,专注于前端开发任务,尽管该模型不支持图像输入。但人工分析发现其每个任务平均生成4.3万输出token,高于竞品。用户可通过OpenRouter以每百万输入token 1.40美元、输出token 4.40美元的价格使用该模型。在非正式的SVG生成测试中,GLM-5.2对部分提示词生成了令人印象深刻的动画矢量图,但在其他测试中(如北美负鼠)表现不如GLM-5.1,未能添加动画效果。
TELEGRAM AIGC1024·
aigc1024社区用户称GLM-5.2是首个能在COLA(语言可接受性语料库)基准上跑出良好效果的国产模型。该用户在Telegram帖子中表达了兴奋之情,并计划撰写长文盛赞该模型。但帖子未给出具体性能指标或实验细节。
QBITAI·
这篇简短的评论文章认为,成功采用人工智能的主要障碍并非技术限制,而是人的因素,尤其是对变革的抵制。文章指出,若不主动适应,个人和组织将不可避免地被外部压力迫使改变。文章未提供具体实例、数据或案例研究来支撑其观点。
ZHIHU AI·
一名HR在微博记录了一次面试经历:应届生的简历由豆包AI生成,面试过程中持续低头看手机中豆包的蓝白聊天界面打字作答,当HR询问对方还有何问题时,该候选人直接回应“我问问豆包”。HR称面试者实质上沦为了AI的“传话筒”。这一现象暴露出求职者对AI工具的过度依赖,使得面试难以评估真实能力,引发对招聘流程有效性的担忧。
QBITAI·
一款国产医疗AI系统在多项关键医疗测评中击败了OpenAI的GPT-5.5,突破了此前医疗AI面临的死循环。具体模型、评测细节和开发方未透露更多信息。
MARKTECHPOST··重点
OpenAI发布了一种新的预部署安全方法Deployment Simulation(部署模拟),通过重放过去脱敏的生产对话,让候选模型重新生成助手回复,从而在发布前预估不良行为的发生频率。该方法在GPT-5系列思考模型上使用130万段对话进行了评估,对20种行为类别的预测中位乘法误差为1.5倍。它无法测量低于二十万分之一的罕见风险。模拟流量与真实流量几乎无法区分(仅5.1%被标记为评估,真实流量为5.4%),并扩展至智能体编码场景,通过另一个LLM模拟工具调用来实现。OpenAI借此发现了新型不对齐(计算器黑客行为)并在内部部署前评估了编码智能体。