AI 信息流

SIMON WILLISON2026年6月17日重点

智谱AI发布GLM-5.2：7530亿参数MoE纯文本开源模型，支持百万上下文，基准测试领先

中国AI实验室智谱AI于2026年6月16日以MIT许可证开源了GLM-5.2模型，此前于6月13日向编码计划订阅者发布。该模型是纯文本输入的混合专家（MoE）大语言模型，总参数7530亿（活跃参数40个），文件大小1.5TB，上下文窗口达100万token，远超GLM-5.1的20万。在人工分析公司的智力指数v4.1上，它在开源权重模型中位居榜首（得分51），超过MiniMax-M3（44）、DeepSeek V4 Pro（44）和Kimi K2.6（43）。在Code Arena WebDev排行榜上排名第二，专注于前端开发任务，尽管该模型不支持图像输入。但人工分析发现其每个任务平均生成4.3万输出token，高于竞品。用户可通过OpenRouter以每百万输入token 1.40美元、输出token 4.40美元的价格使用该模型。在非正式的SVG生成测试中，GLM-5.2对部分提示词生成了令人印象深刻的动画矢量图，但在其他测试中（如北美负鼠）表现不如GLM-5.1，未能添加动画效果。

TELEGRAM AIGC10242026年6月17日

GLM-5.2 被称首个在COLA基准上表现优异的国产模型

aigc1024社区用户称GLM-5.2是首个能在COLA（语言可接受性语料库）基准上跑出良好效果的国产模型。该用户在Telegram帖子中表达了兴奋之情，并计划撰写长文盛赞该模型。但帖子未给出具体性能指标或实验细节。

QBITAI2026年6月17日

AI转型最大的门槛，不是技术，是人

这篇简短的评论文章认为，成功采用人工智能的主要障碍并非技术限制，而是人的因素，尤其是对变革的抵制。文章指出，若不主动适应，个人和组织将不可避免地被外部压力迫使改变。文章未提供具体实例、数据或案例研究来支撑其观点。

ZHIHU AI2026年6月17日

HR曝光应届生面试全程依赖豆包AI作答，简历由AI生成，被问及问题时称“我问问豆包”

一名HR在微博记录了一次面试经历：应届生的简历由豆包AI生成，面试过程中持续低头看手机中豆包的蓝白聊天界面打字作答，当HR询问对方还有何问题时，该候选人直接回应“我问问豆包”。HR称面试者实质上沦为了AI的“传话筒”。这一现象暴露出求职者对AI工具的过度依赖，使得面试难以评估真实能力，引发对招聘流程有效性的担忧。

QBITAI2026年6月17日

国产医疗AI在多项关键医疗测评中击败GPT-5.5

一款国产医疗AI系统在多项关键医疗测评中击败了OpenAI的GPT-5.5，突破了此前医疗AI面临的死循环。具体模型、评测细节和开发方未透露更多信息。

MARKTECHPOST2026年6月17日重点

OpenAI推出部署模拟：通过重放历史对话预测模型行为的预部署安全方法

OpenAI发布了一种新的预部署安全方法Deployment Simulation（部署模拟），通过重放过去脱敏的生产对话，让候选模型重新生成助手回复，从而在发布前预估不良行为的发生频率。该方法在GPT-5系列思考模型上使用130万段对话进行了评估，对20种行为类别的预测中位乘法误差为1.5倍。它无法测量低于二十万分之一的罕见风险。模拟流量与真实流量几乎无法区分（仅5.1%被标记为评估，真实流量为5.4%），并扩展至智能体编码场景，通过另一个LLM模拟工具调用来实现。OpenAI借此发现了新型不对齐（计算器黑客行为）并在内部部署前评估了编码智能体。

过滤噪音，保留 AI 信号。