Google DeepMind 发布 DiffusionGemma,实现四倍速文本生成
Google DeepMind 发布了 DiffusionGemma,声称可将文本生成速度提升至原来的四倍。该博客公告仅提供了标题层面的概述,未披露技术架构细节、基准测试数据或具体用例。名称暗示该方法将扩散模型技术应用于 Gemma 系列语言模型。
Thinkgap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
2 条内容
Google DeepMind 发布了 DiffusionGemma,声称可将文本生成速度提升至原来的四倍。该博客公告仅提供了标题层面的概述,未披露技术架构细节、基准测试数据或具体用例。名称暗示该方法将扩散模型技术应用于 Gemma 系列语言模型。
Google DeepMind 发布了 Gemma 4 12B,这是一个 120 亿参数的开源多模态模型。该模型采用统一架构,无需独立视觉编码器即可处理文本和图像。它属于 Gemma 开源模型系列。公告强调了无编码器设计,但未提供更多性能或能力细节。