谷歌开源扩散语言模型 DiffusionGemma-26B-A4B-it,生成速度突破 500 tokens/秒
谷歌以 Apache 2.0 许可证发布了 diffusiongemma-26B-A4B-it 模型,该模型基于先前实验性的 Gemini Diffusion。模型已在 Hugging Face 公开,NVIDIA 通过 NIM 云 API 免费提供访问,实测生成速度超过 500 tokens/秒。一次测试中生成了 2,409 tokens 仅耗时 4.4 秒,展示了其高效的文本生成能力。