Google DeepMind 发布 DiffusionGemma,实现四倍速文本生成
Google DeepMind 发布了 DiffusionGemma,声称可将文本生成速度提升至原来的四倍。该博客公告仅提供了标题层面的概述,未披露技术架构细节、基准测试数据或具体用例。名称暗示该方法将扩散模型技术应用于 Gemma 系列语言模型。
Thinkgap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
4 条内容
Google DeepMind 发布了 DiffusionGemma,声称可将文本生成速度提升至原来的四倍。该博客公告仅提供了标题层面的概述,未披露技术架构细节、基准测试数据或具体用例。名称暗示该方法将扩散模型技术应用于 Gemma 系列语言模型。
Google DeepMind 发布 Gemini 3.5 Live Translate,提供接近实时的自然语音翻译功能。该功能已集成到 Google AI Studio、Google Translate 和 Google Meet 中。它能进行流畅的对话式翻译,减少机械感并降低延迟。这一集成将实时语音翻译直接带入 Google 广泛使用的沟通与开发平台。
Google DeepMind 发布了 Gemma 4 12B,这是一个 120 亿参数的开源多模态模型。该模型采用统一架构,无需独立视觉编码器即可处理文本和图像。它属于 Gemma 开源模型系列。公告强调了无编码器设计,但未提供更多性能或能力细节。
一项随机对照试验评估了Gemini的引导学习功能的有效性。结果显示,该功能显著提高了学生的参与度,并加速了学习进程。该研究在塞拉利昂进行,对其他地区的教育具有潜在影响。这表明人工智能驱动的个性化学习工具具有巨大潜力。