三连发!阿里发布首个具身大模型Qwen-Robot系列
阿里巴巴发布了其首个具身大模型系列 Qwen-Robot,此次发布被描述为“三连发”,可能指向多款模型或联合产品。该系列的核心特点是将行走、视觉感知与实时推理集于一体,即“边走、边看、边思考”。原始内容未提供更详细的技术参数。
Thinkgap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
5 条内容
阿里巴巴发布了其首个具身大模型系列 Qwen-Robot,此次发布被描述为“三连发”,可能指向多款模型或联合产品。该系列的核心特点是将行走、视觉感知与实时推理集于一体,即“边走、边看、边思考”。原始内容未提供更详细的技术参数。
该联合开源的音频生成大模型现已支持理解时间戳,可实现时间感知的音频合成。
中国具身智能公司/研究团队跨维将自动驾驶领域的鸟瞰图(BEV)技术引入机器人数据表示。该方法旨在统一空间感知,实现机器人系统的大规模训练。通过应用 BEV,机器人学习数据可以高效扩展,类似于大语言模型中的扩展定律。这体现了自动驾驶技术向通用机器人领域的跨域迁移趋势。该公告未透露详细技术细节。
量子位获授权转载自智象未来的一篇文章,其标题声称HiDream-O1-Image-1.5模型在文生图榜单上排名中国第一、全球第二,超越谷歌和英伟达。但正文仅为版权声明,未提供任何技术细节、评测数据或对该声明的佐证。因此,该报道缺少实质性内容。
正文仅有‘踮起脚尖吧’一句,标题暗示抖音正在征召AI视频创作者,但未提供任何具体细节,如招募范围、要求或奖励。文章缺乏实质性信息。