PyTorch DTensor 修复:矫正 math_ops 对单维策略的处理
PyTorch 仓库中 'ciflow/torchtitan/187383' 发布下的一个提交修复了 DTensor math_ops 模块的一个问题。该更新针对单维策略的处理。提交作者为 anshul-si。发布说明中未提供更多实现细节。
Thinkgap 信息流
页面仅读取已加工的 items 表,并以中英双语呈现。
8 条内容
PyTorch 仓库中 'ciflow/torchtitan/187383' 发布下的一个提交修复了 DTensor math_ops 模块的一个问题。该更新针对单维策略的处理。提交作者为 anshul-si。发布说明中未提供更多实现细节。
PyTorch 主干代码已为 Intel XPU 后端启用对称通信操作,使计算与通信可重叠执行,以降低 Intel 客户端 GPU 上的张量并行开销。这些对称操作旨在实现异步张量并行(async TP)。实现包括在 intel/torch-xpu-ops#2041 中完成的后端更改,以及本 PR 中启用的 Python 操作。操作正确性已通过 intel/torch-xpu-ops#3747 的测试验证,该 PR 已获多位审核者批准。
hexo-ai/sia 仓库发布了 SIA 自我改进 AI 框架。该框架旨在自动提升任意 AI 模型或智能体在指定基准任务上的表现,无需人工调参或重新训练。项目已开源,但简介未透露具体实现细节。
PyTorch 的 DTensor 组件更新了操作注册系统。变更前,有 158 个直接 op_strategy 注册和 1013 个 single_dim_strategy 注册,总计 1164 个已注册操作。迁移后,op_strategy 降至 114 个,single_dim_strategy 增至 1068 个,总计 1176 个。这相当于将 44 个 op_strategy 条目重新分配至统一的单维度策略框架,并净增 12 个新操作。该重构简化了 DTensor 操作注册的维护。测试通过 pytest 在 test/distributed/tensor/test_tensor_ops.py 中进行。
该仓库提供用于医疗AI应用的开源工具。旨在使医疗AI模型的访问民主化。项目包括模型训练和部署的资源。适合医疗领域的研究人员和开发者。
该发布说明记录了一项提交,将分解后的GELU操作重新融合回原生的CUTLASS GELU实现中。此更改是PyTorch的inductor和cutlass后端的一部分。旨在通过减少分解带来的开销来提升性能。这一更新可能会提高使用GELU激活函数的模型的效率。