打破moe训练效率与性能瓶颈专题 - 今日专题

专题分类专题首页切换频道

网站地图

最新专题资讯

昇腾+鲲鹏联手上大招！华为爆改MoE训练，吞吐再飙升20%，内存省70% 2025-06-08

训练MoE足足提速70%！华为只用了3招 2025-06-08

华为上大分！昇腾+鲲鹏魔改训练算子，MoE训练吞吐再飙升20%，内存省70% 2025-06-08

MoE推理「王炸」组合：昇腾×盘古让推理性能狂飙6-8倍 2025-06-08

Pangu Ultra准万亿MoE模型:业界一流,源自昇腾原生的长稳训练 2025-06-08

还得是华为！Pangu Ultra MoE架构：不用GPU，你也可以这样训练准万亿MoE大模型

破解准万亿 MoE 模型性能瓶颈打造芯片协同的先进架构近期，盘古团队在 MoE 模型训练领域再进一步，重磅推出...RL 训练：采用迭代难例挖掘与多能力项均衡的奖励函数，并参考 GRPO 算法，提升了模型的训练效率与最终推理性能。...

2025-06-08

还得是华为!Pangu Ultra MoE架构:不用GPU,训练准万亿MoE大模型 2025-06-08

还得是华为！Pangu Ultra MoE架构：不用GPU，训练准万亿MoE大模型

破解准万亿 MoE 模型性能瓶颈打造芯片协同的先进架构近期，盘古团队在 MoE 模型训练领域再进一步，重磅推出...RL 训练：采用迭代难例挖掘与多能力项均衡的奖励函数，并参考 GRPO 算法，提升了模型的训练效率与最终推理性能。...

2025-06-08

MoE大模型迎来“原生战友”昇腾超节点重构AI基础设施_训练_通信_架构 2025-06-08

还得是华为!Pangu Ultra MoE架构:不用GPU，训练准万亿MoE大模型

破解准万亿 MoE 模型性能瓶颈打造芯片协同的先进架构近期，盘古团队在 MoE 模型训练领域再进一步，重磅推出...RL 训练：采用迭代难例挖掘与多能力项均衡的奖励函数，并参考 GRPO 算法，提升了模型的训练效率与最终推理性能。...

2025-06-08

相关专题