跳动百科

DeepSeek第四天放出了双响炮:开源DualPipe和EPLB

洪阳绿   来源:网易

DeepSeek第四天放出了双响炮:开源DualPipe和EPLB

在DeepSeek开源周的第四天,该公司放出了两大重磅炸弹:开源DualPipe和EPLB。DualPipe是一项创新的双向管道并行算法,它实现了计算和通信的高效重叠,显著减少了训练空闲时间,提高了硬件资源利用率。这一算法在DeepSeek-V3技术报告中已有提及,并在GitHub上获得了广泛关注。

与此同时,EPLB(专家并行负载均衡器)也惊艳亮相。EPLB具有动态负载均衡、分层与全局平衡结合及流量优化的特点,能够基于混合专家(MoE)架构优化GPU间的负载均衡,减少GPU闲置,并通过调整专家分布降低节点间通信数据量,提升整体训练效率。

这两项开源项目无疑为深度学习模型的训练和推理带来了新的可能性,进一步彰显了DeepSeek在算法优化方面的实力。