当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

7个月前 (02-25)Deepseek最新资讯390

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

武汉经开区上线DeepSeek版智算中心

武汉经开区上线DeepSeek版智算中心

湖北日报客户端讯( 通讯员郑奇悦、鲁仲月)国产开源大模型DeepSeek火速“出圈”,成为科技焦点。2月14日,记者从中国电子云武汉可信智算中心获悉,该中心已“牵手”DeepSeek,在武汉经开区算力...

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

深度解析:DeepSeek揭示7大时间浪费行为,助你高效管理时间

时间是人生最宝贵的资源,浪费时间等同于慢性自杀。DeepSeek通过大数据分析,揭示了生活中最严重的7大时间杀手,帮助我们深刻反思,重新掌控生活节奏。第一,垃圾娱乐如游戏和短视频虽然短暂放松,但长期沉...

DeepSeek问世,加快联想全栈AI战略落地

DeepSeek问世,加快联想全栈AI战略落地

3月4日,在2025年世界移动通信大会期间,世界互联网大会国际组织在西班牙巴塞罗那举办以“打造融合、普惠、绿色的AI算力新生态”为主题的“AI算力发展”专题论坛。联想集团执行副总裁刘军表示,联想已经形...

当湖北移动遇见DeepSeek,荆楚大地掀起智能新浪潮

当湖北移动遇见DeepSeek,荆楚大地掀起智能新浪潮

"九省通衢"的湖北,正在数智化浪潮中全速前进!当湖北移动的优质网络遇上DeepSeek的前沿AI,会擦出怎样的火花?今天,带您体验「5G+AI」的双重惊喜!01应用场景1政务+AI...

神州信息引入国产开源大模型DeepSeek

神州信息引入国产开源大模型DeepSeek

36氪获悉,神州信息最新引入国产开源大模型DeepSeek,实现对全栈金融解决方案的智能化迭代升级,通过低成本、高安全的私域环境部署,帮助银行客户快速获得大模型的各项能力,全面加速银行智能化发展。通过...

DeepSeek-Prover-V2:AI 数学推理新王者,88.9% 通过率设新标杆

DeepSeek-Prover-V2:AI 数学推理新王者,88.9% 通过率设新标杆

IT之家 5 月 1 日消息,深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,...