当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

2个月前 (02-25)Deepseek最新资讯153

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

​快手可灵AI已全面接入DeepSeek-R1

​快手可灵AI已全面接入DeepSeek-R1

快手可灵AI已全面接入DeepSeek-R1。在视频生成、图片生成等场景下,用户可通过DeepSeek协助生成或者优化提示词。在文生视频场景下,DeepSeek灵感版还可以和此前的“灵感词库”功能联动...

安卓首家接入DeepSeek背后:看见女性力量

安卓首家接入DeepSeek背后:看见女性力量

在人类社会的历史进程中,女性的力量从来不容小觑,她们以不同的方式在各个领域诠释着自身价值。今天,我们将目光投向科技领域:中国科技部最新统计显示,我国女性科技工作者总量达4260万人,在科研人员总量中占...

有问题AI来回答 快速之外更需精准 四川多地政务服务接入DeepSeek大模型

有问题AI来回答 快速之外更需精准 四川多地政务服务接入DeepSeek大模型

“办理退休相关手续,要准备哪些材料?”3月12日,记者走进绵阳市政务服务中心,一楼大厅内一块电子屏上的数字人“绵宝”吸引不少办事群众驻足。一名群众提问后,接入DeepSeek大模型不久的“绵宝”,思索...

DeepSeek能帮我缓解焦虑吗?

DeepSeek能帮我缓解焦虑吗?

原创 程恋雯 人文清华讲坛这两年,社交媒体上已经呈现出“人均心理学家”的态势——关于抑郁和焦虑的讨论屡见不鲜,各类心理学词汇诸如“NPD”“PUA”“讨好型人格”等等被大家批量化地使用和讨论,任何话题...

文心一言:Deepseek在金融证券行业应用有哪些?

文心一言:Deepseek在金融证券行业应用有哪些?

文心一言:Deepseek在金融证券行业应用有哪些?DeepSeek在金融证券行业的应用十分广泛,主要体现在以下几个方面:一、风险管理与信用评估企业信贷风险分析:整合企业财报、舆情数据、供应链关系等信...

DeepSeek声称其“推理”模型在某些基准测试上超越OpenAI的o1

DeepSeek声称其“推理”模型在某些基准测试上超越OpenAI的o1

中国 AI 实验室 DeepSeek 发布了其所谓推理模型 DeepSeek-R1 的开源版本,声称在某些 AI 基准测试上表现与 OpenAI 的 o1 相当。R1 在 AI 开发平台 Huggin...