当前位置:首页 > Deepseek应用场景 > 正文内容

比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1

5个月前 (04-11)Deepseek应用场景307

近日,硅基流动创始人袁进辉在华为云生态大会上宣布,硅基流动联合华为云基于 CloudMatrix 384超节点昇腾云服务和高性能推理框架 SiliconLLM,用大规模专家并行最佳实践正式上线 DeepSeek-R1。

该服务在保证单用户 20 TPS水平前提下,单卡 Decode吞吐突破 1920 Tokens/s,可比肩 H100 部署性能。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署 DeepSeek-R1的模型精度与 DeepSeek官方保持一致。


其中,通过架构的全面创新,基于新型高速总线架构的 CloudMatrix超节点集群在总算力、互联带宽、内存带宽上领先业界。

此前,硅基流动在大模型云服务平台 SiliconCloud首发推出了基于昇腾云的稳定生产级 DeepSeek-V3 & R1 推理服务,并支持模型私有化集群部署,这次合作推动基于国产算力的 DeepSeek-R1推理服务持续升级。


DeepSeek风暴席卷全球,特别是以其高效、低成本的 MoE架构为应对大模型推理挑战打开了局面。不过,如果没有强大的 AI Infra 技术能力,要想部署好 DeepSeek并非易事。

DeepSeek使用了大规模专家并行(Expert Parallelism,大 EP并行)的 MoE模型架构,若采用单机部署方案,最终的性能远不如 DeepSeek官方公布的部署方案,且至少有数倍成本差距。更具挑战的是,虽然 DeepSeek公开了大 EP 并行方案,但技术难度较大,业内还没有其他团队快速复现这一部署方法。

针对这些难题,硅基流动与华为云联合攻关实现了技术突破。我们在 CloudMatrix 384超节点昇腾云服务上部署 DeepSeek-R1 时采纳了大规模专家并行方案,通过多专家负载均衡和极致通信优化,实现高吞吐及更高性能,大幅提升了用户体验。同时,我们使用昇腾高性能算子库,以及硅基流动推理加速框架 SiliconLLM在模型、机制、算子上的协同优化,实现在国产算力上,不损失模型精度的情况下,获得 DeepSeek-R1 推理效率与资源利用率的显著提升。

硅基流动与华为云的合作不仅提供坚实的全国产软硬件体系部署方案,让 DeepSeek推理服务更经济高效,也展现了 AI 生态合作的强大能量。硅基流动将继续加深与华为云的联合创新,共同提升产品体验,加速模型在更多场景落地。


“比肩 H100!硅基流动上线基于昇腾云 CloudMatrix 超节点的 DeepSeek-R1” 的相关文章

湖南电信以“云网智”助力教育新未来 中南大学DeepSeek校园体验版上线

湖南电信以“云网智”助力教育新未来 中南大学DeepSeek校园体验版上线

2月28日,中南大学正式推出“DeepSeek校园体验版”,率先部署中国电信“DeepSeek满血版”,并基于已落地的天翼云息壤算力调度平台,构建起“双擎驱动”的智慧教育体系,以云端澎湃算力赋能教学、...

润建股份:公司未与DeepSeek签署服务合作协议

润建股份:公司未与DeepSeek签署服务合作协议

2月16日,润建股份发布异动公告,公司自研“曲尺”人工智能开放平台对接和部署DeepSeek系列模型,赋能公司内部数智化转型,助力AI应用业务发展。但公司未与DeepSeek签署服务合作协议,与其未有...

DeepSeek助力省生态环境信息化及指挥调度中心项目提档升级

DeepSeek助力省生态环境信息化及指挥调度中心项目提档升级

近日,为落实副省长余建提出的加快革新、标准先行、统筹推动、注重运用、确保安全工作要求,推进DeepSeek大语言AI模型在生态环境领域落地转化,省生态环境厅一级巡视员林奇昌组织深入研究如何加快Deep...

手机影像即将进入 DeepSeek 式的拍照时刻,荣耀 400 影像力释放

手机影像即将进入 DeepSeek 式的拍照时刻,荣耀 400 影像力释放

5 月 21 日,荣耀首席影像工程师罗巍与新浪数码主编郭晓光进行对谈,全面揭晓了荣耀 400 系列影像优势。荣耀 400 系列将采用 2 亿 AI 超清主摄,通过自研 AI RAW 端侧大模型与云侧长...

快递物流行业迎来“DeepSeek时刻”,以AI重构“速度-成本”最优解

快递物流行业迎来“DeepSeek时刻”,以AI重构“速度-成本”最优解

曾几何时,AI领域信奉“大力出奇迹”,随着DeepSeek横空出世,以“四两拨千斤”的创新路径,仅以数百万美元的训练成本就实现了Chat-GPT4的同等性能,同时参数量也仅为对手的几十分之一。这就是D...

Deepseek赋能科技情报工作交流会在成都召开

Deepseek赋能科技情报工作交流会在成都召开

当前,以DeepSeek为代表的人工智能技术正以前所未有的速度重塑全球产业格局。科技情报作为决策的“千里眼”与“智囊团”,既迎来赋能升级的机遇,也面临转型突破的挑战。为了更好地应对DeepSeek带来...